1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > C语言使用socket获取网页内容

C语言使用socket获取网页内容

时间:2022-11-12 00:55:47

相关推荐

C语言使用socket获取网页内容

本文讨论的是使用C语言使用socket获取网页内容

首先需要添加代码

#pragma comment(lib, "ws2_32.lib")

以下是获取网页内容的函数。函数参数为网页地址,字符串类型,如“”。获取到的网页内容保存在recieved.txt文件中。

void ReadPage(char* host)

{

WSADATA data;

//winsock版本2.2

int err = WSAStartup(MAKEWORD(2, 2), &data);

if (err)

return ;

//用域名获取对方主机名

struct hostent *h = gethostbyname(host);

if (h == NULL)

return ;

//IPV4

if (h->h_addrtype != AF_INET)

return ;

struct in_addr ina;

//解析IP

memmove(&ina, h->h_addr, 4);

LPSTR ipstr = inet_ntoa(ina);

//Socket封装

struct sockaddr_in si;

si.sin_family = AF_INET;

si.sin_port = htons(80);

si.sin_addr.S_un.S_addr = inet_addr(ipstr);

int sock = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);

connect(sock, (SOCKADDR*)&si, sizeof(si));

if (sock == -1 || sock == -2)

return ;

//发送请求

char request[1024] = "GET /?st=1 HTTP/1.1\r\nHost:";

strcat(request, host);

strcat(request, "\r\nConnection:Close\r\n\r\n");

int ret = send(sock, request, strlen(request), 0);

//获取网页内容

FILE *f = fopen("recieved.txt", "w");

int isstart = 0;

while (ret > 0)

{

const int bufsize = 1024;

char* buf = (char*)calloc(bufsize, 1);

ret = recv(sock, buf, bufsize - 1, 0);

fprintf(f, "%s", buf);

free(buf);

}

fclose(f);

closesocket(sock);

WSACleanup();

printf("读取网页内容成功,已保存在recieved.txt中");

return ;

}

注:本函数只适用于IPV4的http请求。

保存的txt文件用记事本打开时,请将编码改为utf8,而不是默认的ASCII,否则会出现中文乱码。

调用这个函数的一个例子:

ReadPage("")

在获取了网页信息后,可以使用C++的Regex进行分析。

文中所涉及的所有代码均在Visual Studio 中通过。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。