推荐专题：

1200字范文 > Node.js抓取网页信息（cheerio网络爬虫）

Node.js抓取网页信息（cheerio网络爬虫）

时间：2019-03-27 01:40:58

相关推荐

Node.js抓取网页信息（cheerio网络爬虫）

Node.js的学习中，可用于抓取其他网站的模块是【cheerio】，这个模块并不是node的内置模块，所以首先我们需要先安装一下：

安装对应模块

安装命令：npm install cheerio

明确抓取对象

cheerio安装完毕后，我们就可以进行抓取数据了，我们先来明确一下，需要抓取的内容是一家甜点的网站，需要抓取的代码如下图：

如图所示，需要抓取的内容是图中标注出来的img的图片，没错就是下方那些卡哇伊的蛋糕，哇哇哇~好想吃，而且名字也取得好好听好好听！！！

开始抓取

好了，我们明确了抓取的内容，现在我们就开始进行抓取，在这之前，需要知晓的是，Cheerio 包括了 jQuery 核心的子集，也就是说在操作cheerio时，使用JQ的相关语法是都可以的，是不是很酷炫啊，哈哈哈，开始上代码：

var http = require("http");var cheerio = require("cheerio");//准备抓取的网站链接var dataUrl = "/shop/110/index.html#mainer_top";http.get(dataUrl,function(res){var str = "";//绑定方法，获取网页数据res.on("data",function(chunk){str += chunk;})//数据获取完毕res.on("end",function(){//调用下方的函数，得到返回值，即是我们想要的img的srcvar data = getData(str);console.log(data);})})//根据得到的数据，处理得到自己想要的function getData(str){//沿用JQuery风格，定义$var $ = cheerio.load(str);//获取的数据数组var arr = $(".pro_box a:nth-child(1) img");var dataTemp = [];//遍历得到数据的src，并放入以上定义的数组中arr.each(function(k,v){var src = $(V).attr("src");dataTemp.push(src);})//返回出去return dataTemp;}

得到抓取结果

得到的图片链接，打印如下图：

为了验证的信息的准确性，也为了博文页面不那么吃藕，特点击抓取到的第一个链接的可爱的甜点图附上来：

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

在Node.js中使用cheerio制作简单的网页爬虫（详细教程）

2023-08-18

Node.js抓取网页图片

2023-04-08

Node.js实现的简易网页抓取功能示例【node.js】

2024-05-31

Node.js抓取中文网页乱码问题和解决方法【node.js】

2019-03-18

最近发布

Computer(计算机)1200字英语作文

2024-07-30

花开在心间：探寻内心世界的美好篇

2024-07-30

回忆青葱岁月：我喜欢的那个人

2024-07-30

关于简单的幸福的名言1200字

2024-07-30

小狗的自述1200字作文素材大全

2024-07-30

广西桂林市中考满分作文-为了地球的明天1200字作文素材大全

2024-07-30

是我的好朋友1200字作文素材大全

2024-07-30

寻桂1200字作文

2024-07-30

坚持是一棵会开花的树作文1200字

2024-07-30

精编我心中的国防论文1200字(实用八篇)

2024-07-30

推荐专题

读后感1200字法律伴我成长1200字无问东西1200字影评义1200字破防瞬间1200字小故事1200字大学体育规划1200字作文守望1200字在家劳动报告1200字厉害了我的国观后感1200字红心向党1200字作文做个善读者1200字历险记1200字渲染1200字小说远离危房心得1200字