推荐专题：

1200字范文 > node中使用superagent cheerio进行爬虫

node中使用superagent cheerio进行爬虫

时间：2024-07-17 15:58:57

相关推荐

node中使用superagent cheerio进行爬虫

想必很多人都有这样的一个幻想，我可不可以啥也不用干，就获得别人的劳动成果呢？比如，我想做一个类似与豆瓣这样的app来练手，但是我有没有数据进行支撑，这时候我就想，能不能把豆瓣上的内容爬下来，放到我自己的app里面进行显示呢？

哈哈大家都这样！

ok，立马来开干。

首先我们创建一个express应用

express

接下来用vscode进行打开，并且安装以下插件

npm install --save cheerio superagent

然后打开route下面的index.js文件，加入以下代码，执行就可以啦！

var express = require('express');var router = express.Router();var cheerio = require('cheerio');var superagent = require('superagent');const fs = require("fs");router.get('/catch', function (req, res, next) {// 用 superagent 去抓取网站的内容superagent.get('/yundong/index_4.html').end(function (err, sres) {// 常规的错误处理if (err) {return next(err);}// sres.text 里面存储着网页的 html 内容，将它传给 cheerio.load 之后// 就可以得到一个实现了 jquery 接口的变量，我们习惯性地将它命名为 `$`// 剩下就都是 jquery 的内容了var $ = cheerio.load(sres.text);var items = [];$('.list ul li').each(function (idx, element) {var $element = $(element);let divimg = $element.find('.img a')let href = '/' + divimg.attr('href')let title = divimg.attr('title')let img = divimg.find('img').attr('src')items.push({title: title,href: href,img:img});});res.send(items);//读取文件先把它读到缓存，然后加上新爬取的数据，再一并插入到json文件中fs.readFile("article.json", 'utf-8', function(err, data) {if (err) {} else {let olddata = JSON.parse(data)if(olddata.length>0){olddata = olddata.concat(items)}else{olddata = items}fs.writeFile("article.json", JSON.stringify(olddata), "utf-8", (error) => {//监听错误，如正常输出，则打印nullif (error == null) {console.log("恭喜您，数据爬取成功!)");}});}});});});module.exports = router;

这里面，你需要注意的是，你要研究你爬取网站所需要部分内容的格式。

就是一开始你获取到整个网页的内容，然后你把你需要的列表部分的li读取出来，然后遍历获取它的属性，就可以了。具体查看cheerio 官网 /，里面有更详细的介绍

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

nodejs爬虫与php爬虫 nodejs爬虫初试superagent和cheerio

2021-02-24

nodejs爬虫与php爬虫利用nodejs爬虫使用superagent和cheerio的方法

2019-02-07

Nodejs实战之二（使用 superagent 与 cheerio 完成简单爬虫）

2020-08-11

记第一次尝试使用node进行爬虫的经历（使用cheerio模块）

2021-02-28

最近发布

Computer(计算机)1200字英语作文

2024-07-30

花开在心间：探寻内心世界的美好篇

2024-07-30

回忆青葱岁月：我喜欢的那个人

2024-07-30

关于简单的幸福的名言1200字

2024-07-30

小狗的自述1200字作文素材大全

2024-07-30

广西桂林市中考满分作文-为了地球的明天1200字作文素材大全

2024-07-30

是我的好朋友1200字作文素材大全

2024-07-30

寻桂1200字作文

2024-07-30

坚持是一棵会开花的树作文1200字

2024-07-30

精编我心中的国防论文1200字(实用八篇)

2024-07-30

推荐专题

创业之路1200字作文照亮我生命的人1200字青马总结1200字中国特色齐点赞1200字妈妈的皱纹作文1200字毕业去向分析1200字猫优秀作文1200字开头弘扬英雄精神1200字我心中的警校1200字准备年货的心得1200字教案1200字左右好评中国1200字双减政策1200字谈做人1200字微语简报1200字