1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 在Node.js中使用cheerio制作简单的网页爬虫(详细教程)

在Node.js中使用cheerio制作简单的网页爬虫(详细教程)

时间:2022-11-27 03:26:30

相关推荐

在Node.js中使用cheerio制作简单的网页爬虫(详细教程)

web前端|js教程

javascript,Node.js,cheerio

web前端-js教程

本篇文章主要介绍了Node.js 利用cheerio制作简单的网页爬虫示例,现在分享给大家,也给大家做个参考。

网络工作室网页源码,ubuntu终端背景调整,tomcat启动执行两次,r语言爬虫算法,上海php工具开发价格,芜湖seo费用lzw

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例,分享给大家,具有如下:

可视化布局系统 源码,ubuntu 设置时钟同步,替代tomcat 绿色版,爬虫防追踪,php8.0.2,seo站长工具有哪些关键词lzw

1. 目标

匿名吐槽 源码,vscode调试框怎么用,sogou ubuntu,外网访问本地tomcat,sqlite 导出,3g网页设计,access 数据库的优势,阿里云服务器ftp配置,颜色提取插件,前端框架boos,地铁爬虫多,php 字符串搜索,淘客建站seo,springboot坐标作用,标题链接 织梦标签,微信公众号模板网站,网页自动勾选,下载index.html模板,网站后台管理系统安装,页面悬浮按钮,仓库管理系统安卓源代码,微信小程序-百思不得姐lzw

完成对网站的标题信息获取

将获取到的信息输出在一个新文件

工具: cheerio,使用npm下载npm install cheerio

cheerio的API使用方法和jQuery的使用方法基本一致

如果熟练使用jQuery,那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题,将获取到的标题列表编号,最终输出到pageTitle.txt文件里

const https = require(https);const fs = require(fs);const cheerio = require(cheerio);const url = /;https.get(url, (res) => { let html = \; res.on(data, (data) => { html += data; }); res.on(end, () => { getPageTitle(html); });}).on(error, () => { console.log(获取网页信息错误);});function getPageTitle(html) { const $ = cheerio.load(html); let chapters = $(.news__item-title); let data = []; let index = 0; let fileName = pageTitle.txt; for (let i = 0; i { if (err) {console.log(fs文件系统创建新文件失败, err); } console.log(`已成功将获取到的标题放入新文件${fileName}文件中`) })}

上面是我整理给大家的,希望今后会对大家有帮助。

相关文章:

聊聊JS动画库 Velocity.js的使用

vue toggle做一个点击切换class(实例讲解)

Vue2.0 给Tab标签页和页面切换过渡添加样式的方法

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。