web前端|js教程
javascript,Node.js,cheerio
web前端-js教程
本篇文章主要介绍了Node.js 利用cheerio制作简单的网页爬虫示例,现在分享给大家,也给大家做个参考。
网络工作室网页源码,ubuntu终端背景调整,tomcat启动执行两次,r语言爬虫算法,上海php工具开发价格,芜湖seo费用lzw
本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例,分享给大家,具有如下:
可视化布局系统 源码,ubuntu 设置时钟同步,替代tomcat 绿色版,爬虫防追踪,php8.0.2,seo站长工具有哪些关键词lzw
1. 目标
匿名吐槽 源码,vscode调试框怎么用,sogou ubuntu,外网访问本地tomcat,sqlite 导出,3g网页设计,access 数据库的优势,阿里云服务器ftp配置,颜色提取插件,前端框架boos,地铁爬虫多,php 字符串搜索,淘客建站seo,springboot坐标作用,标题链接 织梦标签,微信公众号模板网站,网页自动勾选,下载index.html模板,网站后台管理系统安装,页面悬浮按钮,仓库管理系统安卓源代码,微信小程序-百思不得姐lzw
完成对网站的标题信息获取
将获取到的信息输出在一个新文件
工具: cheerio,使用npm下载npm install cheerio
cheerio的API使用方法和jQuery的使用方法基本一致
如果熟练使用jQuery,那么cheerio将会很快上手
2. 代码部分
介绍: 获取segment fault页面的列表标题,将获取到的标题列表编号,最终输出到pageTitle.txt文件里
const https = require(https);const fs = require(fs);const cheerio = require(cheerio);const url = /;https.get(url, (res) => { let html = \; res.on(data, (data) => { html += data; }); res.on(end, () => { getPageTitle(html); });}).on(error, () => { console.log(获取网页信息错误);});function getPageTitle(html) { const $ = cheerio.load(html); let chapters = $(.news__item-title); let data = []; let index = 0; let fileName = pageTitle.txt; for (let i = 0; i { if (err) {console.log(fs文件系统创建新文件失败, err); } console.log(`已成功将获取到的标题放入新文件${fileName}文件中`) })}
上面是我整理给大家的,希望今后会对大家有帮助。
相关文章:
聊聊JS动画库 Velocity.js的使用
vue toggle做一个点击切换class(实例讲解)
Vue2.0 给Tab标签页和页面切换过渡添加样式的方法