1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 直播网站LiveTV Mining 爬虫抓取数据 python3+scrapy

直播网站LiveTV Mining 爬虫抓取数据 python3+scrapy

时间:2022-07-08 19:29:22

相关推荐

直播网站LiveTV Mining 爬虫抓取数据 python3+scrapy

LiveTV Mining

介绍

项目实现爬虫数据挖掘/分析等功能。目前主要是扫描直播站点收集数据,后续会开发相关数据分析模块。

架构采用前后端分离,通过RESTFul API通信。前端Vue+Webpack,后端Flask。

文件结构分为三部分,每个部分可以单独提供服务:

frontend 前端代码,使用Vue+Webpack开发管理。server 后端RESTFul服务,使用Flask搭建提供API。crawler 爬虫服务,使用框架scrapy对直播站点爬取数据。

使用中有问题或更新建议,欢迎提issue或用以下联系方式跟我交流:

邮件: zwtzjd@QQ: 3084582097

历程

-05-10 开发新爬虫火猫。-04-24 全民收集开发完成。-04-22 熊猫收集开发完成。-04-20 斗鱼收集开发完成。-04-15 准备开发收集站点房间:关注数、公告、上一次开播时间、打赏值、开播当天人气中位数。-04-01 变更LICENSE:GPL -> Apache。-03-20 开发新爬虫全民。-03-03 开发新爬虫龙珠。-03-01 恢复爬虫熊猫、战旗。-01-07 完成全部功能迁移,前后端分离完成。-12-24 引入vuex进行state和权限管理。-12-15 引入vue-resource,主模块(Main)完成分离。-11-25 研究流行前端框架和开发方式,确定使用webpack开发。-11-20 重新设计结构,进行前后端分离。-11-01 修正改造搜索功能,需要登录后才能使用。-10-29 完成渲染初步改造,已实现调用REST API进行访问读取。爬虫运行间隔20分钟。-10-20 引入Vue.js,改造前端渲染方式,减轻服务器压力。开发完成简单 Flask-Vue 插件。-10-15 引入Scrapy重构爬虫,精简爬虫步骤。仅保留斗鱼、BiliBli爬虫。
-08-15 v1.0版本开发结束,代码保存在分支v1.0

感激

感谢以下项目的支持,排名不分先后

Flask BootstrapSeleniumCelery

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。