1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > python网络爬虫(1)--抓取图片

python网络爬虫(1)--抓取图片

时间:2019-06-07 20:18:53

相关推荐

python网络爬虫(1)--抓取图片

所谓网络爬虫就是从特定的网页中获取你想要的东西,更确切的说,是从网页源代码中筛选你想要的东西。

本文将用比较简单的方法从网页中下载一些图片。

主要工具模块有:urllib.request 和html.parser 是的,真如你所见,不用正则表达式

步骤很简单:

1.获取网页源代码

2.从源代码中提取需要的信息(这里指图片的下载链接)

3.将图片链接打开并下载到目录。

抓的网址为:/iconsearch/book/ (下载图标)

代码如下:

1.获取网页源代码

# getimage.pyimport urllib.requestfrom html.parser import HTMLParserurl = /iconsearch/book/# pretend as a browserheaders = {User-Agent: Mozilla/5.0 (Windows NT 6.1;\WOW64; rv:23.0) Gecko/0101 Firefox/23.0 }url2 = urllib.request.Request(url, headers=headers)# get the source code form urlfb = urllib.request.urlopen(url2)souCode = fb.read().decode(

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。