1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > python网络爬虫程序_Python写的网络爬虫程序(很简单)

python网络爬虫程序_Python写的网络爬虫程序(很简单)

时间:2023-05-11 00:16:59

相关推荐

python网络爬虫程序_Python写的网络爬虫程序(很简单)

Python写的网络爬虫程序(很简单)

这是我的一位同学传给我的一个小的网页爬虫程序,觉得挺有意思的,和大家分享一下。不过有一点需要注意,要用python2.3,如果用python3.4会有些问题出现。

python程序如下:

import re,urllib

strTxt=""

x=1

ff=open("wangzhi.txt","r")

for line in ff.readlines():

f=open(str(x)+".txt","w+")

print line

n=re.findall(r"

(.*?)<\/p>",urllib.urlopen(line).read(),re.M)

for i in n:

if len(i)!=0:

i=i.replace("","")

i= i.replace("","")

i = i.replace("","")

strTxt = strTxt + i

strTxt = re.sub(r"", r"", strTxt)

strTxt=re.sub(r"",r"",strTxt)

strTxt=re.sub(r"(.*?)",r"", strTxt)

strTxt = re.sub(r"<\/[Aa]>", r"", strTxt)

#print strTxt

f.write(strTxt)

strTxt=""

f.close

x=x+1

ff.close()

wangzhi.txt的内容如下:

/14/1126/22/AC0TVK4E00052UUC.html

/14/1126/22/AC0TGD4700052UUC.html

/14/1126/22/AC0TAHNK00052UUC.html

结果分析:

运行程序,有3个输出文件,分别是3个URL地址对应的网页的内容。

原文地址:/sxhlovehmm/article/details/41553705

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。