主要参考两篇文章总结下这几天所学,小白入门O(∩_∩)O哈哈~ 不喜勿喷
z/qq_40309183/article/details/80630910
/stormdony/article/details/79828842
目的: 为了实现提取中国诗词网的诗词的标的和内容
工具:beautifulsoup 个人感觉他就是为了替代正则表达式
简单总结下正则表达式:
text=“”“
12o=所得税的所得税法水电费水电费是发送到发送到发顺丰.jpg
”“”
r=r12o(.*?.jpg) #关于.*? 叫啥贪婪匹配好像
# 还可以compile下reg=pile(r)
re.findall(r,text)
print(re.findall(r,text))
前面说了,然后后面又了解了下beautifulsoup,这里主要用这个东西
//