1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 动态爬取猫眼每年票房数前100的电影

动态爬取猫眼每年票房数前100的电影

时间:2022-06-18 21:46:12

相关推荐

动态爬取猫眼每年票房数前100的电影

依次进入每年的票房数页面,自动获取票房数前100的电影的排名,电影名,总票房数和平均票价。

根据元素的定位,可以看到其变化的规律,因此,建立循环,将获得的数据导入到csv文件中。

from selenium import webdriverimport numpy as npimport timeimport pandas as pddriver = webdriver.Firefox()driver.get("/rankings/year")time.sleep(1)for i in range(2,13): #依次进入每一年web='//*[@id="tab-year"]/ul/li[{}]'.format(i)driver.find_element_by_xpath(web).click()time.sleep(1)lis=[]txt=[]for j in range(1,101):xpath='//*[@id="ranks-list"]/ul[{}]'.format(j)context=driver.find_element_by_xpath(xpath) #得到相应年的数据contexts=context.textlis.append(contexts)for m in lis:txt.append(m.split("\n"))df= pd.DataFrame(txt, columns=['排名', '电影名', '上映时间','总票房数','平均票价','场均人次']) column=['上映时间','场均人次']df = df.drop(columns=column, axis=1) filename='{}年电影票房.csv'.format(-i+2)df.to_csv(filename, sep=',', header=True, index=False,encoding='utf-8-sig')

结果展示:

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。