1.访问及关闭页面
通过以下代码即可访问网站,相当于模拟人打开了一个浏览器,然后访问指定网址。from selenium import webdriverbrowser = webdriver.Chrome()browser.get('/')
第1行代码导入Selenium库中的webdriver功能,第2行代码声明要模拟的浏览器是谷歌浏览器,第3行代码使用browser.get()函数访问指定网址。在上述代码最后加上如下代码,就能关闭模拟浏览器。
2.获取网页源代码
使用模拟浏览器打开指定网址后,通过如下代码即可获得模拟浏览器中经过动态渲染的网页源代码:data = browser.page_source
下面来试一试获取用Requests库未能获取成功的新浪财经股票信息,代码如下:
from selenium import webdriverbrowser = webdriver.Chrome()browser.get('/realstock/company/sh000001/nc.shtml')data = browser.page_source #核心代码print(data)
在pycharm中运行上述代码,在运行结果输出去可以搜索到上证指数数值,如下图所示,说明网页源代码获取成功。