https://space.bilibili.com/523606542
Python学习交流群:1039649593
Selenium
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,就像玩游戏用的按键精灵,可以按指定的命令自动 *** 作。
Selenium测试工具直接 *** 控浏览器中,就像真正的用户在 *** 作一样。Selenium可以根据的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生等。
1. Selenium工作原理
如图所示,通过Python来控制Selenium,然后让Selenium 控制浏览器, *** 纵浏览器,这样就实现了使用Python间接的 *** 控浏览器。
1.1 Selenium配置
Selenium支持多种浏览器,最常见的就是火狐和谷歌浏览器。首先在电脑上下载浏览器,浏览器版本不宜过新。
火狐:截图如下
谷歌:截图如下
1.2 浏览器驱动
Selenium具体怎么就能 *** 纵浏览器呢?这要归功于浏览器驱动,Selenium可以通过API接口实现和浏览器驱动的交互,进而实现和浏览器的交互。所以要配置浏览器驱动。
火狐驱动下载地址:
http://npm.taobao.org/mirrors/geckodriver/
谷歌驱动下载地址:
https://npm.taobao.org/mirrors/Chromedriver/
配置浏览器驱动:
将下载好的浏览器驱动解压,将解压出的exe文件放到Python的安装目录下,也就是和python.exe同目录即可。
1.3 使用Selenium
安装selenium模块,python借助这个模块驱动浏览器,使用如下命令行安装这个模块即可
pip install selenium
2 快速入门
# 打开百度首页from selenium import webdriverdriver = webdriver.Chrome()url = 'https : / /www.baIDu . com/ 'driver.get(url)#打开get就类似与在浏览器地址栏里面放入网址driver.get(url)#退出浏览器driver.quit()
总结
以上是内存溢出为你收集整理的Python爬虫基础讲解(十三):初探selenium全部内容,希望文章能够帮你解决Python爬虫基础讲解(十三):初探selenium所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)