pthon爬虫初学selenium

pthon爬虫初学selenium,第1张

Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动 *** 作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。


Selenium 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。


Selenium 自己不带浏览器,不支持浏览器的功能,它需要与第三方浏览器结合在一起才能使用。


但是我们有时候需要让它内嵌在代码中运行,所以我们可以用一个叫 PhantomJS 的工具代替真实的浏览器。


这是官方的回答,我的理解就是

# 能不能让我的程序连接到浏览器 让浏览器来完成各种复杂 *** 作,我们只接受结果
# selenium 自动化工具
# 可以:打开浏览器,然后像人一样去 *** 作浏览器
# 程序可以从selenium中直接提取网页上的各种信息

首先我们下载selenium 感觉搭建selenium环境有点麻烦

我用的环境是 python3.10

pip install selenium  

下载完后,我们需要一个浏览器驱动 我用的是谷歌浏览器 先检查主机浏览器版本

 驱动下载地址:http://chromedriver.storage.googleapis.com/index.html

 

 

 

 然后把这个执行文件放到你python文件下 如果你不知道你的路径你可以在pycharm运行看看

c盘那个就是我们python路径,只需要放进去,因为都是打通路径的

然后测试一下

# 让selenium 启动谷歌浏览器
from  selenium import webdriver

# 1.创造浏览器对象
web = webdriver.Chrome()

# 2.打开一个网站
web.get("http://www.baidu.com")

print(web.title)

 然后程序自动给我们打开浏览器

 

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/580483.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-11
下一篇 2022-04-11

发表评论

登录后才能评论

评论列表(0条)

保存