Selenium入门详细教程_python

Selenium + python学习记录

文章目录

Selenium + python学习记录
前言
一、selenium的安装
二、webdriver驱动浏览器
- 0. 安装浏览器驱动
- 1.使用selenium+python打开百度搜索谷歌
- 2. selenium定位元素的16种方法
- 3. 获取日志
- 4. 窗口 *** 作
- 5. 设置延时
- 6. 关闭窗口
- 7. 打印网页源码
- 8. 屏幕截图
- 9. 网页前进后退刷新
- 10. 执行JS代码
- 11. cookies *** 作
- 12. 获取标题内容，获取当前浏览器名，全局超时时间
- 13. 元素 *** 作
- 14. 鼠标键盘事件
- 15. 选项 *** 作
- 16. 窗口切换、表单切换
三、Alert
1.浏览器d出框
- 2. 新窗口d出框
- 3. 人为d窗
四、判断
五、选择
六、显式等待和隐式等待

前言

学python，做自动化测试，selenium是我们必然要学习的一个自动化测试框架。

一、selenium的安装

因为我们使用的是python+selenium的测试结构，我们这里就直接使用python来安装selenium，因为这里我们可以理解selenium为python的一个库。

pip install selenium

我们有python环境的可以直接使用上面的命令安装。

二、webdriver驱动浏览器 0. 安装浏览器驱动

Firefox浏览器驱动：Firfox
Chrome浏览器驱动：Chorme
IE 浏览器驱动：IE
Edge 浏览器驱动：Edge
PhantomJS 浏览器驱动：PhantomJS
Opera 浏览器驱动：Opera
safari浏览器驱动使用链接：link

将 chromedriver.exe 保存到任意位置，并把当前路径保存到环境变量中（我的电脑>>右键属性>>高级系统设置>>高级>>环境变量>>系统变量>>Path），添加的时候要注意不要把 path 变量给覆盖了，如果覆盖了千万别关机，然后百度。添加成功后使用下面代码进行测试。

1.使用selenium+python打开百度搜索谷歌

from selenium import webdriver 
#导入webdriver,我们通过这个驱动可以直接打开我们电脑的谷歌浏览器，不仅是谷歌浏览器，selenium支持的浏览器还有很多
import time

webdriver = webdriver.Chrome()#除谷歌浏览器外，还支持IE,火狐，safari,基本上主流的浏览器都支持
#此处是实例化一个谷歌浏览器，运行后，电脑就会打开谷歌浏览器
webdriver.get("http://www.baidu.com")#打开指定网站
webdriver.find_element_by_id('kw').click()
#这里是通过ID来定位百度的搜索框，我们要确认ID在当前网页上是唯一的
#百度源码：
webdriver.find_element_by_id('kw').send_keys("google")
#定位到了输入框，我们输入我们想要搜索的信息，这里是google
webdriver.find_element_by_id('su').click()
#也是通过id定位元素，源码：
time.sleep(2)
webdriver.find_element_by_link_text(u'Google').click()
#定位链接文本，文本为Google,并且是附带链接的文本
webdriver.switch_to.window(webdriver.window_handles[1])
time.sleep(10)
webdriver.close()

我们来逐行解释这些代码。

2. selenium定位元素的16种方法

webdriver.find_element                         #通过指定方法查找指定的一个元素(需指定两个参数)
webdriver.find_element_by_class_name           #通过Class name查找指定的一个元素
webdriver.find_element_by_css_selector         #通过CSS选择器查找指定的一个元素
webdriver.find_element_by_id                   #通过ID查找指定的一个元素
webdriver.find_element_by_link_text            #通过链接文本获取指定的一个超链接(精确匹配)
webdriver.find_element_by_name                 #通过Name查找指定的一个元素
webdriver.find_element_by_partial_link_text    #通过链接文本获取指定的一个超链接(模糊匹配)
webdriver.find_element_by_tag_name             #通过标签名查找指定的一个元素
webdriver.find_element_by_xpath                #通过Xpath语法来指定的一个元素
webdriver.find_elements                        #通过指定方法查找所有元素(需指定两个参数)
webdriver.find_elements_by_class_name          #通过Class name查找所有元素
webdriver.find_elements_by_css_selector        #通过CSS选择器查找所有元素
webdriver.find_elements_by_id                  #通过ID查找所有元素
webdriver.find_elements_by_link_text           #通过链接文本获取所有超链接(精确匹配)
webdriver.find_elements_by_name                #通过Name查找所有元素
webdriver.find_elements_by_partial_link_text   #通过链接文本获取所有超链接(模糊匹配)
webdriver.find_elements_by_tag_name            #通过标签名查找所有元素
webdriver.find_elements_by_xpath               #通过Xpath语法来查找所有元素

我们通过网页id定位元素就有三种方法

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

webdriver = webdriver.Chrome()
webdriver.get("http://www.baidu.com")

webdriver.find_element_by_id('kw')
webdriver.find_element(By.ID,'kw')
webdriver.find_elements_by_id('kw')[0]

3. 获取日志

c = webdriver.Chrome()
c.log_types  #获取当前日志类型
c.get_log('browser')#浏览器 *** 作日志
c.get_log('driver') #设备日志
c.get_log('client') #客户端日志
c.get_log('server') #服务端日志

4. 窗口 *** 作

c.maximize_window()#最大化
c.fullscreen_window() #全屏
c.minimize_window() #最小化
c.get_window_position() #获取窗口的坐标
c.get_window_rect()#获取窗口的大小和坐标
c.get_window_size()#获取窗口的大小
c.set_window_position(100,200)#设置窗口的坐标
c.set_window_rect(100,200,32,50)    #设置窗口的大小和坐标
c.set_window_size(400,600)#设置窗口的大小
c.current_window_handle   #返回当前窗口的句柄
c.window_handles         #返回当前会话中的所有窗口的句柄

5. 设置延时

c.set_script_timeout(5) #设置脚本延时五秒后执行
c.set_page_load_timeout(5)#设置页面读取时间延时五秒

6. 关闭窗口

c.close() #关闭当前标签页
c.quit() #关闭浏览器并关闭驱动

7. 打印网页源码

c.page_source

8. 屏幕截图

c.save_screenshot('1.png')#截图，只支持PNG格式
c.get_screenshot_as_png() #获取当前窗口的截图作为二进制数据
c.get_screenshot_as_base64() #获取当前窗口的截图作为base64编码的字符串

9. 网页前进后退刷新

c.forward() #前进
c.back()  #后退
c.refresh()#刷新

10. 执行JS代码

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.get('https://www.baidu.com')
kw1=c.find_element(By.ID,'kw')
c.execute_script("alert('hello')")
time.sleep(3)
c.quit()

11. cookies *** 作

c.get_cookie('BAIDUID') #获取指定键的Cookies
c.get_cookies()         #获取所有的Cookies
for y in c.get_cookies():
   x=y
   if x.get('expiry'):
       x.pop('expiry')     
   c.add_cookie(x) #添加Cookies  
c.delete_cookie('BAIDUID') #删除指定键的Cookies内容
c.delete_all_cookies() #删除所有cookies

12. 获取标题内容，获取当前浏览器名，全局超时时间

#11.获取标题内容
c.title
#12.获取当前浏览器名
c.name
#13.全局超时时间
c.implicitly_wait(5)

13. 元素 *** 作

我们在定位了网页中的元素，定位后，对我们找到的元素进行二次 *** 作，不仅可以再次选择子元素还可以进行其它 *** 作。

kw1.clear()        #清除元素的值
kw1.click()        #点击元素
kw1.id             #Selenium所使用的内部ID
kw1.get_property('background') #获取元素的属性的值
kw1.get_attribute('id') #获取元素的属性的值
kw1.location       #不滚动获取元素的坐标
kw1.location_once_scrolled_into_view  #不滚动且底部对齐并获取元素的坐标
kw1.parent         #父元素
kw1.send_keys('')  #向元素内输入值
kw1.size           #大小
kw1.submit         #提交
kw1.screenshot('2.png') #截取元素形状并保存为图片
kw1.tag_name       #标签名
kw1.text           #内容，如果是表单元素则无法获取
kw1.is_selected()  #判断元素是否被选中
kw1.is_enabled()   #判断元素是否可编辑
kw1.is_displayed   #判断元素是否显示
kw1.value_of_css_property('color') #获取元素属性的值
kw1._upload('2.png') #上传文件

14. 鼠标键盘事件

我们在之前的例子中已经用到了一些鼠标键盘事件了。如下所示

from selenium.webdriver.common.keys import Keys
c.find_element(By.ID,'kw').send_keys('python')#输出Python
c.find_element(By.ID,'kw').send_keys(Keys.ENTER)#回车键
c.find_element(By.ID,'kw').click()#点击

看来看去也就只有输入文字，模拟按键，还有拟真的 *** 作吗？
当然有

click(on_element=None)                 #鼠标左键单击
click_and_hold(on_element=None)        #单击鼠标左键，不松开
context_click(on_element=None)         #单击鼠标右键
double_click(on_element=None)          #双击鼠标左键
drag_and_drop(source,target)           #拖拽到某个元素然后松开
drag_and_drop_by_offset(source,xoffset,yoffset) #拖拽到某个坐标然后松开
key_down(value,element=None)     #按下键盘上的某个键
key_up(value, element=None)      #松开键盘上的某个键
move_by_offset(xoffset, yoffset)  #鼠标从当前位置移动到某个坐标
move_to_element(to_element)        #鼠标移动到某个元素
move_to_element_with_offset(to_element, xoffset, yoffset) #移动到距某个元素（左上角坐标）多少距离的位置
pause(seconds)                  #暂停所有输入(指定持续时间以秒为单位)
perform()                       #执行所有 *** 作
reset_actions()                 #结束已经存在的 *** 作并重置
release(on_element=None)       #在某个元素位置松开鼠标左键
send_keys(*keys_to_send)        #发送某个键或者输入文本到当前焦点的元素
send_keys_to_element(element, *keys_to_send) #发送某个键到指定元素

当然要使用上述 *** 作，我们要导入一个类，ActionChains，对这个类实例化，就可以监听鼠标键盘事件，使用对应的方法就可以输入指定的 *** 作。

示例如下：

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.get('https://www.baidu.com')
a=ActionChains(c)
kw1=c.find_element(By.ID,'kw')
tj=c.find_element(By.ID,'su')
tj.send_keys(Keys.CONTROL,'c') #复制
a.drag_and_drop(kw1,tj).perform()#从输入框拖动到搜索按钮
kw1.send_keys(Keys.CONTROL,'v')#粘贴
tj.send_keys(Keys.ENTER)
time.sleep(3)
c.close()
c.quit()

到了这里我们就可以完全模拟人 *** 作浏览器完成一系列 *** 作。

15. 选项 *** 作

我们可以通过给当前 *** 作的对象增加一些选项来增强交互能力。

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
from selenium.webdriver.chrome.options import Options
o=Options()
o.add_argument('--headless')#无界面浏览
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe',chrome_options=o)
c.get('https://www.baidu.com')
kw1=c.find_element(By.ID,'kw')
print(c.title)
time.sleep(3)
c.close()
c.quit()

如上就实现了无界面浏览。更多的浏览器 *** 作选项设置如下：

o.add_argument('--window-size=600,600') #设置窗口大小
o.add_argument('--incognito') #无痕模式
o.add_argument('--disable-infobars') #去掉chrome正受到自动测试软件的控制的提示
o.add_argument('user-agent="XXXX"') #添加请求头
o.add_argument("--proxy-server=http://200.130.123.43:3456")#代理服务器访问
o.add_experimental_option('excludeSwitches', ['enable-automation'])#开发者模式
o.add_experimental_option("prefs",{"profile.managed_default_content_settings.images": 2})#禁止加载图片
o.add_experimental_option('prefs',
{'profile.default_content_setting_values':{'notifications':2}}) #禁用浏览器d窗
o.add_argument('blink-settings=imagesEnabled=false')  #禁止加载图片
o.add_argument('lang=zh_CN.UTF-8') #设置默认编码为utf-8
o.add_extension(create_proxyauth_extension(
           proxy_host='host',
           proxy_port='port',
           proxy_username="username",
           proxy_password="password"
       ))# 设置有账号密码的代理
o.add_argument('--disable-gpu')  # 这个属性可以规避谷歌的部分bug
o.add_argument('--disable-javascript')  # 禁用javascript
o.add_argument('--hide-scrollbars')  # 隐藏滚动条
o.binary_location=r"C:\Users\Administrator\AppData\Local\Google\Chrome\Application" #指定浏览器位置
o.add_argument('--no-sandbox')  #解决DevToolsActivePort文件不存在的报错

o.set_headless()          #设置启动无界面化
o.binary_location(value)  #设置chrome二进制文件位置
o.add_argument(arg)               #添加启动参数
o.add_extension(path)                #添加指定路径下的扩展应用
o.add_encoded_extension(base64)      #添加经过Base64编码的扩展应用
o.add_experimental_option(name,value)         #添加实验性质的选项
o.debugger_address(value)                #设置调试器地址 
o.to_capabilities()                    #获取当前浏览器的所有信息

虽然选项很多，但是我们真正能用到的不多，一般就是无痕模式或者禁用JavaScript和图片来快速获取到相关信息。虽然我们上面使用的是Options方法，但是在实际应用中建议大家使用的ChromeOptions方法。

16. 窗口切换、表单切换

在 selenium *** 作页面的时候，可能会因为点击某个链接而跳转到一个新的页面（打开了一个新标签页），这时候 selenium 实际还是处于上一个页面的，需要我们进行切换才能够定位最新页面上的元素。

窗口切换需要使用 switch_to.windows() 方法。

我们还可以 *** 作框架里的东西，比如IFrame，Frame等等，虽然都是框架，但是这两者 *** 作起来还是有很大差别的。

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.implicitly_wait(10)
c.get('https://hao.360.com/?a1004')
#ss=c.find_element(By.CLASS_NAME,'NEWS_FEED_VIDEO_1595850774217HPA70')#不容易找到标签
c.switch_to.frame(0)#索引
c.switch_to.frame('NEWS_FEED_VIDEO_1595850774217HPA70-VideoIframe') #ID
c.switch_to.frame('NEWS_FEED_VIDEO_1595850774217HPA70')#Class
c.switch_to.frame(c.find_element_by_tag_name("iframe"))#标签
time.sleep(3)
c.close()
c.quit()

返回主框架

c.switch_to.default_content()

c.switch_to.parent_frame()

三、Alert

在d窗处理中，我们会遇到三种情况，如下：

浏览器d出框
新窗口d出框
人为d出框

1.浏览器d出框

首先说说浏览器d出框，想必大家对JavaScript中的Alert，Confirm，Prompt应该不是很陌生，就是d出框，确认框，输入框；基本方法我们来看下，如下

from selenium.webdriver.common.alert import Alert
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.implicitly_wait(10)
c.get('https://www.baidu.com')
a1=Alert(c)
a1.accept() #确定
a1.dismiss() #取消
a1.authenticate(username,password) #用户身份验证
a1.send_keys('') #输入文本或按键
a1.text  #获取d窗内容

这里我们应对每种情况它上面的方法的对应位置都是会有所变化的，所以我们需要根据具体情况来进行 *** 作，而且还可以使用另一种方法，如下

c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.implicitly_wait(10)
c.get('https://www.baidu.com')
a1=c.switch_to_alert()
a1.accept() #确定
a1.dismiss() #取消
a1.authenticate(username,password) #用户身份验证
a1.send_keys('') #输入文本或按键
a1.text  #获取d窗内容

注：该类方法必须在有d框的情况下才有作用，如没有会报错。

2. 新窗口d出框

上面就是浏览器d出框的处理方法了，如果是新窗口d出的话那么就不一样了，我们需要通过句柄来定位，前面我们提到过这两个方法。下面我们来看看它们的具体用法，如下：

from selenium import webdriver
from selenium.webdriver.common.by import By
import time
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.implicitly_wait(10)
c.get('https://www.baidu.com')
kw1=c.find_element(By.ID,'kw')
tj=c.find_element(By.ID,'su')
hwnd=c.window_handles #所有窗口句柄
for h in hwnd:
   if h !=c.current_window_handle:  #如果句柄不是当前窗口句柄则切换                          c.switch_to_window(h)  #切换窗口
   else:
       print('无需切换窗口') 
time.sleep(3)
c.close()
c.quit()

注：如果有多个窗口，当你关闭了当前窗口想切换到另一个窗口，你需要把没关闭的窗口切换成当前活动窗口，因为Selenium是不会为你做这件事的。

3. 人为d窗

这类d出框是我们自己开发的，一般都是使用Div包裹一些其它的元素标签然后形成一个整体，当我们触发某个事件的时候就会出现，否则消失。这种d出框使用我们的众多Find前缀的方法就能遍历到。

四、判断

在Selenium中我们在做自动化测试时常无法判断一个元素是否真的显示出来了，因此会各种报错，接下来我们对这些 *** 作进行判断，如果显示出了我们预期的值，那么就进行下一步 *** 作，否则就关闭或者暂停几秒然后再判断，这里我要跟大家说Selenium中的一个模块-----Expected_Conditions，简称为EC，如下所示

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
import time
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.implicitly_wait(10)
c.get('https://baidu.com')
t=EC.title_is('百度一下，你就知道')
print(t(c))
time.sleep(3)
c.close()
c.quit()

这里其实就是判断当前页面的标题是否是我们给定的文本，可以看出这里为True，说明是。它不光就一个方法哦，还有其它的，小编在这里大致说下，如下所示：

EC.title_contains('')(c)#判断页面标题是否包含给定的字符串
EC.presence_of_element_located('')(c) #判断某个元素是否加载到dom树里，该元素不一定可见
EC.url_contains('')(c) #判断当前url是否包含给定的字符串
EC.url_matches('')(c) #匹配URL
EC.url_to_be('')(c)  #精确匹配
EC.url_changes('')(c) #不完全匹配
EC.visibility_of_element_located('')(c) #判断某个元素是否可见,可见代表元素非隐藏元素
EC.visibility_of('')(c)   #跟上面一样，不过是直接传定位到的element
EC.presence_of_all_elements_located('')(c) #判断是否至少有1个元素存在于dom树中
EC.visibility_of_any_elements_located('')(c) #判断是否至少一个元素可见，返回列表
EC.visibility_of_all_elements_located('')(c) #判断是否所有元素可见，返回列表
EC.text_to_be_present_in_element('')(c) #判断元素中的text是否包含了预期的字符串
EC.text_to_be_present_in_element_value('')(c)#判断元素中value属性是否包含预期的字符串
EC.frame_to_be_available_and_switch_to_it('')(c) # 判断该frame是否可以switch进去
EC.invisibility_of_element_located('')(c) #判断某个元素是否不存在于dom树或不可见
EC.element_to_be_clickable('')(c) #判断某个元素中是否可见并且可点击
EC.staleness_of('')(c)  #等某个元素从dom树中移除
EC.element_to_be_selected('')(c)  #判断某个元素是否被选中了,一般用在下拉列表
EC.element_located_to_be_selected('')(c) #判断元组中的元素是否被选中
EC.element_selection_state_to_be('')(c) #判断某个元素的选中状态是否符合预期
EC.element_located_selection_state_to_be('')(c) #跟上面一样，只不过是传入located
EC.number_of_windows_to_be('')(c)  #判断窗口中的数字是否符合预期
EC.new_window_is_opened('')(c)  #判断新的窗口是否打开
EC.alert_is_present('')(c)  #判断页面上是否存在alert

五、选择

刚刚讲过判断，现在我们来说说选择，选择无非就是挑好的扔烂的，顺着思路来不会错，总体来讲还是挺简单的，如下：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.select import Select
import time
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.implicitly_wait(10)
c.get('http://www.juliwz.cn/forum.php')
s=Select(c.find_element_by_id('ls_fastloginfield'))#实例化
res=s.all_selected_options#全部选中子项
res1=s.options#全部子项
print(res)
print(res1)
time.sleep(3)
c.close()
c.quit()

发觉主流网站都没有Select这个标签，于是找了个很冷门的网站，就一个Select。Select里面的方法也是相当多的，如下：

s.first_selected_option  #第一个选中的子项
s.select_by_index(index) #根据索引选择
s.select_by_value(value)   #根据值来选择
s.select_by_visible_text(text)  #根据选项可见文本
s.deselect_by_index(index)   #根据索引来取消选择
s.deselect_by_value(value)   #根据值来取消选择
s.deselect_by_visible_text(text)  #根据可见文本来取消选择
s.deselect_all()                #取消所有选择

六、显式等待和隐式等待

想必大家应该听过这个概念，显示等待就是浏览器在我们设置的时间内不断寻找，等到元素后才继续执行，如果没在规定时间内找到，也会抛异常；而隐式等待则是我们设置时间，然后程序去找元素，期间会不断刷新页面，到了时间仍然没找到就抛异常。这里有个常用的模块专门用来实现显示等待和隐式等待的，它就是”wait“,我们来看看吧。如下：

from selenium.webdriver.support.ui import WebDriverWait
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
c=webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
c.get('https://www.baidu.com/')
su=WebDriverWait(c,10).until(lambda x:x.find_element_by_id('su')) 
su.location_once_scrolled_into_view
print(su.get_attribute('value'))
time.sleep(3)
c.close()
c.quit()

隐式等待很简单，就一行代码，如下：

c.implicitly_wait(10)

它的等待时间适用于全局的环境，也就是任何地方找不到某个元素，它都将发挥作用，如果找得到，则不会产生作用。

至此完结。

感谢知乎作者随遇而安的讲解，参考原文链接
https://zhuanlan.zhihu.com/p/343948620

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/langs/918781.html

Selenium入门详细教程

发表评论

评论列表（0条）