也许你在浏览一些网页的时候会遇到这种情况,有的网页的内容会设置为登录可见。
如果想要用driver去驱动浏览器浏览隐藏内容的话,就需要事先给它添加cookie信息,这几天使用的时候遇到了一些坑,简单说明下。
首先,我们先创建一个driver:
创建出来的driver专门有一个添加cookie信息的方法 driver.add_cookie() ,他接受的参数是一个字典。回到本文正题,下面说说坑。
add_cookie() 方法接受的字典参数的键名不是随意起的。
不能想当然地分解获取到内容的等号左右的信息。他的键名都是有意义的,一般记住 name 和 value 即可,分别代表cookie的名称和动态生成的值。
确保获取到的cookie内容是有效的。
举个栗子,这是我在登陆某网站后看到的cookie内容:
当然,不知道的话也可以多尝试,但如果你是第一次使用 add_cookie() 方法,建议你一定要在尝试前先看看坑三!
当你高高兴兴地进入目标网址,并想给driver添加好cookie信息:
它可能会报错,注意,这里说的是可能。
如果你遇到了类似 Message: unable to set cookie 的错误,建议使用更稳妥的方式:
就是说,在登录页面添加cookie信息,然后再访问目标网址。
如有错误,欢迎指正~
python如何保存cookie到本地的方法:第一次访问页面后,Server可将Cookie信息加入HTTP Header返回给浏览器,浏览器会自动将这些信息保存在本地;
当再次访问相同域名时,浏览器将对应Cookie信息随请求一起发送,Server端可读取这些信息进行处理。
Cookie可设置过期时间,到期后由浏览器自动删除;
当我们要返回页面时,首先输出如下:
[python] view plaincopy
print "Content-type: text/plain\n"
它其实是一个HTTP Header, 连续碰到两个换行表示HTTP Header部分结束,剩余部分将被做为数据处理;
包含了Cookie后输出大致如下:
[python] view plaincopy
print "Content-Type: text/html"
print "Set-Cookie: session=12345"
print # 多加一个换行表示HTTP Header部分结束
代码:
setcookie.py
[python] view plaincopy
#!/usr/bin/env python
import Cookie
import datetime
import random
expiration = datetime.datetime.now() + datetime.timedelta(days=30)
cookie = Cookie.SimpleCookie()
cookie["session"] = random.randint(0,1000000000)
cookie["session"]["domain"] = "localhost"
cookie["session"]["path"] = "/"
cookie["session"]["expires"] = \
expiration.strftime("%a, %d-%b-%Y %H:%M:%S PST")
print "Content-type: text/plain"
print cookie.output()
print "Cookie set with: " + cookie.output()
getcookie.py
[python] view plaincopy
#!/usr/bin/env python
import Cookie
import os
print "Content-type: text/plain\n"
try:
cookie = Cookie.SimpleCookie(os.environ["HTTP_COOKIE"])
print "session = " + cookie["session"].value
except (Cookie.CookieError, KeyError):
print "session cookie not set!"
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)