Requests模块是一个用于网络访问的模块,其实类似的模块有很多,比如urllib,urllib2,httplib,httplib2,他们基本都提供相似的功能,那为什么Requests模块就能够脱引而出呢?可以打开它的官网看一下,是一个“人类“用的http模块。那么,它究竟怎样的人性化呢?相信如果你之前用过urllib之类的模块的话,对比下就会发现它确实很人性化。
一、导入下载完成后,导入模块很简单,代码如下:
# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc import requests# End www.jb51.cc
二、请求url这里我们列出最常见的发送get或者post请求的语法。
1.发送无参数的get请求:# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc r=requests.get("http://jb51.cc/justTest")# End www.jb51.cc
现在,我们得到了一个响应对象r,我们可以利用这个对象得到我们想要的任何信息。
上面的例子中,get请求没有任何参数,那如果请求需要参数怎么办呢?
2.发送带参数的get请求
# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc payload = {'key1': 'value1','key2': 'value2'}r = requests.get("http://jb51.cc/justTest",params=payload)# End www.jb51.cc
以上得知,我们的get参数是以params关键字参数传递的。
我们可以打印请求的具体url来看看到底对不对:
>>>print r.urlhttp://jb51.cc/justTest?key2=value2&key1=value1# End www.jb51.cc
可以看到确实访问了正确的url。
还可以传递一个List给一个请求参数:
>>> payload = {'key1': 'value1','key2': ['value2','value3']}>>> r = requests.get("http://jb51.cc/justTest",params=payload)>>> print r.urlhttp://jb51.cc/justTest?key1=value1&key2=value2&key2=value3# End www.jb51.cc
以上就是get请求的基本形式。
3.发送post请求
# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc r = requests.post("http://jb51.cc/postTest",data = {"key":"value"})# End www.jb51.cc
以上得知,post请求参数是以data关键字参数来传递的。
现在的data参数传递的是字典,我们也可以传递一个Json格式的数据,如下:
>>> import Json>>> import requests>>> payload = {"key":"value"}>>> r = requests.post("http://jb51.cc/postTest",data = Json.dumps(payload))# End www.jb51.cc
由于发送Json格式数据太常见了,所以在Requests模块的高版本中,又加入了Json这个关键字参数,可以直接发送Json数据给post请求而不用再使用Json模块了,见下:
>>> payload = {"key":"value"}>>> r = requests.post("http://jb51.cc/postTest",Json=payload)# End www.jb51.cc
如果我们想post一个文件怎么办呢?这个时候就需要用到files参数了:
>>> url = 'http://jb51.cc/postTest'>>> files = {'file': open('report.xls','rb')}>>> r = requests.post(url,files=files)>>> r.text# End www.jb51.cc
我们还可以在post文件时指定文件名等额外的信息:
>>> url = 'http://jb51.cc/postTest'>>> files = {'file': ('report.xls',open('report.xls','rb'),'application/vnd.ms-excel',{'Expires': '0'})}>>> r = requests.post(url,files=files)# End www.jb51.cc
tips:强烈建议使用二进制模式打开文件,因为如果以文本文件格式打开时,可能会因为“Content-Length”这个header而出错。
可以看到,使用Requests发送请求简单吧!
三、获取返回信息下面我们来看下发送请求后如何获取返回信息。我们继续使用最上面的例子:
>>> import requests>>> r=requests.get('http://jb51.cc/justTest')>>> r.text# End www.jb51.cc
r.text是以什么编码格式输出的呢?
>>> r.enCoding'utf-8'# End www.jb51.cc
原来是以utf-8格式输出的。那如果我想改一下r.text的输出格式呢?
>>> r.enCoding = 'ISO-8859-1'# End www.jb51.cc
这样就把输出格式改为“ISO-8859-1”了。
还有一个输出语句,叫r.content,那么这个和r.text有什么区别呢?r.content返回的是字节流,如果我们请求一个图片地址并且要保存图片的话,就可以用到,这里举个代码片段如下:
# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc def saveImage( imgurl,imgname ="default.jpg" ): r = requests.get(imgurl,stream=True) image = r.content destDir="D:\" print("保存图片"+destDir+imgname+"\n") try: with open(destDir+imgname,"wb") as jpg: jpg.write(image) return except IOError: print("IO Error") return finally: jpg.close# End www.jb51.cc
刚才介绍的r.text返回的是字符串,那么,如果请求对应的响应是一个Json,那我可不可以直接拿到Json格式的数据呢?r.Json()就是为这个准备的。
我们还可以拿到服务器返回的原始数据,使用r.raw.read()就可以了。不过,如果你确实要拿到原始返回数据的话,记得在请求时加上“stream=True”的选项,如:
# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc r = requests.get('https://API.github.com/events',stream=True)。# End www.jb51.cc
我们也可以得到响应状态码:
>>> r = requests.get('http://jb51.cc/justTest')>>> r.status_code200# End www.jb51.cc
也可以用requests.codes.ok来指代200这个返回值:
>>> r.status_code == requests.codes.okTrue# End www.jb51.cc
四、关于headers我们可以打印出响应头:
>>> r= requests.get("http://jb51.cc/justTest")>>> r.headers# End www.jb51.cc
`r.headers`返回的是一个字典,例如:
{ 'content-encoding': 'gzip','transfer-encoding': 'chunked','connection': 'close','server': 'Nginx/1.0.4','x-runtime': '147ms','etag': '"e1ca502697e5c9317743dc078f67693a"','content-type': 'application/Json'}# End www.jb51.cc
我们可以使用如下方法来取得部分响应头以做判断:
r.headers['Content-Type']# End www.jb51.cc
或者
r.headers.get('Content-Type')# End www.jb51.cc
如果我们想获得请求头(也就是我们向服务器发送的头信息)该怎么办呢?可以使用r.request.headers直接获得。
同时,我们在请求数据时也可以加上自定义的headers(通过headers关键字参数传递):
>>> headers = {'user-agent': 'myagent'}>>> r= requests.get("http://jb51.cc/justTest",headers=headers)# End www.jb51.cc
五、关于cookies如果一个响应包含cookies的话,我们可以使用下面方法来得到它们:
>>> url = 'http://jb51.cc'>>> r = requests.get(url)>>> r.cookies['example_cookie_name']'example_cookie_value'# End www.jb51.cc
我们也可以发送自己的cookie(使用cookies关键字参数):
>>> url = 'http://jb51.cc/cookies'>>> cookies={'cookies_are':'working'}>>> r = requests.get(url,cookies=cookies)# End www.jb51.cc
六、关于重定向有时候我们在请求url时,服务器会自动把我们的请求重定向,比如github会把我们的http请求重定向为https请求。我们可以使用r.history来查看重定向:
>>> r = requests.get('http://jb51.cc/')>>> r.url'http://jb51.cc/'>>> r.history[]# End www.jb51.cc
从上面的例子中可以看到,我们使用http协议访问,结果在r.url中,打印的却是https协议。那如果我非要服务器使用http协议,也就是禁止服务器自动重定向,该怎么办呢?使用allow_redirects 参数:
r = requests.get('http://jb51.cc',allow_redirects=False)# End www.jb51.cc
七、关于请求时间我们可以使用timeout参数来设定url的请求超时时间(时间单位为秒):
requests.get('http://jb51.cc',timeout=1)# End www.jb51.cc
八、关于代理我们也可以在程序中指定代理来进行http或https访问(使用proxIEs关键字参数),如下:
proxIEs = { "http": "http://10.10.1.10:3128","https": "http://10.10.1.10:1080",}requests.get("http://jb51.cc",proxIEs=proxIEs)# End www.jb51.cc
九、关于session我们有时候会有这样的情况,我们需要登录某个网站,然后才能请求相关url,这时就可以用到session了,我们可以先使用网站的登录API进行登录,然后得到session,最后就可以用这个session来请求其他url了:
s=requests.Session()login_data={'form_email':'[email protected]','form_password':'yourpassword'}s.post("http://jb51.cc/testLogin",login_data)r = s.get('http://jb51.cc/notification/')print r.text# End www.jb51.cc
其中,form_email和form_password是豆瓣登录框的相应元素的name值。
十、下载页面
使用Requests模块也可以下载网页,代码如下:
# @param Python之Requests模块使用详解# @author 内存溢出 jb51.cc|www.jb51.cc r=requests.get("http://jb51.cc")with open("haha.HTML","wb") as HTML: HTML.write(r.content)HTML.close()# End www.jb51.cc
总结 以上是内存溢出为你收集整理的Python Requests模块用法示例全部内容,希望文章能够帮你解决Python Requests模块用法示例所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)