python之爬虫

虚拟主机管理系统 • 2022-6-3 • python • 阅读 14

概述一、爬虫之requests模块需求：给关键字到各在网站搜索存入数据库1.概述： requests模拟浏览器向后端发请求 requests模块如何安装：pip3installrequests importrequests get请求： response=r 一、爬虫之requests模块

需求：给关键字到各在网站搜索存入数据库

1.概述： requests模拟浏览器向后端发请求

requests模块如何安装：pip3 install requests

import requests

get请求：

response=requests.get('https://www.sogou.com/web?query=小虎')//发get请求，封装到response里了

print(response.text)

post请求：

form_data={

'phone':18912020023

'password':'djfkjf'

}

response=requests.post(

url='http://dig.chouti.com/login'

data=form_data

)

print(response.text)

requests.put() requests.delete() requests.head() requests.options()

2.requests的基本参数

(1)另一种调用方法：

requests.request(

method='get'

url='https://www.sogou.com/web'

params={'query':小虎,'q':'b'}//会自己拼接url：https://www.sogou.com/web?query=小虎&q=b

data={}//放请求体里的

cookie={'.CNBlogscookie':'....'}

)

requests.request(

method='post'

url='https://www.sogou.com/web'

params={'query':小虎,'q':'b'}//会自己拼接url：https://www.sogou.com/web?query=小虎&q=b

data={'user':'dan'}//放请求体里的，可字典可字符串#"user=dan;pwd=sdfsdf":自己转成字符串，默认带请求头application/x-www-form-urlencoded

Json=Json.dumps({'user':'dan'})//默认带上请求头变成application/Json

//有二种情况会出现浏览器能访问到数据，用这个请求就加获取不到数据，有二种情况如下：

headers={ 请求头，是后台拿不到的数据

'User-Agent':' Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36 '，//终端是什么，把浏览器的终端信息拿过来放进去

'Referer':'https://www.zhihu.com'，//第二次发请求时要有的

}

cookies={'.CNBlogscookie':'....'},//流程：用户会话保持，第一次登录成功后会发一个随机字符串

其它参数：

files,auth,proxIEs等

)

def index(request):

request.method

request.GET.get('query')//后台拿的是params的字典，在url里拿数据

request.POST.get('user')//后台拿到的是data里的数据，在请求体里拿数据

request.body:拿到的是传输的字符串

先判断请求头里是不是content-type:application/x-www-form-urlencoded，如果是把传输数据赋给body

再把数据转成字典给POST,如果请求头不是这样比如是application/Json就不转换直接给body，POST就是空

总结

以上是内存溢出为你收集整理的python之爬虫全部内容，希望文章能够帮你解决python之爬虫所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1187352.html

爬虫

打赏

微信扫一扫

支付宝扫一扫

虚拟主机管理系统一级用户组

python常用标准库

上一篇 2022-06-03

Ubuntu16.04下安装uhd+gnuradio

下一篇 2022-06-03

发表评论

登录后才能评论

评论列表（0条）