如何在Python中使用urllib2

如何在Python中使用urllib2,第1张

import urllib2

req = urllib2.Request('http://portal.huanuo-nsb.com/login')

html = urllib2.open(req)

html = html.read()

python最恶心的地方就在于它的版本和配置了,特别是安装第三方包的时候经常会出现莫名其妙的错误,又不懂。

所以只能不断的切来切去的。

今天学习python爬虫,其中Python2.7使用了urllib和urllib2,python3的urllib结合了py2.7的两部分。但是电脑不知为什么又安装不了py3的urllib,好烦。出现下面的错误。

python2.7和python3主要是模块的位置变化地方较多。

其中python2.7的urllib和urllib2的区别一下:

urllib2可以接受一个Request类的实例来设置URL请求的headers,urllib仅可以接受URL。这意味着,你不可以通过urllib模块伪装你的User Agent字符串等(伪装浏览器)。

urllib提供urlencode方法用来GET查询字符串的产生,而urllib2没有。这是为何urllib常和urllib2一起使用的原因。

urllib2模块比较优势的地方是urlliburllib2.urlopen可以接受Request对象作为参数,从而可以控制HTTP Request的header部。

但是urllib.urlretrieve函数以及urllib.quote等一系列quote和unquote功能没有被加入urllib2中,因此有时也需要urllib的辅助。

urllib2是一个标准库,安装python之后就自带了,并且只在于python2中

在python3中,已经把urllib,urllib2等的合并为一个包urllib了。

另外查看模块说明,python自带了一个官方文档可以查看:

1.先打看自带的ide,点击help-python Docs(或者也可以直接看f1)

2.再在打开的文档里,输入urllib2搜素,回车:

或者也可以使用命令help(模块名)(前提得先导入):


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/bake/11682204.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存