# some request object existsresponse = urllib.request.urlopen(request)HTML = response.read().decode("utf8")
read()返回什么格式的字符串?我一直试图从Python的文档中找到它,但它根本没有提到它.为什么要解码?解码是否将对象解码为utf-8或utf-8?从什么格式到它将它解码为什么格式?解码文档也没有提到这一点.是Python的文档是那么可怕,还是我不理解某些标准约定?
我想将该HTML存储在UTF-8文件中.我会做一个常规的写作,还是我需要“编码”回某些东西然后写出来?
注意:我知道urllib已被弃用,但我现在无法切换到urllib2
解决方法 问python:>>> r=urllib.urlopen("http://Google.com")>>> a=r.read()>>> type(a)0: <type 'str'>>>> help(a.decode)Help on built-in function decode:decode(...) S.decode([enCoding[,errors]]) -> object Decodes S using the codec registered for enCoding. enCoding defaults to the default enCoding. errors may be given to set a different error handling scheme. Default is 'strict' meaning that enCoding errors raise a UnicodeDecodeError. Other possible values are 'ignore' and 'replace' as well as any other name registered with codecs.register_error that is able to handle UnicodeDecodeErrors.>>> b = a.decode('utf8')>>> type(b)1: <type 'unicode'>>>>
所以,似乎read()返回一个str. .decode()从UTF-8解码为Python的内部unicode格式.
总结以上是内存溢出为你收集整理的Python响应解码全部内容,希望文章能够帮你解决Python响应解码所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)