python3 区分了 unicode str 和 byte arrary,并且默认编码不再是 ascii
关于编码问题的终极解决方案:
在python的Lib\site-packages文件夹下新建一个sitecustomize.py
文件,输入:
import sys
sys.setdefaultencoding('gb2312')
这里要注意一点是:这里面你可以设置GBK或者utf8 或者其他类型的编码格式,不一定非要gb2312,主要看你 *** 作的环境需要什么编码格式
你试试下面的代码
#!/usr/bin/env python# -*- coding:utf8 -*-
import urllib2
req = urllib2.Request("http://www.baidu.com/")
res = urllib2.urlopen(req)
html = res.read()
res.close()
html = unicode(html, "gb2312").encode("utf8")
print html
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)