另外一个例子:
检测的编码是GB2312,注意到GBK是GB2312的超集,两者是同一种编码,检测正确的概率是74%,language字段指出的语言是'Chinese'。
注意:chardet支持检测的编码列表请参考官方文档 Supported encodings 。
Python文件里开头有coding:utf-8,则说明这个Python文件是Unicode编码。在Python3中字符串是默认使用Unicode的,python2.x则得用u来表示它是Unicode字符串,如a=u“abcdefg”。type函数可以验证
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)