Python:查看文件的编码格式-chardet

Python:查看文件的编码格式-chardet,第1张

其中, encoding 为检测出的编码, confidence 为可信度, language 是语言

另外一个例子:

检测的编码是GB2312,注意到GBK是GB2312的超集,两者是同一种编码,检测正确的概率是74%,language字段指出的语言是'Chinese'。

注意:chardet支持检测的编码列表请参考官方文档 Supported encodings 。

Python文件里开头有coding:utf-8,则说明这个Python文件是Unicode编码。

在Python3中字符串是默认使用Unicode的,python2.x则得用u来表示它是Unicode字符串,如a=u“abcdefg”。type函数可以验证


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8055121.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存