如何检查TXT文本是不是ANSI编码格式的?

如何检查TXT文本是不是ANSI编码格式的?,第1张

1、首先打开该TXT文本

2、打开文件之后,点击[文件]->[另存为]。

3、在d出的另存为对话框中,可以看到文件的编码格式

4、如果想要修改文件的编码格式,可以通过显示编码格式的地方,下拉,选择你想要使用的编码;然后点击保存,即可生成另一个编码格式的文件。

扩展资料:

常见的编码格式有ASCII、ANSI、GBK、GB2312、UTF-8、GB18030和UNICODE等。对应的编码规则有单字节字符编码、ANSI编码和UNICODE编码等。

ANSI编码

把 UNICODE 字符串通过 ANSI 编码转化为“字节串”时,根据各自编码的规定,一个 UNICODE 字符可能转化成一个字节或多个字节。

反之,将字节串转化成字符串时,也可能多个字节转化成一个字符。比如,[0xD6, 0xD0] 这两个字节,通过 GB2312 转化为字符串时,将得到 [0x4E2D] 一个字符,即 '中' 字。

ANSI 编码的特点:

1、这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符。

2、“UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。

参考资料来源:

百度百科-ansi编码

其中, encoding 为检测出的编码, confidence 为可信度, language 是语言。

另外一个例子:

检测的编码是GB2312,注意到GBK是GB2312的超集,两者是同一种编码,检测正确的概率是74%,language字段指出的语言是'Chinese'。

注意:chardet支持检测的编码列表请参考官方文档 Supported encodings 。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/11711126.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存