1、首先打开该TXT文本
2、打开文件之后,点击[文件]->[另存为]。
3、在d出的另存为对话框中,可以看到文件的编码格式。
4、如果想要修改文件的编码格式,可以通过显示编码格式的地方,下拉,选择你想要使用的编码;然后点击保存,即可生成另一个编码格式的文件。
扩展资料:
常见的编码格式有ASCII、ANSI、GBK、GB2312、UTF-8、GB18030和UNICODE等。对应的编码规则有单字节字符编码、ANSI编码和UNICODE编码等。
ANSI编码
把 UNICODE 字符串通过 ANSI 编码转化为“字节串”时,根据各自编码的规定,一个 UNICODE 字符可能转化成一个字节或多个字节。
反之,将字节串转化成字符串时,也可能多个字节转化成一个字符。比如,[0xD6, 0xD0] 这两个字节,通过 GB2312 转化为字符串时,将得到 [0x4E2D] 一个字符,即 '中' 字。
ANSI 编码的特点:
1、这些“ANSI 编码标准”都只能处理各自语言范围之内的 UNICODE 字符。
2、“UNICODE 字符”与“转换出来的字节”之间的关系是人为规定的。
参考资料来源:
百度百科-ansi编码
其中, encoding 为检测出的编码, confidence 为可信度, language 是语言。另外一个例子:
检测的编码是GB2312,注意到GBK是GB2312的超集,两者是同一种编码,检测正确的概率是74%,language字段指出的语言是'Chinese'。
注意:chardet支持检测的编码列表请参考官方文档 Supported encodings 。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)