linux怎么看文件的字符集编码?

linux怎么看文件的字符集编码?,第1张

在Linux中查看文件编码可以通过以下几种方式:1.在Vim中可以直接查看文件编码:setfileencoding,即可显示文件编码格式。2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码

下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。

一,查看文件编码:在Linux 中查看文件编码可以通过以下几种方式:

1.在Vim中可以直接查看文件编码:setfileencoding即可显示文件编码格式。如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在~/.vimrc文件中添加以下内容:setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码&#36encafilenamefilename:Universaltransformationformat8bitsUTF-8CRLFlineterminators需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:Unrecognizedencoding

二,文件编码转换

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式:setfileencoding=utf-8  2.iconv转换,iconv的命令格式如下:输入/输出格式规范:-f,--from-code=名称原始文本编码-t,--to-code=名称输出编码信息:  www.Svn8.Com-l,--list列举所有已知的字符集输出控制:-c从输出中忽略无效的字符-o,--output=FILE输出文件Svn8.Com-s,--s  ilent关闭警告--verbose打印进度信息-?,--help给出该系统求助列表--usage给出简要的用法信息-V,--version打印程序版本号  例子:iconv-futf-8-tgb2312aaa.txt>bbb.txt这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。iconv-fencoding-tencodinginputfile比如将一个UTF-8编码的文件转换成GBK编码iconv-fGBK-tUTF-8file1-ofile2

3.enconv转换文件编码比如要将一个GBK编码的文件转换成UTF-8编码, *** 作如下enconv-Lzh_CN-xUTF-8filename

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

:set

fileencoding=utf-8

2.

enconv

转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码, *** 作如下

enconv

-L

zh_CN

-x

UTF-8

filename

3.

iconv

转换,iconv的命令格式如下:

iconv

-f

encoding

-t

encoding

inputfile

比如将一个UTF-8

编码的文件转换成GBK编码

iconv

-f

GBK

-t

UTF-8

file1

-o

file2

查看文件编码file命令

file

ip.txt

ip.txt:

UTF-8

Unicode

text,

with

escape

sequences

一、利用iconv命令进行编码转换文件内容编码转换

iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。

用法:

iconv

[选项...]

[文件...]

有如下选项可用:

输入/输出格式规范:

-f,

--from-code=名称

原始文本编码

-t,

--to-code=名称

输出编码

信息:

-l,

--list

列举所有已知的字符集

输出控制:

-c

从输出中忽略无效的字符

-o,

--output=FILE

输出文件

-s,

--silent

关闭警告

--verbose

打印进度信息

-?,

--help

给出该系统求助列表

--usage

给出简要的用法信息

-V,

--version

打印程序版本号

例子:

iconv

-f

utf-8

-t

gb2312

aaa.txt

>bbb.txt

这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8116023.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存