在Linux中查看文件编码可以通过以下几种方式:1.在Vim中可以直接查看文件编码:setfileencoding,即可显示文件编码格式。2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码
下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。
一,查看文件编码:在Linux 中查看文件编码可以通过以下几种方式:
1.在Vim中可以直接查看文件编码:setfileencoding即可显示文件编码格式。如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在~/.vimrc文件中添加以下内容:setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。
2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码&#36encafilenamefilename:Universaltransformationformat8bitsUTF-8CRLFlineterminators需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:Unrecognizedencoding
二,文件编码转换
1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式:setfileencoding=utf-8 2.iconv转换,iconv的命令格式如下:输入/输出格式规范:-f,--from-code=名称原始文本编码-t,--to-code=名称输出编码信息: www.Svn8.Com-l,--list列举所有已知的字符集输出控制:-c从输出中忽略无效的字符-o,--output=FILE输出文件Svn8.Com-s,--s ilent关闭警告--verbose打印进度信息-?,--help给出该系统求助列表--usage给出简要的用法信息-V,--version打印程序版本号 例子:iconv-futf-8-tgb2312aaa.txt>bbb.txt这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。iconv-fencoding-tencodinginputfile比如将一个UTF-8编码的文件转换成GBK编码iconv-fGBK-tUTF-8file1-ofile2
3.enconv转换文件编码比如要将一个GBK编码的文件转换成UTF-8编码, *** 作如下enconv-Lzh_CN-xUTF-8filename
linux 命令行中cat命令可以直接打开我们想要查看的文件内容。比如part1.txt文件是一首诗词,可以用此命令:[lichao@localhost test]$ cat part1.txt
扩展资料:
linux 命令行中查看文件类型:
file是一个非常便捷的命令,用它可以探测文件的字符编码。如下我们创建了两个文件
[lichao@localhost test]$ ls -l
total 288
-rw-rw-r--. 1 lichao lichao 4 Aug 24 15:31 abc.txt
-rw-rw-r--. 1 lichao lichao 285310 Aug 24 15:26 all.txt
通过file命令来查看下文件的字符集编码:
[lichao@localhost test]$ file abc.txt
abc.txt: ASCII text
[lichao@localhost test]$ file all.txt
all.txt: UTF-8 Unicode text, with CRLF, CR, LF line terminators
[lichao@localhost test]$
其中 abc.txt 是 ASCII 编码,而 all.txt 是 UTF-8 编码,这有助于我们在打开含有中文的文件时,定位出现乱码的原因。
常用的7个Linux文件内容查看命令:
1.cat由第一行开始显示文件内容
用法:
cat-A 相当于-vET的整合选项,可列出一些特殊字符而不是空白
cat-b 列出行号,仅针对非空白行做行号显示,空白行不标行号
cat-E 将结尾的断行字节$显示出来
cat-n 列印出行号,连同空白行也会有行号,与-b的选项不同
cat-T 将[tab]按键以^I显示出来
cat-v 列出一些看不出来的特殊字符
2.tac 由最后一行开始显示文件内容
tac-b 在行前而非行尾添加分隔标志
tac-r 将分隔标志视作正则表达式来解析
tac-s 使用指定字符串代替换行作为分隔标志
3.nl 显示行号
nl-b a 无论是否为空行,均列出行号
nl-b t 空行不列出行号
nl-n ln 行号在荧幕的最左方显示
nl-n rn 行号在自己栏位的最右方显示,且不加0
nl-n rz 行号在自己栏位的最右方显示,且加0
nl-w 行号栏位的占用的位数
4.more 一页一页的显示文件内容
在more程序运行过程中,可以按以下键:
空白键(space):代表向下翻一页
Enter:代表向下翻『一行』
/字串:代表在这个显示的内容当中,向下搜寻『字串』这个关键字
:f:立刻显示出档名以及目前显示的行数
q:代表立刻离开more,不再显示该文件内容。
b或[ctrl]-b:代表往回翻页,不过这动作只对文件有用,对管线无用。
5.less与more类似,但是比more更好的是,他可以往前翻页
less运行时可以输入的命令有:
空白键:向下翻动一页
[pagedown]:向下翻动一页
[pageup]:向上翻动一页
/字串:向下搜寻『字串』的功能
?字串:向上搜寻『字串』的功能
n:重复前一个搜寻(与/或?有关!)
N:反向的重复前一个搜寻(与/或?有关!)
q:离开less这个程序
6.head 显示前几行
语法:
head-n 后面接数字,代表显示行数
7.tail 显示后几行
tail-n 后面接数字,代表显示行数
tail-f 表示持续侦测后面所接的档名,要等到按下[ctrl]-c才会结束tail的侦测
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)