linux怎么看文件的字符集编码?

linux怎么看文件的字符集编码?,第1张

在Linux中查看文件编码可以通过以下几种方式:1.在Vim中可以直接查看文件编码:setfileencoding,即可显示文件编码格式。2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码

下面介绍一下,在Linux中如何查看文件的编码及如何进行对文件进行编码转换。

一,查看文件编码:在Linux 中查看文件编码可以通过以下几种方式:

1.在Vim中可以直接查看文件编码:setfileencoding即可显示文件编码格式。如果你只是想查看其它编码格式的文件或者想解决用Vim查看文件乱码的问题,那么你可以在~/.vimrc文件中添加以下内容:setencoding=utf-8fileencodings=ucs-bom,utf-8,cp936这样,就可以让vim自动识别文件编码(可以自动识别UTF-8或者GBK编码的文件),其实就是依照fileencodings提供的编码列表尝试,如果没有找到合适的编码,就用latin-1(ASCII)编码打开。

2.enca(如果你的系统中没有安装这个命令,可以用sudoyuminstall-yenca安装)查看文件编码&#36encafilenamefilename:Universaltransformationformat8bitsUTF-8CRLFlineterminators需要说明一点的是,enca对某些GBK编码的文件识别的不是很好,识别时会出现:Unrecognizedencoding

二,文件编码转换

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式:setfileencoding=utf-8  2.iconv转换,iconv的命令格式如下:输入/输出格式规范:-f,--from-code=名称原始文本编码-t,--to-code=名称输出编码信息:  www.Svn8.Com-l,--list列举所有已知的字符集输出控制:-c从输出中忽略无效的字符-o,--output=FILE输出文件Svn8.Com-s,--s  ilent关闭警告--verbose打印进度信息-?,--help给出该系统求助列表--usage给出简要的用法信息-V,--version打印程序版本号  例子:iconv-futf-8-tgb2312aaa.txt>bbb.txt这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。iconv-fencoding-tencodinginputfile比如将一个UTF-8编码的文件转换成GBK编码iconv-fGBK-tUTF-8file1-ofile2

3.enconv转换文件编码比如要将一个GBK编码的文件转换成UTF-8编码, *** 作如下enconv-Lzh_CN-xUTF-8filename

linux 命令行中cat命令可以直接打开我们想要查看的文件内容。比如part1.txt文件是一首诗词,可以用此命令:[lichao@localhost test]$ cat part1.txt

扩展资料:

linux 命令行中查看文件类型:

file是一个非常便捷的命令,用它可以探测文件的字符编码。如下我们创建了两个文件

[lichao@localhost test]$ ls -l

total 288

-rw-rw-r--. 1 lichao lichao      4 Aug 24 15:31 abc.txt

-rw-rw-r--. 1 lichao lichao 285310 Aug 24 15:26 all.txt

通过file命令来查看下文件的字符集编码:

[lichao@localhost test]$ file abc.txt 

abc.txt: ASCII text

[lichao@localhost test]$ file all.txt

all.txt: UTF-8 Unicode text, with CRLF, CR, LF line terminators

[lichao@localhost test]$

其中 abc.txt 是 ASCII 编码,而 all.txt 是 UTF-8 编码,这有助于我们在打开含有中文的文件时,定位出现乱码的原因。

常用的7个Linux文件内容查看命令:

1.cat由第一行开始显示文件内容

用法:

cat-A 相当于-vET的整合选项,可列出一些特殊字符而不是空白

cat-b 列出行号,仅针对非空白行做行号显示,空白行不标行号

cat-E 将结尾的断行字节$显示出来

cat-n 列印出行号,连同空白行也会有行号,与-b的选项不同

cat-T 将[tab]按键以^I显示出来

cat-v 列出一些看不出来的特殊字符

2.tac 由最后一行开始显示文件内容

tac-b 在行前而非行尾添加分隔标志

tac-r 将分隔标志视作正则表达式来解析

tac-s 使用指定字符串代替换行作为分隔标志

3.nl 显示行号

nl-b a 无论是否为空行,均列出行号

nl-b t 空行不列出行号

nl-n ln 行号在荧幕的最左方显示

nl-n rn 行号在自己栏位的最右方显示,且不加0

nl-n rz 行号在自己栏位的最右方显示,且加0

nl-w 行号栏位的占用的位数

4.more 一页一页的显示文件内容

在more程序运行过程中,可以按以下键:

空白键(space):代表向下翻一页

Enter:代表向下翻『一行』

/字串:代表在这个显示的内容当中,向下搜寻『字串』这个关键字

:f:立刻显示出档名以及目前显示的行数

q:代表立刻离开more,不再显示该文件内容。

b或[ctrl]-b:代表往回翻页,不过这动作只对文件有用,对管线无用。

5.less与more类似,但是比more更好的是,他可以往前翻页

less运行时可以输入的命令有:

空白键:向下翻动一页

[pagedown]:向下翻动一页

[pageup]:向上翻动一页

/字串:向下搜寻『字串』的功能

?字串:向上搜寻『字串』的功能

n:重复前一个搜寻(与/或?有关!)

N:反向的重复前一个搜寻(与/或?有关!)

q:离开less这个程序

6.head 显示前几行

语法:

head-n 后面接数字,代表显示行数

7.tail 显示后几行

tail-n 后面接数字,代表显示行数

tail-f 表示持续侦测后面所接的档名,要等到按下[ctrl]-c才会结束tail的侦测


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/6193802.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-17
下一篇 2023-03-17

发表评论

登录后才能评论

评论列表(0条)

保存