linux环境如何查看文件编码和如何实现编码转换

linux环境如何查看文件编码和如何实现编码转换,第1张

处于linux命令,想在linux系统中处理一些表格信息,但是在linux输入cat solr |head -2中文字符出现乱码,百度之后才知道linux下文件编码必须是utf-8中文字符才不会出现乱码。经过多方求助,才得知解决方法。

linux环境如何查看文件编码:

file filename

file是命令,filename是文件名

可以从上图看出solr.txt的编码是utf-16,所以要转换成utf-8。

linux环境如何实现编码转换:

iconv -f utf-8 -t utf-16 keyword -o keyword1

iconv -f 源文件格式 -t 想要转成的格式 文件名 -o 输出文件名

上图所示,中文字符乱码经过转换之后可以输出正常的中文字符。

Linux 下查看文件字符编码和转换编码 如果你需要在 Linux 中 *** 作 windows 下的文件,那么你可能会经常遇 到 文 件 编 码 转 换 的 问 题 。 Windows 中 默 认 的 文 件 格 式 是 GBK(gb2312),而 Linux 一般都是 UTF-8。下面介绍一下,在 Linux 中如何查看文件的编码及如何进行对文件进行编码转换。

一,查看文件编码: 在 Linux 中查看文件编码可以通过以下几种方式:

1.在 Vim 中可以直接查看文件编码 :set fileencoding 即可显示文件编码格式。 如果你只是想查看其它编码格式的文件或者想解决用 Vim 查看文件乱 码的问题,那么你可以在 ~/.vimrc 文件中添加以下内容: set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936 这样, 就可以让 vim 自动识别文件编码 (可以自动识别 UTF-8或者 GBK 编码的文件) ,其实就是依照 fileencodings 提供的编码列表尝试,如 果没有找到合适的编码,就用 latin-1(ASCII)编码打开。

2. enca (如果你的系统中没有安装这个命令,可以用 sudo yum install -y enca 安装 )查看文件编码 $ enca filename filename: Universal transformation format 8 bitsUTF-8 CRLF line terminators 需要说明一点的是,enca 对某些 GBK 编码的文件识别的不是很好,识 别时会出现: Unrecognized encoding


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8931394.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-23
下一篇 2023-04-23

发表评论

登录后才能评论

评论列表(0条)

保存