linux环境如何查看文件编码和如何实现编码转换

linux环境如何查看文件编码和如何实现编码转换,第1张

处于linux命令,想在linux系统中处理一些表格信息,但是在linux输入cat solr |head -2中文字符出现乱码,百度之后才知道linux下文件编码必须是utf-8中文字符才不会出现乱码。经过多方求助,才得知解决方法。

linux环境如何查看文件编码:

file filename

file是命令,filename是文件名

可以从上图看出solr.txt的编码是utf-16,所以要转换成utf-8。

linux环境如何实现编码转换:

iconv -f utf-8 -t utf-16 keyword -o keyword1

iconv -f 源文件格式 -t 想要转成的格式 文件名 -o 输出文件名

上图所示,中文字符乱码经过转换之后可以输出正常的中文字符。

1.在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式

:set

fileencoding=utf-8

2.

enconv

转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码, *** 作如下

enconv

-L

zh_CN

-x

UTF-8

filename

3.

iconv

转换,iconv的命令格式如下:

iconv

-f

encoding

-t

encoding

inputfile

比如将一个UTF-8

编码的文件转换成GBK编码

iconv

-f

GBK

-t

UTF-8

file1

-o

file2

查看文件编码file命令

file

ip.txt

ip.txt:

UTF-8

Unicode

text,

with

escape

sequences

一、利用iconv命令进行编码转换文件内容编码转换

iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。

用法:

iconv

[选项...]

[文件...]

有如下选项可用:

输入/输出格式规范:

-f,

--from-code=名称

原始文本编码

-t,

--to-code=名称

输出编码

信息:

-l,

--list

列举所有已知的字符集

输出控制:

-c

从输出中忽略无效的字符

-o,

--output=FILE

输出文件

-s,

--silent

关闭警告

--verbose

打印进度信息

-?,

--help

给出该系统求助列表

--usage

给出简要的用法信息

-V,

--version

打印程序版本号

例子:

iconv

-f

utf-8

-t

gb2312

aaa.txt

>bbb.txt

这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8004133.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-12
下一篇 2023-04-12

发表评论

登录后才能评论

评论列表(0条)

保存