linux里awk是做什么的,请详细说明

linux里awk是做什么的,请详细说明,第1张

awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。
awk有三个不同的版本:awk、nawk和gawk,未作特别说明,一般指gawk,gawk是awk的GNU版本。
之所以叫awk是因为其取了三位创始人Alfred Aho,Peter Weinberger,和Brian Kernighan的Family Name
的首字符。
使用方法:
awk'{pattern+action}'{filenames}
尽管 *** 作可能会很复杂,但语法总是这样,其中pattern表示awk在数据中查找的内容,而action是在找到匹配内容时所执行的一系列命令。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。pattern就是要表示的正则表达式,用斜杠括起来。
awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本 *** 作。完整的awk脚本通常用来格式化文本文件中的信息。
通常,awk是以文件的一行为处理单位的。awk每接收文件的一行,然后执行相应的命令,来处理文本。
调用awk的三种方式
1、命令行方式
awk[-F field-separator]'commands'input-file(s)
其中,commands是真正awk命令,[-F域分隔符]是可选的。input-file(s)是待处理的文件。
在awk中,文件的每一行中,由域分隔符分开的每一项称为一个域。通常,在不指名-F域分隔符的情况下,默认的域分隔符是空格。
2、shell脚本方式
将所有的awk命令插入一个文件,并使awk程序可执行,然后awk命令解释器作为脚本的首行,一遍通过键入脚本名称来调用。
相当于shell脚本首行的:#!/bin/sh
可以换成:#!/bin/awk
3、将所有的awk命令插入一个单独文件,然后调用:
awk-f awk-script-file input-file(s)
其中,-f选项加载awk-script-file中的awk脚本,input-file(s)跟上面的是一样的。

linux awk命令怎么用? awk:用于一行中分成数个“栏位”来处理。适合处理 小型资料。
执行模式:awk '条件型别1{动作1} 条件型别2{动作2} ' filename
# last | awk '{print $1 "\t" $3}' <== 检视登入者的资料,只显示登入名和ip地址,并以[tab]隔开
awk 的内建变数
变数名称 代表的含义
NF 每一行($0)拥有的栏位总数
NR 当前 awk 所处理的是 “第几行” 资料
FS 当前分隔符,预设空格键
awk 的逻辑运算子
运算单元 代表含义
> 大于
< 小于
>= 大于或等于
<= 小于或等于
== 等于
!= 不等于
范例:
cat /etc/passwd | awk '{FS=":"} $3 < 10 {print $1 "\t" $3}' <== 档案/etc/passwd是以":"分隔的,检视第三栏小于10的资料,并且只显示帐号与第三栏
以上是我对awk的总结,希望对你有帮助,是我写的哦,不是复制的。
linux 怎么用awk命令 取出一段文字
awk '/<DIMENSION NAME="CCCCCC" SRC_TYPE="INTERNAL">/,/<DIMENSIONS>/ {print $0}' filename
Linux awk命令问题

head -n 3 /etc/passwd|awk -F ':' '$1="root"' 这里$1="root",表示将第1列的值赋值为root,因此上述命令表示:将/etc/passwd中前3行按照‘:’分隔后第一列以root显示,并列印其他列。

awk -F ':' '$3=="0"' /etc/passwd
这里$3=="0",表示将第三列与"0”进行匹配,以什么方式匹配呢?以‘:’分隔后的第三列进行匹配并列印。这里是匹配列印,所以列印的是匹配的那一行(被:分隔后),而不是显示分隔后的列。
所以,区别在于一个是分隔后赋值列印分隔后列的值,一个是按照指定分隔方式进行匹配找到匹配的行,列印的是匹配的那一行。
linux的awk命令问题
一行里 第一个元素和第三个元素
linux下 awk命令问题
1、其实这样基本满足要求。但是确实不够严谨。试试是否可以。
ps -le | grep sshd | awk '{print $4}'
2、对ps 命令用的最多的是ps -ef 对el 我不是很了解具体输出什么。当然,是不是你压根就没有这个sshd服务启动。这些都先验证一下。一步一步的输出,看看问题出现在管道的哪一个环节。
3、或者这个 $14==sshd 栏位你指定错了。 awk $指定的变数是从1 开始的。$0是整个行。这个不要忘记了哦。
如果上述1第一种情况可以输出,第二种2不可以话,可能就验证了我的假设。你栏位拆解出现错误。把$14 这个栏位好好看看。
linux awk命令基础 怎么在终端写
awk一般用于文字处理,通常用作资料提取。终端书写demo
awk '{print }' infotxt
以上是输出文字档案infotxt的所有内容,请使用实际档案进行替换infotxt
ps -ef|grep process_name | awk -F"" '{print $2}'
以上是查询process_name程序的ID资讯,把查询资讯作为引数传给awk进行过滤,请使用实际程序名替换process_name。
awk命令在 linux和aix下的区别
三种呼叫awk的命令方式:
1命令列方式:awk [-F field-separator] 'mands' input-file(s)
-F选项可选:awk -F: 'mands' input-file
2将所有的awk命令插入一个档案,并是awk程式可执行,然后用awk命令直译器作为指令码的首行,
以便通过键入指令码名称来呼叫它。
3将所有的awk命令插入一个单独档案,然后呼叫:
awk -f awk-script-file input-files(s)
-f:指明在档案awk-script-file中的awk指令码
input-file(s):使用awk进行浏览的档名。

awk指令码
在命令中呼叫awk时,awk指令码由各种 *** 作和模式组成。
-F,awk每次读一条记录或一行,并使用指定的分隔符分分隔指定域;
所没分隔符,则使用空格。

任何awk语句都由模式和动作组成
模式,决定动作语句何时触发及触发事件,若忽略模式部分,动作将时刻保持执行状态。
模式,可是任何条件语句,或符合语句,或正则表示式。
BEGIN:设定计数,列印头,在任何文字浏览动作之前;
END:用来在awk完成档案浏览动作后列印输出档案总数和结尾状态标志。

动作,在{}内指定;大多用来列印;里面可包含:if,looping,回圈推出结构;
若不指明采取动作,awk将列印所有浏览出来的记录。
如何在Linux中使用awk命令
awk例项
1、cat /etc/passwd|awk -F: '{print $1}'
2、linux的awk一般都是gawk,/bin/awk -> gawk
3、awk ‘/abc/’ filetxt 显示档案中包含abc行。类似grep abc atxt
4、awk ‘{print NR,NF,$1,$NF,}’ filetxt按空格分隔列,显示当前记录号、域数和每一行的第一列和最后一列。
-F引数可以设定分割引数,例如按:分割
awk -F: ‘{print $1}’ /etc/passwd
或者cat file|awk -F “|” ‘{print $1}’
5、awk程式语言
cat vtxt|awk ‘{print length($1)}’
6、awk中使用NR和FNR,一般在awk处理多个档案时,NR==FNR才有意义
NF 当前记录中的栏位数。
NR 当前记录数。
FNR同NR,但相对于当前档案。
awk ‘{print NR,FNR}’ testtxt test2txt
awk ‘{if(NR==FNR){a[FNR]=$1;}else{print $1,a[FNR]}}’ btxt atxt
7、列印奇数行与偶数行
awk ‘NR%2’ testtxt
awk ‘!(NR%2)’ testtxt
8、杀死tomcat的ssh指令码
#!/bin/sh
ps -ef| grep tomcat |grep -v grep | awk ‘{print $2}’ |xargs kill -9
9、列印前7列
cat atxt|awk ‘{NF=7}1’ >> btxt
tail -f aesslog|awk ‘NF=7′ OFS=’\t’ >> btxt
cut -d”,” -f3-6 urfile
LINUX系统怎么使用awk命令实现下述 *** 作
cat file|awk -F"name=" '{print $2}'|awk -F\" '{print $1}'
试试看,第二个”的转义,我没测试,可以自己调下

awk格式化:前面接触到的awk的输出功能,是{print}的功能,只能对文本简单的输出,并不能美化或修改格式
printf格式化输出:对文本格式化输出

printf和print的区别:format的使用

要点
1、其与print命令的最大不同是,printf需要指定format
2、format用于指定后面的每个item的输出格式
3、printf语句不会自动打印换行符;\n; print默认添加空格换行符

format格式的指示符都以%开头,后跟一个字符
%c 显示字符的ASCII码
%d, %i 十进制整数
%e, %E 科学计数法显示数值
%f 显示浮点数
%g, %G 以科学计数法的格式或浮点数的格式显示数值
%s 显示字符串
%u 无符号整数
%% 显示%自身

printf修饰符
- 左对齐;默认右对齐
+ 显示数值符号;printf "%+d"

给printf添加格式
格式化字符串%s代表字符串的意思
awk '{printf "%s\n",$1}' file

对对个变量进行格式化
当我们使用Linux命令printf时,一个%s格式替换符,可以对多个参数进行重复格式化
printf "%s\n" a b c d
然而awk的格式替换符想要修改多个变量,必须传入多个
awk 'BEGIN{printf "%d\n%d\n%d\n%d\n%d\n",1,2,3,4,5}'
注意awk不跟上文件数据,必须添加BEGIN, %d代表的是十进制数字

awk通过空格切割文档,printf动作对数据格式化输出
awk '{printf "第一列:%s 第二列:%s 第三列:%s\n", 2,$3}' file

对pwdtxt进行格式化输出
awk -F ":" 'BEGIN{printf
"%-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\n",
"用户名","密码","UID","GID","用户注释","用户家目录","用户使用的解释器"}
{printf "%-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %s\n",
2, 4, 6,$7}'
pwdtxt

参数解释
'BEGIN{printf "格式替换符 格式替换符2","变量1","变量2"}' 执行BEGIN模式
"%-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\t %-25s\n" 先打印第一行信息
%s是格式替换符 ,替换字符串
%s\t 格式化字符串后,添加制表符,四个空格
%-25s 已然是格式化字符串, - 代表左对齐 ,25个字符长度

printf对输出的文本不会换行,必须添加对于的格式替换符和\n
使用printf动作,'{printf "%s\n",$1}',替换的格式和变量之间得有逗号
使用printf动作,%s %d 等格式化替换符,必须和被格式化的数据一一对应

这个属于shell字符集和文件字符集不一致问题
你的awk命令本身写法没有问题
建议查询文件字符集,和当前shell字符集
都调整为utf8
这样处理就不会因为导致乱码

NR - Number of Record - 当前处理的行是第几行(因为awk是流处理工具,一行一行处理的,所以NR在不停的自增1)
FNR - File Number of Record - 当前处理的行是当前处理文件的第几行
NF - Number of Fileds - 当前行有多少列数据(这个在每行都会根据设定的分割符重新计算,默认分割符是任意连续的多个空白符)
(NR==FNR) 大致等效于 (ARGIND==1) , 一般用来判断是不是在处理第一个文件。
但区别是: 前者是判断当前处理的总行数跟文件内行数相等,而这种情况一般都是在第一个文件上,而ARGIND==1是参数位置第1的文件时生效。—— 但,如果前面的文件是空的,那么NR==FNR就生效于第一个非空文件,而ARGIND==1不会。这微妙的区别使它们可以应用于不同的需要。
实际使用中还可以用文件名判断当前处理的是哪一个文件。
上面几种使用的环境: 用awk连续处理多个文件时,比如 awk '命令序列' file1 file2 file 这样的情况下,判断在处理哪个文件了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13360111.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-21
下一篇 2023-07-21

发表评论

登录后才能评论

评论列表(0条)

保存