awk是一种用于处理文本、模式匹配的编程语言。与sed和grep,俗称Linux下的三剑客。学会 awk 等于你在 linux 命令行里,又多了一种处理文本的选择。这篇文章重点教你如何使用,看完这篇文章,就大致知道如何使用了,力求简单使用。 |
在awk的文本处理规则里,awk将文本文件视为由字段和记录组成的文本数据库。默认情况下,awk将每一行视为一个记录,也就是说记录的分隔符是 ,记录的分隔符可以通过内置变量RS更改。
在每一个记录中,又把记录分为若干个字段,即记录由字段组成,而字段的默认分隔符为空格或制表符。
一、基础用法和我们平常使用的 linux 命令一样, awk 也是遵循着某种格式来使用,格式如下:
# 使用格式
awk 执行的事件 文件
# 例如:
[email protected]:~# awk ‘{print[email protected]:~# awk ‘{print }‘ test.txtMyMyMyMy[email protected]:~# awk ‘{print }‘ test.txtfirstsecondthirdfourth[email protected]:~# awk ‘{print }‘ test.txtlanguage:Pythonlanguage:Shelllanguage:Javalanguage:C}‘ test.txtMy first language:PythonMy second language:ShellMy third language:JavaMy fourth language:C
其中,print 表示打印,$0 表示一整个记录,test.txt 表示一个文件。所以
awk ‘{print $0}‘ test.txt
表示把 test.txt 文件里面的每行记录都打印出来。
$0 表示整个记录,不过 $1,$2,$3.....则表示整个记录中的第一个字段,第二个字段......。
[email protected]:~# awk -F ‘:‘ ‘{print }‘ test.txtPythonShellJavaC
刚才我们说字段的默认分隔符是空格或者制表符这些,默认意味着我们可以自己显式着指定分隔符。下面我们用“:”来作为我们的分隔符吧。
[email protected]:~# awk -F ‘:‘ ‘ == "Java" {print }‘ test.txtJava
上面我们用参数 -F 指定了我们的分隔符,即如果想要指定字段的分隔符,可以用参数 -F 指定分隔符。
二、条件限制在打印文本的时候,我们可以指定一些条件。格式如下:
awk 参数 条件 要执行的动作 文件
例如我们指定分隔符为“:”,条件为第二个字段为"Java"的记录。
# 打印第二个字段为"Java"的文本
[email protected]:~# awk -F ‘:‘ ‘NR % 2 == 1 {print }‘ test.txtPythonJava
打印奇数行的的第二个字段:
# 打印奇数行的记录
[email protected]:~# awk ‘{if(NR > 1) print }‘ test.txtsecondthirdfourth
其中,NR 是一个内置的变量,表示当前正在处理的记录,即当前的记录是第几个记录。
三、条件语句和我们平常的编程一样,awk 也提供了 if,else,while 等这些条件语句。
例如,打印第二个及其之后的记录:
[email protected]:~# awk ‘{if( < "s") print ; else print }‘ test.txt# 如果第一个字段小于“s",则打印第一个字段,否则打印第二个字段MyMyMyMy[email protected]:~# awk ‘{if( > "s") print ; else print }‘ test.txtfirstsecondthirdfourth[email protected]:~# awk ‘{if( < "l") print ; else print }‘ test.txtMyMyMyMy[email protected]:~# awk ‘{if( > "l") print ; else print }‘ test.txtfirstsecondthirdfourth[email protected]:~# awk ‘{if( > "c") print ; else print }‘ test.txtfirstsecondthirdfourth[email protected]:~# awk ‘{if( > "d") print ; else print }‘ test.txtfirstsecondthirdfourth[email protected]:~# awk ‘{if( > "p") print ; else print }‘ test.txtfirstsecondthirdfourth[email protected]:~# awk ‘{if( < "p") print ; else print }‘ test.txtMyMyMyMy[email protected]:~# awk ‘{if( < "s") print ; else print }‘ test.txtlanguage:Pythonlanguage:Shelllanguage:Javalanguage:C[email protected]:~# awk ‘{if( < "s") print ; else print }‘ test.txtlanguage:Pythonsecondthirdlanguage:C[email protected]:~# awk ‘{if( < "s") print ; else print }‘ test.txtMysecondthirdMy
注意,上面的字段分隔符是空格了,并且 if 语句是在“{}” 里指定的。
再看一个例子:
tolower():字符转为小写。toupper():字符转为大写length():返回字符串长度。substr():返回子字符串。sqrt():平方根。rand():随机数。四、函数
awk 提供了一些内置函数来供我们使用,一下常用的函数如下:
[email protected]:~# awk ‘{print toupper()}‘ test.txtMYMYMYMY[email protected]:~# awk ‘{print tolower()}‘ test.txtmymymymy[email protected]:~# awk -F ‘:‘ ‘{print toupper()}‘ test.txtPYTHONSHELLJAVAC[email protected]:~# awk -F ‘:‘ ‘{print tolower()}‘ test.txtpythonshelljavac
NR:表示当前处理的是第几行NF:表示当前行有多少个字段filename:当前文件名FS:字段分隔符,默认是空格和制表符。RS:行分隔符,用于分割每一行,默认是换行符。OFS:输出字段的分隔符,用于打印时分隔字段,默认为空格。ORS:输出记录的分隔符,用于打印时分隔记录,默认为换行符。五、变量
刚才我们说 NR 是一个表示当前正在处理的记录是第几个记录的内置变量,常用的内置变量如下:
[email protected]:~# awk ‘{print $NF}‘ test.txtlanguage:Pythonlanguage:Shelllanguage:Javalanguage:C
例如我们要打印每一个记录的最后一个字段,就可以使用变量 NF 了。
[email protected]:~# awk ‘{print NR ". " }‘ test.txt1. My first language:Python2. My second language:Shell3. My third language:Java4. My fourth language:C
对了,刚才那个 NR 的变量也是挺好用的,例如:
总结以上是内存溢出为你收集整理的awk的强大 *** 作全部内容,希望文章能够帮你解决awk的强大 *** 作所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)