awk的强大 *** 作_系统运维

概述awk是一种用于处理文本、模式匹配的编程语言。与sed和grep，俗称Linux下的三剑客。学会 awk 等于你在 Linux 命令行里，又多了一种处理文本的选择。这篇文章重点教你如何使用，看完这篇文章，就大致知道如何使用了，力求简单使用。术语铺垫在awk的文本处理规则里，awk将文本文件视为由字段和记录组成的文本数据库。默认情况下，awk将每一行视为一个记录，也就是说记录的分隔符是，记录的 awk是一种用于处理文本、模式匹配的编程语言。与sed和grep，俗称linux下的三剑客。学会 awk 等于你在 linux 命令行里，又多了一种处理文本的选择。这篇文章重点教你如何使用，看完这篇文章，就大致知道如何使用了，力求简单使用。
术语铺垫
在awk的文本处理规则里，awk将文本文件视为由字段和记录组成的文本数据库。默认情况下，awk将每一行视为一个记录，也就是说记录的分隔符是，记录的分隔符可以通过内置变量RS更改。

在每一个记录中，又把记录分为若干个字段，即记录由字段组成，而字段的默认分隔符为空格或制表符。

一、基础用法
和我们平常使用的 linux 命令一样， awk 也是遵循着某种格式来使用，格式如下：

使用格式

awk 执行的事件文件

例如：

[email protected]:~# awk ‘{print $0}‘ test.txt
My first language:Python
My second language:Shell
My third language:Java
My fourth language:C
其中，print 表示打印，$0 表示一整个记录，test.txt 表示一个文件。所以

awk ‘{print $0}‘ test.txt

表示把 test.txt 文件里面的每行记录都打印出来。

$0 表示整个记录，不过 $1,$2,$3.....则表示整个记录中的第一个字段，第二个字段......。

[email protected]:~# awk ‘{print $1}‘ test.txt
My
My
My
My
[email protected]:~# awk ‘{print $2}‘ test.txt
first
second
third
fourth
[email protected]:~# awk ‘{print $3}‘ test.txt
language:Python
language:Shell
language:Java
language:C
刚才我们说字段的默认分隔符是空格或者制表符这些，默认意味着我们可以自己显式着指定分隔符。下面我们用“：”来作为我们的分隔符吧。

[email protected]-virtual-machine:~# awk -F ‘:‘ ‘{print $2}‘ test.txt
Python
Shell
Java
C
上面我们用参数 -F 指定了我们的分隔符，即如果想要指定字段的分隔符，可以用参数 -F 指定分隔符。

二、条件限制
在打印文本的时候，我们可以指定一些条件。格式如下：

awk 参数条件要执行的动作文件

例如我们指定分隔符为“：”，条件为第二个字段为"Java"的记录。

打印第二个字段为"Java"的文本

[email protected]:~# awk -F ‘:‘ ‘$2 == "Java" {print $2}‘ test.txt
Java
打印奇数行的的第二个字段：

打印奇数行的记录

[email protected]:~# awk -F ‘:‘ ‘NR % 2 == 1 {print $2}‘ test.txt
Python
Java
其中，NR 是一个内置的变量，表示当前正在处理的记录，即当前的记录是第几个记录。

三、条件语句
和我们平常的编程一样，awk 也提供了 if,else,while 等这些条件语句。

例如，打印第二个及其之后的记录：

[email protected]:~# awk ‘{if(NR > 1) print $2}‘ test.txt
second
third
fourth
注意，上面的字段分隔符是空格了，并且 if 语句是在“{}” 里指定的。

再看一个例子：

[email protected]:~# awk ‘{if($1 < "s") print $1; else print $2}‘ test.txt

如果第一个字段小于“s",则打印第一个字段，否则打印第二个字段

My
My
My
My
[email protected]:~# awk ‘{if($1 > "s") print $1; else print $2}‘ test.txt
first
second
third
fourth
[email protected]:~# awk ‘{if($1 < "l") print $1; else print $2}‘ test.txt
My
My
My
My
[email protected]:~# awk ‘{if($1 > "l") print $1; else print $2}‘ test.txt
first
second
third
fourth
[email protected]:~# awk ‘{if($1 > "c") print $1; else print $2}‘ test.txt
first
second
third
fourth
[email protected]:~# awk ‘{if($1 > "d") print $1; else print $2}‘ test.txt
first
second
third
fourth
[email protected]:~# awk ‘{if($1 > "p") print $1; else print $2}‘ test.txt
first
second
third
fourth
[email protected]:~# awk ‘{if($1 < "p") print $1; else print $2}‘ test.txt
My
My
My
My
[email protected]:~# awk ‘{if($3 < "s") print $3; else print $2}‘ test.txt
language:Python
language:Shell
language:Java
language:C
[email protected]:~# awk ‘{if($2 < "s") print $3; else print $2}‘ test.txt
language:Python
second
third
language:C
[email protected]:~# awk ‘{if($2 < "s") print $1; else print $2}‘ test.txt
My
second
third
My
四、函数
awk 提供了一些内置函数来供我们使用，一下常用的函数如下：

tolower()：字符转为小写。
toupper()：字符转为大写
length()：返回字符串长度。
substr()：返回子字符串。
sqrt()：平方根。
rand()：随机数。
[email protected]:~# awk ‘{print toupper($1)}‘ test.txt
MY
MY
MY
MY
[email protected]:~# awk ‘{print tolower($1)}‘ test.txt
my
my
my
my
[email protected]:~# awk -F ‘:‘ ‘{print toupper($2)}‘ test.txt
PYTHON
SHELL
JAVA
C
[email protected]:~# awk -F ‘:‘ ‘{print tolower($2)}‘ test.txt
python
shell
java
c
五、变量
刚才我们说 NR 是一个表示当前正在处理的记录是第几个记录的内置变量，常用的内置变量如下：

NR：表示当前处理的是第几行
NF：表示当前行有多少个字段
filename：当前文件名
FS：字段分隔符，默认是空格和制表符。
RS：行分隔符，用于分割每一行，默认是换行符。
OFS：输出字段的分隔符，用于打印时分隔字段，默认为空格。
ORS：输出记录的分隔符，用于打印时分隔记录，默认为换行符。
例如我们要打印每一个记录的最后一个字段，就可以使用变量 NF 了。

[email protected]:~# awk ‘{print $NF}‘ test.txt
language:Python
language:Shell
language:Java
language:C
对了，刚才那个 NR 的变量也是挺好用的，例如：

[email protected]:~# awk ‘{print NR ". " $0}‘ test.txt

My first language:Python My second language:Shell My third language:Java My fourth language:C 总结

以上是内存溢出为你收集整理的awk的强大 *** 作全部内容，希望文章能够帮你解决awk的强大 *** 作所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/1030988.html