xargs命令_Linux xargs命令:一个给其他命令传递参数的过滤器

xargs命令_Linux xargs命令:一个给其他命令传递参数的过滤器,第1张

概述本文要为大家介绍的命令是 xargs,我们把它称为护花使者,因为它总是乐于协助其他的命令来完成一些事情。下面一起来看看它是如何护花的。 xargs 是 execute arguments 的缩写,它的作用是 本文要为大家介绍的命令是 xargs,我们把它称为护花使者,因为它总是乐于协助其他的命令来完成一些事情。下面一起来看看它是如何护花的。

xargs 是 execute arguments 的缩写,它的作用是从标准输入中读取内容,并将此内容传递给它要协助的命令,并作为那个命令的参数来执行。

坊间有一种说法,将 xargs 解读为乘号(x)和参数(args)的合体,很形象地表达了 xargs 的作用所在。

好了,我们一起来见识一下 xargs 的护花本领吧:
#我们用ls命令列出当前路径下的文件,包括3个文件[roc@roclinux ~]$ lschina.txt  usa.txt japan.txt #我们通过xargs + ls的方式列出my.txt文件和your.txt文件[roc@roclinux ~]$ echo "china.txt usa.txt" | xargs lschina.txt usa.txt

可以很清晰地看到,xargs 将 echo 的输出作为自己的标准输入,并且将其传递给了 ls 命令,作为 ls 命令的参数来执行。xargs 和管道不得不说的故事为了能够为大家解释清楚 xargs 和管道的关系,我们这次选用了更加典型的 cat 命令来为大家举例。

为什么选择 cat 命令呢?众所周知,cat 命令可以接收文件名作为参数,执行后会显示出文件的内容。但是 cat 命令不能直接从标准输入接收参数,正如下面的例子:
#cat后面直接指定china.txt参数,可以展示china.txt文件的内容[roc@roclinux ~]$ cat china.txthello beijing #我们尝试通过标准输入把参数传给cat,结果却只是显示了文件名而已[roc@roclinux ~]$ echo china.txt | catchina.txt

从上面的例子中,我们可以得出下面的结论:管道可以实现:将前面的标准输出作为后面的“标准输入”。管道无法实现:将前面的标准输出作为后面的“命令参数”。
这个时候,就要有请 xargs 这位护花使者了。xargs 所擅长的正是“将标准输入作为其指定命令的参数”。说着有些拗口,但我相信大家懂的。
#xargs果然不负众望,协助cat完成了使命[roc@roclinux ~]$ echo china.txt | xargs cathello beijing

我们知道,xargs 会将前一个命令的标准输出转换成命令参数,但很多人可能不知道的是,xargs 的标准输入中出现的“换行符、空格、制表符”都将被空格取代。下面来看一个带有换行符的例子:
#我们准备好了带有换行的标准输入[roc@roclinux ~]$ echo -e "china.txt\njapan.txt"china.txtjapan.txt #可见,换行符和空格的作用一样[roc@roclinux ~]$ echo -e "china.txt\njapan.txt" | xargs cathello beijinghello tokyo

上面的例子是一个比较简单的场景,我们有时还会遇到更棘手的情况,一起来看一看。

当命令参数中包含了空格时,情况就会复杂很多,一起来看一个示例。
#我们创建了3个日志文件,且故意让文件名称中都含有空格[roc@roclinux ~]$ for((i=0;i<3;i++)); do touch "test ${i}.log";done #我们列出创建的文件[roc@roclinux ~]$ ls -1Ftest 0.logtest 1.logtest 2.log #我们来运行xargs命令,发现报错了[roc@roclinux ~]$  find . -name '*.log' -print | xargs rmrm: cannot remove ‘./test’: No such file or directoryrm: cannot remove ‘1.log’: No such file or directoryrm: cannot remove ‘./test’: No such file or directoryrm: cannot remove ‘0.log’: No such file or directoryrm: cannot remove ‘./test’: No such file or directoryrm: cannot remove ‘2.log’: No such file or directory

我们在当前目录中创建了 3 个文件,文件名中间都含有空格。但当 find 命令获取到的文件名经过 xargs 传送给 rm 命令时,文件“./test 1.log”就变成了“./test”和“1.log”两个文件了。即原本 3 个文件名刹那间就变成了 6 个文件名,而这 6 个文件其实并不存在,从而引发了错误。

这个错误的根源就在于 xargs 默认的分隔符是空格,如果我们能将 xargs 的分隔符改成其他符号,问题就迎刃而解了!

xargs 提供了-0选项,允许将 NulL 作为分隔符,而 find 命令也心有灵犀地提供了对应的选项来产生以 NulL 字符作为分隔符的输出。

find 命令提供的对应方法是 -print0 选项,在文件名之后输出 NulL,而不像 -print 选项那样输出换行符(换行符会被 xargs 替换成空格)。

正如我们所期待的,命令果然正常执行了,完美!
[roc@roclinux ~]$ find . -name '*.log' -print0 | xargs -0 rm -f

对了,要补充一点,xargs 的-0选项不仅可以将分隔符从默认的空格变成 NulL,还会将单引号、双引号、反斜线等统统默认为是普通字符。所以说,-0选项特别适合处理命令参数中含有引号、空格、反斜线的情况。

如果你是一位 GEEK,希望掌握得更深入,那么我们就再补充一个知识点。除了可以使用-0选项外,其实还可以使用-d选项来指定任何一个符号作为分隔符。只是我们要格外慎重,避免我们所设定的那个分隔符恰好是我们命令参数中所包含的字符,那就会导致非预期的结果了。让护花使者听我们的话如果在前一个命令的标准输出中,会有一些参数是你不希望或者不确定是否要传送给后面命令的,这个时候我们就希望 xargs 在传送参数前和我们确认一下。而-p选项恰好可以实现这个愿望,我们可以输入 y 或者 n 来选择是否要执行当前命令:
[roc@roclinux ~]$ find . -type f |xargs -p rm -frm -f ./china.txt ./usa.txt ./japan.txt ?...n

上面的命令中,我们输入了“n”,也就是不希望删除这三个文件。不过,这样的确认粒度太粗,我们希望的是更精细地确认,来试试-n选项吧:
[roc@roclinux 20160408]$ find . -type f |xargs -p -n 1 rm -frm -f ./china.txt ?...nrm -f ./usa.txt ?...yrm -f ./japan.txt ?...n

使用-n选项,可以让 xargs 每次只处理 1 个参数,这样做的好处是避免一次性删除过多文件,万一误删了不该删除的文件,那麻烦就大了。遇到就停止xargs 已经足够优秀了,可以帮助我们处理各种各样的问题。但我们对 xargs 还有更加苛刻的要求,那就是当碰到某个特定的命令参数时,要求 xargs 立即终止并退出。

这个效果,我们可以使用-E选项来实现。

比如,我们正在处理一份日志文件 country.List 中的内容,将日志文件中的字符以空行作为分隔符依次 echo 出来,一旦遇到 korea 便终止退出:
[roc@roclinux ~]$ echo "china usa korea japan" > country.List [roc@roclinux ~]$ cat country.Listchina usa korea japan [roc@roclinux ~]$ cat country.List | xargs -E 'korea' echochina usa

可以看到当处理到 korea 的时候,xargs 机警地发现了状况,于是,按照我们的要求,立即终止并退出了。好乖的 xargs 啊!你可能一生都不会遇到的参数过长报错可能很多运维工程师都没有遇到过“Argument List too long”这样的报错。但要想成为一名资深的运维工程师,了解它的原因和解决方法还是很有必要的。

我们来模拟一个这样的场景,新建 10 万个日志文件,并且尝试用 rm 命令一次性删除:
[roc@roclinux ~]$ for((i=0;i<100000;i++)); do touch test${i}.log;done [roc@roclinux ~]$ rm $(find . -type f -name '*.log')-bash: /bin/rm: Argument List too long

出现了“Argument List too long”报错,这说明 rm 可接受的参数长度达到了极限。这其实并非 rm 的错,而是系统限制了参数的长度。通过下面的命令可以查看到系统的参数长度限制值:
[roc@roclinux ~]$ getconf ARG_MAX2621440

如果真的遇到了参数过长的问题,我们的应对方法其实有很多种,比如把文件手工分组以缩短参数的长度,但是这个方法并不优雅,而且费时费力。最优雅的方法当然就是借助 xargs 啦:
[roc@roclinux ~]$ find . -name '*.log' -print | xargs rm

借助 xargs,并利用管道的特性,find 命令将输出的内容分段传给 rm 命令,而不是一股脑儿地塞过去。这样一来,rm 命令可以先处理最先获取的一部分文件,然后再处理下一批,并一直继续下去,直到全部删除为止。

好了,xargs 这位护花使者是不是既聪明又听话呢,在运维过程中,尝试使用起来吧,你会事半功倍的! 总结

以上是内存溢出为你收集整理的xargs命令_Linux xargs命令:一个给其他命令传递参数的过滤器全部内容,希望文章能够帮你解决xargs命令_Linux xargs命令:一个给其他命令传递参数的过滤器所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/1032894.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-24
下一篇 2022-05-24

发表评论

登录后才能评论

评论列表(0条)

保存