Linux下如何对目录中的文件进行统计

Linux下如何对目录中的文件进行统计,第1张

在本文中,将展示几种查找 Linux 目录中的文件数量的不同方法。

统计目录中的文件数量

统计目录中文件的最简单方法是使用ls每行列出一个文件,并将输出通过管道符传递给wc计算数量:

[root@localhost ~]# ls -1U /etc |wc -l

执行上面的 命令 将显示所有文件的总和,包括目录和符号链接。-1选项表示每行列出一个文件,-U告诉ls不对输出进行排序,这使 命令 的执行速度更快。ls -1U命令不计算隐藏文件。如果只想计算文件而不包括目录,请使用以下命令:

[root@localhost ~]# ls -1Up /etc |grep -v /|wc -l

-p选项强制ls将斜杠(/)指示符附加到目录。输出结果通过管道符传递到grep -v命令,排除包含斜杠的行,并计算数量。

为了更好地控制列出的文件,使用find命令而不是ls:

[root@localhost ~]# find /etc -maxdepth 1 -type f |wc -l

-type f选项告诉find仅列出文件(包括隐藏文件),-maxdepth 1将搜索限制到第一级目录。

递归统计目录中的文件

如果想要统计目录中的文件数量,并包括子目录中的,可以使用find命令:

[root@localhost ~]# find /etc -type f|wc -l

用来统计文件的另一个命令是tree,它以树状格式列出目录的内容:

[root@localhost ~]# yum -y install tree

[root@localhost ~]# tree /root

输出的内容底部会显示有多少目录,和多少文件。

总结

在本文中,将展示几种查找Linux目录中的文件数量的不同方法。

一、行数统计方法

1、系统命令:wc -l filename

2、grep方法:grep -c "" filename

3、sed方法:sed -n '$=' filename

4、awk方法:awk 'END{print NR}' filename

参考文件

如上图,某个服务器的日志文件,通过命令

grep "Send kafka Success" 2021-08-01-info.log | grep "result_size:100"

可以得到相关日志。现在要求统计所有result_size累加的结果。

grep "Send kafka Success" 2021-08-01-info.log | grep -o -E "result_size:[0-9]+" | awk -F ':' 'BEGIN{print "开始统计result_size累加和"} {sumSize+=$2 } END{print "sumSize="sumSize}'

sed 命令可以很好的进行行匹配,但从某一行中精确匹配某些内容,则使用 grep 命令并辅以 -o 和 -E 选项可达到此目的。其中 -o 表示“only-matching”,即“仅匹配”之意。光用它不够,配合 -E 选项使用扩展正则表达式则威力巨大。

比如下面有一条文本 tmp.txt ,其中内容为:

{"aid":45,"path":"attachment/Mon_1112/2_1_5728040df3ab346.jpg"}

我们想从中过略出 aid 的值即 45 ,那么可以先如下这么做:

grep -o -E 'aid":[1-9]*' tmp.txt

得到的结果为:

aid":45

这时就好办了,我们可以使用 awk 的 -F 选项指示出冒号分隔符,这样就容易过滤出 45 这个值来,整个命令综合如下:

grep -o -E 'aid":[1-9]*' tmp.txt |awk-F: '{print $2}'

参考文档: https://www.cnblogs.com/hanxing/p/8711705.html


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7281626.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-03
下一篇 2023-04-03

发表评论

登录后才能评论

评论列表(0条)

保存