我有一个主文件:
...17,466971 0,095185 17,562156 ID 67617,096694 17,563665 ID 67717,09816 17,565131 ID 67817,099625 17,566596 ID 67917,101091 17,568062 ID 68017,016175 17,483146 ID 68117,101793 17,568764 ID 68217,10253 17,569501 ID 68338,166772 0,08125 38,248022 ID 157238,082545 38,249317 ID 157338,233772 0,005457 38,239229 ID 157438,082113 38,315885 ID 157538,299771 0,081412 38,381183 ID 157638,006282 38,306053 ID 157738,083627 38,383398 ID 157838,085093 38,384864 ID 157938,008682 38,308453 ID 158038,085094 38,384865 ID 1581...
我想基于这个其他文件,最后一列(ID)来抑制/删除一些行:
...d 17.483146 1 0 udp 181 ------- 1 19.0 2.0 681d 38.239229 1 0 udp 571 ------- 1 19.0 2.0 1574d 38.306053 1 0 udp 1000 ------- 1 19.0 2.0 1577d 38.308453 1 0 udp 1000 ------- 1 19.0 2.0 1580d 38.372207 1 0 udp 546 ------- 1 19.0 2.0 1582d 38.441845 1 0 udp 499 ------- 1 19.0 2.0 1585d 38.505262 1 0 udp 616 ------- 1 19.0 2.0 1586d 38.572324 1 0 udp 695 ------- 1 19.0 2.0 1588d 38.639246 1 0 udp 597 ------- 1 19.0 2.0 1590d 38.639758 1 0 udp 640 ------- 1 19.0 2.0 1591 ...
对于上面的示例,结果将是:
17,483146 ID 68017,384865 ID 1581
删除的行是:
17,568062 ID 68138,308453 ID 1580
是否有使用awk的命令使其自动化?
先感谢您
解决方法 这是使用awk的一种方式:awk 'FNR==NR { a[$NF]; next } !($NF in a)' other main
结果:
17,384865 ID 1581
删除感叹号以显示“已删除”行:
awk 'FNR==NR { a[$NF]; next } $NF in a' other main
结果:
17,483146 ID 68138,308453 ID 1580
或者,如果您想要两个文件,一个包含值’present’而另一个包含值’deleted’,请尝试:
awk 'FNR==NR { a[$NF]; next } { print > ($NF in a ? "deleted" : "present") }' other main
Explanation1:
FNR == NR {…}是一种常用的构造,仅对参数列表中的第一个文件返回true.在这种情况下,awk将首先读取文件’other’.处理此文件时,最后一列($NF)中的值将添加到数组(我们称之为a).然后跳过处理剩下的代码.一旦读取了第一个文件,FNR将不再等于NR,因此awk将被“允许”跳过FNR – NR {…}块并开始处理应用于该文件的剩余代码.参数列表中的第二个文件’main’.例如,如果$NF不在数组中,则!(a中的$NF)将不会打印该行.
说明2:
关于哪一列,您可能会发现这有用:
# the first column # the second column # the third column$NF # the last column$(NF-1) # the second last column$(NF-2) # the third last column总结
以上是内存溢出为你收集整理的awk:使用文件过滤另一个文件(out.tr)全部内容,希望文章能够帮你解决awk:使用文件过滤另一个文件(out.tr)所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)