linux– 从文件夹中的所有tsv文件中提取前三列

linux– 从文件夹中的所有tsv文件中提取前三列,第1张

概述我在一个文件夹中有几个tsv文件,总计超过50 GB.为了在将这些文件加载​​到R中时使内存更容易,我想只提取这些文件的前3列.如何在终端中一次性提取所有文件的列?我正在运行Ubuntu 16.04.最佳答案像下面这样的东西应该工作:#!/bin/bash FILES=/path/to/* for f in $FILES do # Do someth

我在一个文件夹中有几个tsv文件,总计超过50 GB.为了在将这些文件加载​​到R中时使内存更容易,我想只提取这些文件的前3列.

如何在终端中一次性提取所有文件的列?我正在运行Ubuntu 16.04.

最佳答案像下面这样的东西应该工作:

#!/bin/bashfileS=/path/to/*for f in $fileSdo    # Do something for each file. In our case,just echo the first three fIElds:    cut -f1-3 < "$f"done

(有关在bash中迭代文件的更多信息,请参阅this webpage.)

M. Becerra的答案包含一个单行程序,其中使用find命令可以实现相同的目的.因此,除非您希望对每个文件进行额外的处理(例如,在迭代文件时构造一些统计信息),否则我自己的答案可能被认为比必要的更复杂.

编辑:如果要覆盖实际文件,可以使用类似以下脚本的内容:

#!/bin/bashfileS=/path/to/*for f in $fileSdo    # Do something for each file. In our case,echo the first three fIElds to a new file,and rename the new file to the original file:    cut -f1-3 < "$f" > "$f.tmp"    rm "$f"    mv "$f.tmp" "$f"done

剪切线将其输出写入原始文件名,并附加.tmp;以下两行删除原始文件并将新文件重命名为原始文件名. 总结

以上是内存溢出为你收集整理的linux – 从文件夹中的所有tsv文件中提取前三列全部内容,希望文章能够帮你解决linux – 从文件夹中的所有tsv文件中提取前三列所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/1047296.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-25
下一篇 2022-05-25

发表评论

登录后才能评论

评论列表(0条)

保存