具有特定比例的随机拆分文件

具有特定比例的随机拆分文件,第1张

概述我想随机80/20使用awk拆分文件. 我已经阅读并尝试了找到HERE的选项,其中提出了以下内容: $awk -v N=`cat FILE | wc -l` 'rand()<3000/N' FILE 如果你想随机选择,效果很好. 但是,是否可以更改此awk以将一个文件拆分为两个80/20(或任何其他)比例的文件? 随着gawk,你会写 gawk ' BEGIN {srand()} 我想随机80/20使用awk拆分文件.

我已经阅读并尝试了找到HERE的选项,其中提出了以下内容:

$awk -v N=`cat file | wc -l` 'rand()<3000/N' file

如果你想随机选择,效果很好.

但是,是否可以更改此awk以将一个文件拆分为两个80/20(或任何其他)比例的文件?

解决方法 随着gawk,你会写

gawk '    BEGIN {srand()}    {f = filename (rand() <= 0.8 ? ".80" : ".20"); print > f}' file

例:

seq 100 > 100.txtgawk 'BEGIN {srand()} {f = filename (rand() <= 0.8 ? ".80" : ".20"); print > f}' 100.txtwc -l 100.txt*
100 100.txt 23 100.txt.20 77 100.txt.80200 total
总结

以上是内存溢出为你收集整理的具有特定比例的随机拆分文件全部内容,希望文章能够帮你解决具有特定比例的随机拆分文件所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/1027632.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-23
下一篇 2022-05-23

发表评论

登录后才能评论

评论列表(0条)

保存