我已经阅读并尝试了找到HERE的选项,其中提出了以下内容:
$awk -v N=`cat file | wc -l` 'rand()<3000/N' file
如果你想随机选择,效果很好.
但是,是否可以更改此awk以将一个文件拆分为两个80/20(或任何其他)比例的文件?
解决方法 随着gawk,你会写gawk ' BEGIN {srand()} {f = filename (rand() <= 0.8 ? ".80" : ".20"); print > f}' file
例:
seq 100 > 100.txtgawk 'BEGIN {srand()} {f = filename (rand() <= 0.8 ? ".80" : ".20"); print > f}' 100.txtwc -l 100.txt*
100 100.txt 23 100.txt.20 77 100.txt.80200 total总结
以上是内存溢出为你收集整理的具有特定比例的随机拆分文件全部内容,希望文章能够帮你解决具有特定比例的随机拆分文件所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)