linux中的字符截取_系统运维

参考链接： http://c.biancheng.net/view/1120.html

从截去的角度上说，总结为: 左#右%

从截取的角度上说，反过来。

其中，string 表示要截取的字符，chars 是指定的字符（或者子字符串）， * 是通配符的一种，表示任意长度的字符串。

*chars 连起来使用的意思是：忽略左边的所有字符，直到遇见 chars（chars 不会被截取）。

如果希望直到最后一个指定字符（子字符串）再匹配结束，那么可以使用##，具体格式为：

2.使用 % 截取左边字符

使用%号可以截取指定字符（或者子字符串）左边的所有字符，具体格式如下：

请注意 * 的位置，因为要截取 chars 左边的字符，而忽略 chars 右边的字符，所以*应该位于 chars 的右侧。其他方面%和#的用法相同，这里不再赘述，仅举例说明：

（自己）常用的文本文件的行处理命令

示例文件：test.vcf

1、head -n 10 test.vcf

head : 默认是提取文件的前10行，-n 参数可以设定选择文件的前n行

2、tial -n 10 test.vcf

tail : 默认是提取文件的末尾10行， -n 参数可以设定选择文件末尾的n行

3、sed -n '10,20p' test.vcf

sed -n ：随意选择需要查看的行

sed命令是一个面向行处理的编辑器，可以和正则表达式配合使用，附上较全面的sed命令使用教程。

https://man.linuxde.net/sed

4、awk 截取行的指定长度字符串

less test.gz |awk '{if(NR%2==1){print}else{print substr($1,1,75)}}' | gzip -c >test.part.gz

说明：对test.gz文件指定行截取75bp，原来是150bp

5、对n行的第三列求和，求平均值

grep -v ‘#’ test.vcf |sed -n '20,35p' |awk -F '\t' '{sum+=$3n++}END{print sum,sum/n}'

(linux 一行命令计算速度比Python快，简单计算喜欢用linux命令)

记得随时整理使用过的命令，没学过linux，靠着各种帖子，随时需要随时补给，有点懒。

awk 'NR==FNR &&FNR==1 {tmp_date=$0file=FILENAME} NR!=FNR &&FNR==1{if(tmp_date/dev/null`说明：程序有点局限性，要求所有文件的第一个行都需要为日期（格式如：20140303）。若所有文件的第一行都是很规整的，如XXX20140303#####，也可以将程序的中$0替换为日期对应的字段，如说明中的日期在第二个字符，则替换为$2。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/7381708.html

linux中的字符截取

发表评论

评论列表（0条）