Linux文本 *** 作常用命令_系统运维

在Linux系统里常用于文本查看、 *** 作、统计的命令：

通过多敲键盘，形成手感 肌肉记忆 ，熟练掌握这些命令，在以后生信分析中游刃有余。以下是每个命令的详细的介绍（主要是跟着 生信技能树小郭老师 学习做的笔记）

接下来通过示例把10个命令的常用参数和用法展示出来：

参数的用法介绍：

注意事项：

用 cat 命令可以 查看文本 ，也可以 编辑文本 ，编辑文本要加 > 符号，退出时，另起一行，按 control C 退出

zcat可以查看压缩的文本文件，tac逆向查看

结合 管道符| 使用

head / tail -n :查看文件的前 / 后 n 行，默认 10 行（在R语言里head和tail默认是前6行）。

less命令用得最多 ，more命令用得比较少

3.1 less命令

less [参数] 文件名

less命令重要的补充用法1 ：

需要注意退出：只要使用less命令， 按q键

less命令重要的补充用法2 ：

参数用法：

less命令 不加参数 查看文件：

less命令加 -N参数 查看文件：显示行号

less命令加 -S参数 查看文件：单行显示，非常规整

对比：less和cat命令显示文本行号的用法：less -N，cat -n

3.2 more命令

**more ** 逐页查看，按空格翻页，按回车换行 ，more命令一般很少用，熟练掌握less命令就好

查看压缩文件

wc 统计字符是也把换行符统计进去，但是别的命令不一定会把换行符算进去，。

常见参数:

切记：用less命令，按q退出

cut命令是按关键词来切的

常见参数:

排列前：

排列后：

解释：1和0比，1大；7和0比，7大…在sort字典排序里，100816比1737小，所以100816排在前面。

命令行查看一个表格结构时，因为制表符对齐的原因，出现一个错位的现象。还有 字典排序 可能和我们平时的认知不一样，所以 加上-n参数 ， 让数值有数学意义上的大小来排序 。

uniq命令去重，只有两行出现重复，而且是相邻的两行，如果不相邻，即使出现两行一模一样，不会去重。

uniq命令通常和sort命令搭配使用

换其它文件试试

总之，uniq命令使用时经常和sort一起

常见参数:

常见用法1：

paste file1 file2

-s :按行合并 演示

常见用法2 : paste - -

常见参数:

要养成一个好习惯，原始数据不要轻易修改，修改的东西另外保存，文本保存用>(重定向)或是 >>(追加)

1. 用 less 查看 example.gtf ，然后管道符传递给 wc

2. 截取 example.gtf 第 9 列的内容

3. 在第2步的基础上截取分号分割的第1列

4. 在第3步的基础上排序、去重复并统计

5. 在第4步的基础上，将空格替换成制表符

补充小知识 ：

清屏：control L

查看历史（输入过的）命令 ：history

awk、grep、sed是linux文本 *** 作的三大利器，grep适合单纯的查找或文本匹配，sed适合编辑匹配到的文本，awk适合格式化文本，对文本进行较复杂格式处理。

命令格式：grep [option] pattern file 用于过滤/搜索的特定字符，可与正则表达式配合，使用上十分灵活。

命令格式：sed [options] '[地址定界] command' file(s) 用于编辑一个或多个文件, 简化对文件的反复 *** 作。

演示实例：

命令格式：awk [options] 'BEGIN{ action… } pattern{ action… } END{ action… }' file ... 用于在linux下对文本和数据进行处理，数据可以来自一个或多个文件，支持用户自定义函数和动态正则表达式等功能。

演示实例：

a.随机取用户

cat file1 | awk '{ print rand(),$1 }' |sort -k1 |awk '{ print $2 }' |head -4000

b.分组求和

awk '{s[$1] += $2}END{ for(i in s){ print i, s[i] } }' file1 >file2

c.求和

cat data|awk '{sum+=$1} END {print "Sum = ", sum}'

d.求平均

cat data|awk '{sum+=$1} END {print "Average = ", sum/NR}'

e.求标准偏差

cat $FILE | awk -v ave=$ave '{sum+=($1-ave)^2}END{print sqrt(sum/(NR-1))}'

f.列换成行，如果第一列相同，将所有的第二列第三列都放到一行里面

awk '{qq[$1]=qq[$1](" "$2" "$3)}END{for(i in qq)print i,qq[i]}'

g.合并文件，2个文件，每个2列，将他们按照第一列相同的数，来合并成一个三列的文件,同时，将每个文件中针对第一列对应第二列中没有的数补0

awk 'FNR==NR{a[$1]=$2}FNR<NR{a[$1]?a[$1]=a[$1]" "$2:a[$1]=a[$1]" 0 "$2}END{for(i in a)print i,a[i]}' file1 file2 >file3

sed简介：流编辑工具，用来对文本进行过滤与替换 *** 作。

sed流程：sed通过一次仅读取一行内容来对某些指令进行处理后输出。

1、sed通过文件或管道读取文件内容，但sed默认并不直接修改源文件，而是将读入的内容复制到缓冲区中，称之为模式空间。

2、所有的指令 *** 作都是在模式空间找那个进行

3、sed根据相应的指令对模式空间中的内容进行处理并输出结果，默认输出至标准输出（即屏幕上）。

sed基本语法格式：

用法：sed[选项]...{脚本指令}[输入文件]...

选项： -version 显示sed版本

-help ：显示帮助文档

-n,-quiet,-silent静默输出，默认情况下，sed程序在所有的脚本指令执行完毕后，将自动打印模式空间中的内容。

-e script允许多个脚本指令被执行

-f script-file从文件中读取脚本指令，对编写自动化脚本程序很实用

-i ,-in-place 该选项直接修改源文件

-l N 该选项指定l指令可以输出的行长度，l指令为输出非打印字符。

-posix 禁用GNU sed扩展功能。

-r 在脚本指令中使用扩展正则表达式。

-s，-separate 默认情况下，sed将把输入的多个文件名作为一个长的连续的输入流。而GNU sed则允许把它们当作单独的文件。

-u，-unbuffered 最低限度的缓存输入与输出

a，append表示追加指令；

i，insert表示插入指令；

d，delete表示删除指令；

s，substitution表示替换指令。

sed脚本指令的基本格式是：

[地址,即路径]命令（有些命令仅可以对一行 *** 作，有些可以对多行 *** 作），命令也可以用花括号进行组合，使命令序列可以作用于同一个地址。

address{

command1

command2

command3

}

sed的基本工作方式是：

sed的替换命令s：

1、全局替换： s/old/new/g ，其中g为全局替换，用于替换所有出现的次数； /如果和正则匹配的内容冲突可以使用其他符号，如： s@old@new@g

2、标志位

为什么要有多行模式: 配置文件一般有单行出现，但也有使用json或XML格式的配置文件，为多行出现。

多行模式处理命令N、D、P

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/8552090.html

Linux文本 *** 作常用命令

发表评论

评论列表（0条）