可是,如果我们去掉重复行之后,还想保留文件原有的顺序,该怎么办呢?
虽然 Linux 下有个看上去似乎很有用的命令叫uniq,但事实上 uniq 命令仅仅只对连续的重复行有效。
如果不排序,直接使用 uniq 命令是没有用的;使用 sort -u 的话,我们就丢失了文件原有的行的顺序了。
一个终极的解决方案是使用 awk:
简要解释一下:awk 的基本执行流程是,对文件的每一行,做一个指定的逻辑判断,如果逻辑判断成立,则执行指定的命令;如果逻辑判断不成立,则直接跳过这一行。
我们这里写的 awk 命令是!x[$0]++,意思是,首先创建一个 map 叫x,然后用当前行的全文$0作为 map 的 key,到 map 中查找相应的 value,如果没找到,则整个表达式的值为真,可以执行之后的语句;如果找到了,则表达式的值为假,跳过这一行。
由于表达式之后有++,因此如果某个 key 找不到对应的 value,该++ *** 作会先把对应的 value 设成 0,然后再自增成 1,这样下次再遇到重复的行的时候,对应的 key 就能找到一个非 0 的 value 了。
我们前面说过,awk 的流程是先判断表达式,表达式为真的时候就执行语句,可是我们前面写的这个 awk 命令里只有表达式,没有语句,那我们执行什么呢?原来,当语句被省略的时候,awk 就执行默认的语句,即打印整个完整的当前行。就这样,我们通过这个非常简短的 awk 命令实现了去除重复行并保留原有文件顺序的功能。
用vi打开编辑,dd是删除一行,其他快捷 *** 作有:光标控制命令
命令光标移动
h或^h向左移一个字符
j或^j或^n向下移一行
k或^p向上移一行
l或空格 向右移一个字符
G移到文件的最后一行
nG 移到文件的第n行
w移到下一个字的开头
W移到下一个字的开头,忽略标点符号
b移到前一个字的开头
B移到前一个字的开头,忽略标点符号
L移到屏幕的最后一行
M移到屏幕的中间一行
H移到屏幕的第一行
e移到下一个字的结尾
E移到下一个字的结尾,忽略标点符号
(移到句子的开头
)移到句子的结尾
{移到段落的开头
}移到下一个段落的开头
0或| 移到当前行的第一列
n| 移到当前行的第n列
^移到当前行的第一个非空字符
$移到当前行的最后一个字符
+或return移到下一行的第一个字符
-移到前一行的第一个非空字符
在vi中添加文本
命令 插入动作
a在光标后插入文本
A在当前行插入文本
i在光标前插入文本
I在当前行前插入文本
o在当前行的下边插入新行
O在当前行的上边插入新行
:r file 读入文件file内容,并插在当前行后
:nr file 读入文件file内容,并插在第n行后
escape 回到命令模式
^v char 插入时忽略char的指定意义,这是为了插入特殊字符
在vi中删除文本
命令 删除 *** 作
x删除光标处的字符,可以在x前加上需要删除的字符数目
nx 从当前光标处往后删除n个字符
X删除光标前的字符,可以在X前加上需要删除的字符数目
nX 从当前光标处往前删除n个字符
dw 删至下一个字的开头
ndw 从当前光标处往后删除n个字
dG 删除行,直到文件结束
dd 删除整行
ndd 从当前行开始往后删除
db 删除光标前面的字
ndb 从当前行开始往前删除n字
:n,md从第m行开始往前删除n行
d或d$从光标处删除到行尾
dcursor_command 删除至光标命令处,如dG将从当产胆行删除至文件的末尾
^h或backspace插入时,删除前面的字符
^w 插入时,删除前面的字
修改vi文本
每个命令前面的数字表示该命令重复的次数
命令 替换 *** 作
rchar用char替换当前字符
R text escape用text替换当前字符直到换下Esc键
stext escape 用text代替当前字符
S或cctext escape 用text代替整行
cwtext escape将当前字改为text
Ctext escape 将当前行余下的改为text
cG escape修改至文件的末尾
ccursor_cmd text escape 从当前位置处到光标命令位置处都改为text
在vi中查找与替换
命令 查找与替换 *** 作
/text在文件中向前查找text
?text在文件中向后查找text
n在同一方向重复查找
N在相反方向重复查找
ftext在当前行向前查找text
Ftext在当前行向后查找text
ttext在当前行向前查找text,并将光标定位在text的第一个字符
Ttext在当前行向后查找text,并将光标定位在text的第一个字符
:set ic 查找时忽略大小写
:set noic查找时对大小写敏感
:s/oldtext/newtext 用newtext替换oldtext
:m,ns/oldtext/newtext在m行通过n,用newtext替换oldtext
& 重复最后的:s命令
:g/text1/s/text2/text3 查找包含text1的行,用text3替换text2
:g/text/command 在所有包含text的行运行command所表示的命令
:v/text/command 在所有不包含text的行运行command所表示的命令
在vi中复制文本
命令 复制 *** 作
yy 将当前行的内容放入临时缓冲区
nyy 将n行的内容放入临时缓冲区
p将临时缓冲区中的文本放入光标后
P将临时缓冲区中的文本放入光标前
dsfsd "(a-z)nyy 复制n行放入名字为圆括号内的可命名缓冲区,省略n表示当前行
"(a-z)ndd删除n行放入名字为圆括号内的可命名缓冲区,省略n表示当前行
"(a-z)p 将名字为圆括号的可命名缓冲区的内容放入当前行后
"(a-z)P 将名字为圆括号的可命名缓冲区的内容放入当前行前
在vi中撤消与重复
命令 撤消 *** 作
u撤消最后一次修改
U撤消当前行的所有修改
.重复最后一次修改
,以相反的方向重复前面的f、F、t或T查找命令
重复前面的f、F、t或T查找命令
"np 取回最后第n次的删除(缓冲区中存有一定次数的删除内容,一般为9)
n重复前面的/或?查找命令
N以相反方向重复前面的/或?命令
保存文本和退出vi
命令 保存和/或退出 *** 作
:w 保存文件但不退出vi
:w file 将修改保存在file中但不退出vi
:wq或ZZ或:x 保存文件并退出vi
:q! 不保存文件,退出vi
:e! 放弃所有修改,从上次保存文件开始再编辑
vi中的选项
选项 作用
:set all 打印所有选项
:set nooption关闭option选项
:set nu 每行前打印行号
:set showmode显示是输入模式还是替换模式
:set noic查找时忽略大小写
:set list显示制表符(^I)和行尾符号
:set ts=8为文本输入设置tab stops
:set window=n设置文本窗口显示n行
vi的状态
选项 作用
:.= 打印当前行的行号
:= 打印文件中的行数
^g 显示文件名、当前的行号、文件的总行数和文件位置的百分比
:l 使用字母"l"来显示许多的特殊字符,如制表符和换行符
在文本中定位段落和放置标记
选项 作用
{在第一列插入{来定义一个段落
[[ 回到段落的开头处
]] 向前移到下一个段落的开头处
m(a-z) 用一个字母来标记当前位置,如用mz表示标记z
'(a-z) 将光标移动到指定的标记,如用'z表示移动到z
在vi中连接行
选项 作用
J将下一行连接到当前行的末尾
nJ 连接后面n行
光标放置与屏幕调整
选项 作用
H将光标移动到屏幕的顶行
nH 将光标移动到屏幕顶行下的第n行
M将光标移动到屏幕的中间
L将光标移动到屏幕的底行
nL 将光标移动到屏幕底行上的第n行
^e(ctrl+e) 将屏幕上滚一行
^y 将屏幕下滚一行
^u 将屏幕上滚半页
^d 将屏幕下滚半页
^b 将屏幕上滚一页
^f 将屏幕下滚一页
^l 重绘屏幕
z-return 将当前行置为屏幕的顶行
nz-return将当前行下的第n行置为屏幕的顶行
z. 将当前行置为屏幕的中央
nz. 将当前行上的第n行置为屏幕的中央
z- 将当前行置为屏幕的底行
nz- 将当前行上的第n行置为屏幕的底行
vi中的shell转义命令
选项 作用
:!command执行shell的command命令,如:!ls
:!! 执行前一个shell命令
:r!command 读取command命令的输入并插入,如:r!ls会先执行ls,然后读入内容
:w!command 将当前已编辑文件作为command命令的标准输入并执行command命令,如:w!grep all
:cd directory将当前工作目录更改为directory所表示的目录
:sh 将启动一个子shell,使用^d(ctrl+d)返回vi
:so file 在shell程序file中读入和执行命令
vi中的宏与缩写
(避免使用控制键和符号,不要使用字符K、V、g、q、v、*、=和功能键)
选项 作用
:map key command_seq 定义一个键来运行command_seq,如:map e ea,无论什么时候都可以e移到一个字的末尾来追加文本
:map 在状态行显示所有已定义的宏
:umap key删除该键的宏
:ab string1 string2 定义一个缩写,使得当插入string1时,用string2替换string1。当要插入文本时,键入string1然后按Esc键,系统就插入了string2
:ab 显示所有缩写
:una string 取消string的缩写
在vi中缩进文本
选项 作用
^i(ctrl+i)或tab 插入文本时,插入移动的宽度,移动宽度是事先定义好的
:set ai 打开自动缩进
:set sw=n将移动宽度设置为n个字符
nn>> 使n行都向右移动一个宽度,例如3>>就将接下来的三行每行都向右移动一个移动宽度
用uniq,如下,将 1.txt 中 所有 "相邻" 重复行合并成一行,结果存入 2.txt
uniq 1.txt > 2.txt如果是想将相邻重复行彻底删掉(而不是合并成一行),可以用
uniq -u 1.txt > 2.txt欢迎分享,转载请注明来源:内存溢出
评论列表(0条)