Linux shell awk怎么去除行内，重复列？_系统运维

awk -F"[-，]" '{for(i=1i<=NFi++)a[$i,NR]++}{for(j in a){split(j,b,SUBSEP)if(b[2]==NR)printf b[1]" "} printf "\n"}' 关键词.txt >去除重复后.txt

以此例测试通过。

关于awk二维数组的使用：

awk的多维数组在本质上是一维数组，更确切一点，awk在存储上并不支持多维数组。awk提供了逻辑上模拟二维数组的访问方式。例如，array[2,4] = 1这样的访问是允许的。awk使用一个特殊的字符串SUBSEP (\034)作为分割字段，在上面的例子中，关联数组array存储的键值实际上是2\0344。

类似一维数组的成员测试，多维数组可以使用 if ( (i,j) in array)这样的语法，但是下标必须放置在圆括号中。

类似一维数组的循环访问，多维数组使用 for ( item in array )这样的语法遍历数组。与一维数组不同的是，多维数组必须使用split()函数来访问单独的下标分量。split ( item, subscr, SUBSEP)。

楼上 uniq必须是连续的重复才行把

用awk肯定行

这是一个cu的精华帖，差不多，对于你的问题你给稍等我修改一下。（ps感谢红袖添香大姐）

CU精华经典回顾

#假设我有如下文件：

#cat aa

#123 def1 456

#345 def2 812

#123 def3 563

#322 def4 684

#123 def5 879

#......................

#现在我想把第一列中字段相同的合并，第一列不相同的则保留，合并的原则就是保留第一个出现的前两个字段，第三个字段则把结果相加，以上面的示例为例：

#就是对于123开头的需要合并，合并后应该成为如下：

#cat aa

#123 def1 1898

#345 def2 812

#322 def4 684

#请问用shell如何实现？

#希望各位帮助！，谢谢！！

#要求总结：

#1 合并相同的第一列数据，并且计算第三列和

#2 第二列只保留第一次出现

#3 第一列顺序不变

觉得这个问题很经典，所以从CU论坛转过来了。

请大家一起学习

我们站在巨人的肩膀上。

问题补充：

看不太懂实现可以讲一下思路吗？

a[$1]+=$3

if(length(b[$1])==0)b[$1]=$2

我是这样做的

－－－－－－－－－－－－－－－－－－－－－－－－－－2

谢谢你的补充，已经明白了你对split的适用技巧，是用split(a[$1],tmp)在碰到匹配的$1时取出以前的统计结然后再用$3加上以前的结果是吧，很巧妙。谢谢

但是有2个问题：

1不满足第二列保留第一次出现记录（现在是保留最后一次出现）

2不满足第一列按照原来文件顺序出现

看看这个

awk 'BEING{n=0}

{

a[$1]+=$3

if(length(b[$1])==0)b[$1]=$2

if($1 in ind)next

ind[$1]

key[n]=$1

n++

}

END{

for(i in key)print key[i],b[key[i]],a[key[i]]

}' filename

＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃

这样就行了

#!/bin/bash

awk 'BEGIN{n=0}

{

if($0 in a)next

a[$0]

b[n]=$0

n++

}

END{

for(i in b)print b[i]

}' data

前提是你的数据文件里面每行没有空格，如果有用-F设定一个没有的字符作分隔符就

linux 下vim中关于删除某段，某行查看《Linux就该这么学》中有命令大全

先打开vim

设置显示行号

在 vim 里执行(在普通模式下直接按冒号，并输入下面的命令)

:set number

1.按键盘上的Esc按键进入vi的命令行模式

2.点击Ctrl和v按键

3.按上下左右键选中要删除的内容

4.按d即可删除选中的列

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/8548334.html

Linux shell awk怎么去除行内，重复列？

发表评论

评论列表（0条）