关于shell 里的grep,如何查找匹配的块呢

关于shell 里的grep,如何查找匹配的块呢,第1张

grep 用来选一行,功能很弱

sed用来逐行处理文本,功能很强,但用来处理行中的列很麻烦

awk解决了sed处理列麻烦的问题,sed能实现的他都能实现

python,perl完全可以代替awk,功能更全。

sed 's/REGEX/\1/' 用REGEX替换整行。

awk如楼上,分列进行 *** 作

python: stringsplit(' ')[5]

比如变量是strstr="thisisastring"要想在判断str中是否含有"this"这个字符串,下面的语句是可行的[[$str=~"this"]]&&echo"\$strcontainsthis"[[$str=~"that"]]||echo"\$strdoesNOTcontainthis"

要求比较笼统,我也只能写写伪代码:

#!/bin/bash

while read line

do

   #用支持正则的grep,awk,sed等工具做正则匹配

   if [ $ -eq 0 ]; then

      #匹配成功,执行 *** 作

   fi

done <filetxt

正则表达式在各个编程语言体系中都有使用,其各个规则大概是相同的,但某些语法是根据各个语言体系自己来实现的,比如在java中判断匹配规则是通过“matches”来实现判断,则在shell中则是使用“=~”

什么是正则表达式呢?正则表达式就是能用某种模式去匹配一类字符串的公式,它是由一串字符和元字符构成字符串。所谓元字符,就是用以阐述字符表达式的内容、转换和描述各种 *** 作信息字符。

正则表达式中的元字符表示

“”(一个点)符号,用于匹配除换行符以外的任意字符。

[root@localhost ~]# grep 'rt' /etc/passwd

[root@localhost ~]# grep 'rt' /etc/passwd

1

2

3

“ ”符号,用于前一个字符0次或者多次。

[root@localhost ~]# grep 'rt' /etc/passwd

1

“{n,m}”符号,可用于重复匹配前一个字符,但却不能精确地控制的重复次数

“{n}” 匹配前面的字符n次

[root@localhost ~]# grep 'ro\{2\}' /etc/passwd

1

“{n,}” 匹配前面的字符至少n次以上(含n次)

[root@localhost ~]# grep 'ro\{2,\}' /etc/passwd

1

“{n,m}” 匹配前面的字符n到m次

[root@localhost ~]# grep 'ro\{1,2\}' /etc/passwd

1

"^"符号 匹配的是以字符开头的行

[root@localhost ~]# grep ^root /etc/passwd

1

“$”符号 用于匹配尾部

[root@localhost ~]# grep 'rh$' /etc/passwd

[root@localhost ~]# grep 'rh' /etc/passwd

1

2

"[]"符号 用于匹配方括号内出现的任意字符

“\”符号 用于转义字符

“<”符号和“>”符号 用于界定单词的左边界和右边界

“\d”符号 匹配一个数字,等价于[0-9] 使用grep匹配这种正则表达式时可能会遇到无法匹配的问题

#成功匹配

[root@localhost ~]# echo 123|grep [0-9]

123

#并未匹配

[root@localhost ~]# echo 123|grep "\d"

#匹配成功 这是因为“\d”是一种Perl兼容模式的表达式,又称作 PCRE,要想使用这种模式的匹配符,需要加上-P参数

[root@localhost ~]# echo 123|grep -P "\d"

123

1

2

3

4

5

6

7

8

“\b”符号 匹配单词的边界

“\B”符号 匹配非单词的边界

“\w”符号 匹配字母、数字和下划线,等价于[A-Za-z0-9]

“\w”符号 匹配非字母、非数字和非下划线,等价于[^A-Za-z0-9]

“\n” 符号 匹配一个换行符

“\r”符号 匹配一个回车符

“\t”匹配一个制表符

“\f”匹配一个换页符

“\s”匹配任何空白字符

“\S”匹配任何非空白字符

正则表达式还能表示电话号码,身份z号码,域名格式,邮箱格式等等,都是根据元字符进行拼装组装,就如英语单词千千万都是用字母组成的一样,用的时候要根据各个规则进行灵活处置。

利用正则表达式怎么截取字符串呢?

expr - 求一个表达式的值

可以运算加减乘除,俨然是个多功能计算器,字符串表达式的优先级高于数值表达式和逻辑关系表达式。

运算有很多,本次只针对字符串截取来几个小demo

‘STRING : REGEX’

执行模式匹配。两端参数会转换为字符格式,且第二个参数被视为正则表达式(GNU基本正则),它默认会隐含前缀"^"。随后将第一个参数和正则模式做匹配。

如果匹配成功,且REGEX使用了’(‘和’)’,则此表达式返回匹配到的,如果未使用’(‘和’)’,则返回匹配的字符数。

如果匹配失败,如果REGEX中使用了’(‘和’)’,则此表达式返回空字符串,否则返回为0。

只有第一个’(…)‘会引用返回的值;其余的’(…)‘只在正则表达式分组时有意义。

在正则表达式中,’+’,’‘和’|'分表代表匹配一个或多个,0个或1个以及两端任选其一的意思。

#返回匹配的个数

[root@localhost ~]# expr aaa : 'a\+'

3

#返回匹配的内容

[root@localhost ~]# expr abc : 'a\(\)c'

b

#返回匹配的内容

[root@localhost ~]# expr service-core-001-SNAPSHOTjar : '\([0-9]\)'

#返回长度

[root@localhost ~]# expr length 'length test is length'

21

#返回截取的长度

[root@localhost ~]# expr substr abcde 2 4

bcde

#加分运算 记得要有空格,不然会原样输出

[root@localhost ~]# expr 1 + 2

3

#除发运算

[root@localhost ~]# expr 12 / 2

6

#求模运算

[root@localhost ~]# expr 12 % 5

2

#乘法运算 作为特殊字符要进行转译

[root@localhost ~]# expr 12 \ 5

60

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

对于怎么判断这个值是否符合正则表达式则用

#注意不能添加符号,只写表达式即可,添加符号会产生错误

if [[ $file =~ jar$ ]]

then

echo "true"

else

echo false

fi

1

2

3

4

5

6

7

以上是shell中使用正则表达式所引出来的,不会的多去查,Linux命令就是那么多,使用多了也就记住了,有人说Linux是积沙成塔的过程,慢慢积累,多看帮助文档, info、man用起来。

以上就是关于关于shell 里的grep,如何查找匹配的块呢全部的内容,包括:关于shell 里的grep,如何查找匹配的块呢、shell中怎么用if语句判断字符串匹配、我想写一个shell脚本,逐行读取文件,对每行记录匹配正则,匹配成功执行一种 *** 作,失败则什么也不做等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9474962.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存