4-19 Linux中的正则表达式 --- 字符匹配_系统运维

1、正则表达式和通配符有点像。区别在于通配符匹配的是文件名和目录名中的字符串，不能匹配文本中内容的字符串。而正则表达式匹配的是文本中的字符串。

2、正则表达式（REGEXP）：由一类特殊字符及文本符号所编写的表达式，这种表达式的功能是匹配文本当中字符串。

3、正则表达式的特点：可以通过特殊字符及文本符号灵活组合各种过滤条件去匹配文本内容，从而达到自由度颇高的筛查方式。

4、正则表达式分两类：基本正则表达式（BRE）、扩展正则表达式（ERE），grep 加上 -E 参数就是使用 egrep。

5、元字符分类：元字符是指正则表达式中使用的特殊字符，这些特殊符号具有特定的功能。从功能上分类有：字符匹配、匹配次数、位置锚定、分组。

①、 .：匹配任意单个字符。

②、 [ ]：匹配指定范围内的任意单个字符。

③、 [^]：排除匹配指定范围内的任意单个字符。

④、 [:alnum:]：过滤字母和数字，包含了大写字母、小写字母和 10个数字（0-9）。

⑤、 [:alpha:]：任何英文大小写字符，即 A-Z，a-z。

⑥、 [:lower:]：只过滤小写字母。

⑦、 [:upper:]：只过滤大写字母。

⑧、 [:blank:]：空白字符（空格和制表符）。

⑨、 [:space:]：水平和垂直的空白字符（比 [:blank:] 包含的范围广）。

⑩-①、 [:digit:]：十进制数字。

⑩-③、 [:graph:]：可打印的非空白字符。

⑩-④、 [:print:]：可打印字符。相当于 [:alnum:]、[:punct:] 和 space。

⑩-⑤、 [:punct:]：标点符号。

查找目录下的所有文件中是否含有某个字符串

find

.|xargs

grep

-ri

"IBM"

查找目录下的所有文件中是否含有某个字符串,并且只打印出文件名

find

.|xargs

grep

-ri

"IBM"

-l

1.正则表达式

（1）正则表达式一般用来描述文本模式的特殊用法，由普通字符（例如字符a-z）以及特殊字符（称为元字符，如/、*、?等）组成。

（2）基本元字符集及其含义

：只匹配行首。

如^a

匹配以a开头的行abc,a2e,a12,aaa,......

：只匹配行尾。

如^a

匹配以a结尾的行bca,12a,aaa,.......

：匹配0个或多个此单字符。

如(a)*

匹配

空，a,aa,aaa,....

[]

：只匹配[]内字符。可以是一个单字符，也可以是字符序列，用","将里面要匹配的不同字符串分开。也可以使用-来表示[]内字符序列的范围，如[1-5]表示[12345]

：只用来屏蔽一个元字符的特殊含义。

如\*,\',\",\|,\+,\^,\.

等

.：（点）只匹配任意单字符。

pattern\{n\}：只用来匹配前面pattern出现的次数.n为次数。如a\{2\}匹配aa.

pattern\{n,\}：含义同上，但次数最少为n.如a\{2,\}匹配aa,aaa,aaaa,.....

pattern\{n,m\}：含义同上，但次数在n和m之间。如a\{2,4\}匹配aa,aaa,aaaa三个

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/7242017.html

4-19 Linux中的正则表达式 --- 字符匹配

发表评论

评论列表（0条）