Python正则表达式中的分组_随笔

Python正则表达式中的分组

正则表达式(regular expression)是一种用来描述文本内容规则的工具，所谓规则就是文本内容的组成方式，如由数字、特殊字符等组成。通过正则表达式我们可以十分方便地检查某个文本内容是否符合我们制定的规则，也可以用它来帮助我们从烦乱的文本中提取出我们想要的内容。

（1）分组--可以让我们从文本内容中提取指定模式的部分内容，用（）来表示要提取的分组，需要注意的是分组是在整个文本符合指定的正则表达式前提下进行的进一步筛选。

（2）通过group()和groups()来获取分组的内容

group(num)返回的是第num组括号所匹配的值，group()即group(0)，它表示匹配正则式的整个文本；

groups()以tuple形式返回所有括号匹配的值。

如下例：

这里我们定义了两个分组，一个用来匹配3位数字，一个用来匹配3-8位数字，执行group()和groups()的结果如下：

（3）分组命名

有时候我们需要匹配的分组描述可能十分复杂，这时我们可以通过给分组取名来让我们更方便地获取分组。

分组命名的规则为：（？分组正则表达式）

执行结果为：

（4）分组引用

分组的后向引用，当我们想要在正则表达式中引用前面的分组时，可以通过"数字"的方式或者通过命名分组"(?P=name)"进行引用。使用数字时，如1表示引用第一个分组,2引用第二个分组...n表示引用第n个分组。（注意：分组引用必须是在正则表达式中才有效）

如下例：

执行结果为：

欢迎分享，转载请注明来源：内存溢出

Python正则表达式中的分组