捕获和分组
捕获组将 (
pattern)创建一个具有捕获属性的组。
你可能经常看到(和使用)的一个相关的对象是(
?:pattern),它创建了一个不捕获属性的组,因此命名为
non-captureing group。
通常,当你需要重复一系列模式(例如
(.w+)+)或指定交替应在何处生效(例如
^(0*1|1*0)$(
^,然后
0*1或
1*0,然后
$)与
^0*1|1*0$(^0*1或1*0$))时,通常使用组。
除分组外,捕获组还将记录与捕获组内的模式匹配的文本
(pattern)。使用你的榜样,
(.*):,.*比赛
ABC和
:比赛
:,由于
.*是内捕获组
(.*),该文本ABC被记录,捕获组1。
组号
整个模式定义为组号0。
模式中的任何捕获组均从1开始索引。索引由捕获组的左括号的顺序定义。例如,以下模式是所有 5个捕获组:
(group)(?:non-capturing-group)(g(?:ro|u)p( (nested)inside)(another)group)(?=assertion)| | | | | | || | |1-----1 | | 4------4 |5-------5 | | 3---------------3 | 2-----------------------------------------2
组号用于
n模式和
$n替换字符串中的向后引用。
在其他正则表达式类型(PCRE,Perl)中,它们也可以用于子例程调用中。
你可以使用访问特定组匹配的文本
Matcher.group(int group)。可以使用上述规则标识组号。
在某些regex风格(PCRE,Perl)中,有一个分支重置功能,该功能使你可以使用相同的数字来捕获交替不同分支中的组。
组的名字
在Java 7中,你可以定义一个命名的捕获组 (?
组名用于
k<name>模式和
${name}替换字符串中的向后引用。
命名的捕获组仍使用相同的编号方案进行编号,因此也可以通过进行访问
Matcher.group(int group)。
在内部,Java的实现只是从名称映射到组号。因此,不能将相同的名称用于2个不同的捕获组。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)