python如何使用正则表达式的前向、后向搜索及前向搜索否定模式详解

python如何使用正则表达式的前向、后向搜索及前向搜索否定模式详解,第1张

概述前言在许多的情况下,很多要匹配内容是一起出现,或者一起不出现的。比如《》,<>,这样的括号,不存在使用半个的情况。因此,在正则表达式里也有一致性的判断,要么两个尖括号一起出现,要么一个也不要出现。

前言

在许多的情况下,很多要匹配内容是一起出现,或者一起不出现的。比如《》,< >,这样的括号,不存在使用半个的情况。因此,在正则表达式里也有一致性的判断,要么两个尖括号一起出现,要么一个也不要出现。怎么样来实现这种判断呢?针对这种情况得引入新的正则表达式的语法:(?=pattern),这个语法它会向前搜索或者向后搜索相关内容,如果不会出现就不能匹配。不过,这个匹配不会消耗任何输入的字符,它只是查看一下。

例子如下:

#python 3.6 #蔡军生 #http://blog.csdn.net/caimouse/article/details/51749579 # import re  address = re.compile(  '''''  # A name is made up of letters,and may include "."  # for Title abbreviations and mIDdle initials.  ((?P<name>   ([\w.,]+\s+)*[\w.,]+   )   \s+  ) # name is no longer optional   # LOOKAhead  # Email addresses are wrapped in angle brackets,but only  # if both are present or neither is.  (?= (<.*>$)  # remainder wrapped in angle brackets   |   ([^<].*[^>]$) # remainder *not* wrapped in angle brackets   )   <? # optional opening angle bracket   # The address itself: [email protected]  (?P<email>   [\w\d.+-]+  # username   @   ([\w\d.]+\.)+ # domain name prefix   (com|org|edu) # limit the allowed top-level domains  )   >? # optional closing angle bracket  ''',re.VERBOSE)  candIDates = [  u'First Last <[email protected]>',u'No Brackets [email protected]',u'Open Bracket <[email protected]',u'Close Bracket [email protected]>',]  for candIDate in candIDates:  print('CandIDate:',candIDate)  match = address.search(candIDate)  if match:   print(' name :',match.groupdict()['name'])   print(' Email:',match.groupdict()['email'])  else:   print(' No match') 

结果输出如下:

CandIDate: First Last <[email protected]> name : First Last Email: [email protected]: No Brackets [email protected] name : No Brackets Email: [email protected]: Open Bracket <[email protected] No matchCandIDate: Close Bracket [email protected]> No match

python里使用正则表达式的前向搜索否定模式

上面学习前向搜索或后向搜索模式(?=pattern),这个模式里看到有等于号=,它是表示一定相等,其实前向搜索模式里,还有不相等的判断。比如你需要识别EMAIL地址:[email protected],这个EMAIL地址大多数是不需要回复的,所以我们要把这个EMAIL地址识别出来,并且丢掉它。怎么办呢?这时你就需要使用前向搜索否定模式,它的语法是这样:(?!pattern),这里的感叹号就是表示非,不需要的意思。比如遇到这样的字符串:[email protected],它会判断noreply@是否相同,如果相同,就丢掉这个模式识别,不再匹配。

例子如下:

#python 3.6 #蔡军生 #http://blog.csdn.net/caimouse/article/details/51749579 # import re  address = re.compile(  '''''  ^   # An address: [email protected]   # Ignore noreply addresses  (?!noreply@.*$)   [\w\d.+-]+  # username  @  ([\w\d.]+\.)+ # domain name prefix  (com|org|edu) # limit the allowed top-level domains   $  ''',re.VERBOSE)  candIDates = [  u'[email protected]',u'[email protected]',candIDate)  match = address.search(candIDate)  if match:   print(' Match:',candIDate[match.start():match.end()])  else:   print(' No match') 

结果输出如下:

CandIDate: [email protected] Match: [email protected]: [email protected] No match

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对编程小技巧的支持。

总结

以上是内存溢出为你收集整理的python如何使用正则表达式的前向、后向搜索及前向搜索否定模式详解全部内容,希望文章能够帮你解决python如何使用正则表达式的前向、后向搜索及前向搜索否定模式详解所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1201354.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)

保存