【python-re】正则表达式

【python-re】正则表达式,第1张

python-re 正则表达式
  • 简述
  • 主要函数
  • “方括号 [] ”
  • 准备工作
  • 范例
    • search & match & findall
    • split()
    • compile() 模式

简述

re,Regular Expression,正则表达式、规则表达式,经常用于爬虫。抓取规律,提取关键字段,是其主要作用。

主要函数

“方括号 [] ”

准备工作

打开 anaconda,本次使用 base 的 python3.9 环境,查看预装里有无 re 包

OK,有预装好的 re 包,输入 exit 退出。
没有的尝试用 conda install re 进行下载。

范例 search & match & findall

search,match与findall都是查找函数,但是有什么不同点?

import re

x = "这是一个测试代码,对该代码进行正则表达式re的测试。"

print(re.search("测试",x))
print(re.match("测试",x))
print(re.findall("测试",x))

输出结果:

search 找到第一个"测试"的位置在 (4,6) -> x[4],x[5] 的位置。
match 发现字符串开始处不是“测试”字段。
findall 找到了两个“测试”字段。

split()
import re

x = "这是一个测试代码,对该代码进行正则表达式re的测试。"

print(re.split("测试",x))

输出结果:

字段根据“测试”进行分割,一共分割出4个部分。

compile() 模式
import re

r = re.compile("[0-9]")
x = "今天是2022年5月3日"
print(r.search(x))
print(r.match(x))
print(r.findall(x))
print(r.split(x))

输出结果:

r 中概念为0-9中任意的数,[]的概念其实等同于“或”的意思,所以re.compile(“[0-9]”)的意思就是0或1或2或3…或9.

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/793714.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-06
下一篇 2022-05-06

发表评论

登录后才能评论

评论列表(0条)

保存