- 简述
- 主要函数
- “方括号 [] ”
- 准备工作
- 范例
- search & match & findall
- split()
- compile() 模式
re,Regular Expression,正则表达式、规则表达式,经常用于爬虫。抓取规律,提取关键字段,是其主要作用。
主要函数 “方括号 [] ” 准备工作打开 anaconda,本次使用 base 的 python3.9 环境,查看预装里有无 re 包
OK,有预装好的 re 包,输入 exit 退出。
没有的尝试用 conda install re 进行下载。
search,match与findall都是查找函数,但是有什么不同点?
import re
x = "这是一个测试代码,对该代码进行正则表达式re的测试。"
print(re.search("测试",x))
print(re.match("测试",x))
print(re.findall("测试",x))
输出结果:
search 找到第一个"测试"的位置在 (4,6) -> x[4],x[5] 的位置。
match 发现字符串开始处不是“测试”字段。
findall 找到了两个“测试”字段。
import re
x = "这是一个测试代码,对该代码进行正则表达式re的测试。"
print(re.split("测试",x))
输出结果:
字段根据“测试”进行分割,一共分割出4个部分。
import re
r = re.compile("[0-9]")
x = "今天是2022年5月3日"
print(r.search(x))
print(r.match(x))
print(r.findall(x))
print(r.split(x))
输出结果:
r 中概念为0-9中任意的数,[]的概念其实等同于“或”的意思,所以re.compile(“[0-9]”)的意思就是0或1或2或3…或9.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)