[python]利用正则表达式提取数据

[python]利用正则表达式提取数据,第1张

概述代码importredeftitle_data(title):lt=[]lt2=[]str1=lt.append(re.findall(r'\d+年\d+月\d+日',title))str2=lt.append(re.findall(r'(?<=新增本地新冠肺炎确诊病例)\d+',title))str3=lt.append(re.findall(r'(?&lt 代码
import redef Title_data(Title):    lt = []    lt2 = []    str1 = lt.append(re.findall(r'\d+年\d+月\d+日', Title))    str2 = lt.append(re.findall(r'(?<=新增本地新冠肺炎确诊病例)\d+', Title))    str3 = lt.append(re.findall(r'(?<=新增境外输入)\d+', Title))    str4 = lt.append(re.findall(r'(?<=治愈出院)\d+', Title))    lt = if_no_data(lt)    for i in lt:        #转为字符串        lt2.append(i[0])    if lt2[0] == '0':        lt2[0] = '2020年' + re.findall(r'\d+月\d+日', Title)[0]    return lt2def if_no_data(lt):     #将搜索不到的数据默认为0    for i in range(len(lt)):        if lt[i] == []:            lt[i] = ['0']    return lt
结果展示


这里正则表达式用到了正向后行断言,(?<=表达式),即要求取出字符的前面要有能匹配的表达式。同样的还有正向现行断言(?<=表达式),即要求取出字符的后面要有能匹配的表达式。反向先行断言是(?!表达式),保证右边不出现某内容。(?<!表达式)是反向后行断言。

总结

以上是内存溢出为你收集整理的[python]利用正则表达式提取数据全部内容,希望文章能够帮你解决[python]利用正则表达式提取数据所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1184866.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存