Python中的正则表达式和Unicode:sub和findall之间的区别

Python中的正则表达式和Unicode:sub和findall之间的区别,第1张

Python中的正则表达式和Unicode:sub和findall之间的区别

呼叫签名

re.sub
为:

re.sub(pattern, repl, string, count=0)

所以

re.sub(ur"[^-' ().,w]+", '' , u'Castañeda', re.UNICODE)

设置

count
re.UNICODE
,其值为32。

请尝试:

In [57]: re.sub(ur"(?u)[^-' ().,w]+", '', u'Castañeda')Out[57]: u'Castaxf1eda'

放置

(?u)
在正则表达式的开头是在正
re.UNICODE
则表达式本身中指定标志的另一种方法。您也可以通过
(?iLmsux)
这种方式设置其他标志。(有关更多信息,请单击此链接并搜索“(?iLmsux)”。)

同样,的呼叫签名

re.split
为:

re.split(pattern, string, maxsplit=0)

解决方法是相同的。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5562359.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存