re.sub为:
re.sub(pattern, repl, string, count=0)
所以
re.sub(ur"[^-' ().,w]+", '' , u'Castañeda', re.UNICODE)
设置
count为
re.UNICODE,其值为32。
请尝试:
In [57]: re.sub(ur"(?u)[^-' ().,w]+", '', u'Castañeda')Out[57]: u'Castaxf1eda'
放置
(?u)在正则表达式的开头是在正
re.UNICODE则表达式本身中指定标志的另一种方法。您也可以通过
(?iLmsux)这种方式设置其他标志。(有关更多信息,请单击此链接并搜索“(?iLmsux)”。)
同样,的呼叫签名
re.split为:
re.split(pattern, string, maxsplit=0)
解决方法是相同的。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)