不幸的是,
split要求非零宽度匹配,但尚未解决,因为很多不正确的代码都依赖于当前行为,例如使用
[something]*正则表达式。现在,使用此类模式会生成,
FutureWarning而那些
永远 无法拆分的模式会
ValueError从Python 3.5开始抛出:
>>> re.split(r'(?<!foo)(?=bar)', 'foobarbarbazbar')Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3.6/re.py", line 212, in split return _compile(pattern, flags).split(string, maxsplit)ValueError: split() requires a non-empty pattern match.
这个想法是,在一定时间的警告后,可以更改行为,以便您的正则表达式将再次起作用。
如果您不能使用该
regex模块,则可以使用以下代码编写自己的split函数
re.finditer():
def megasplit(pattern, string): splits = list((m.start(), m.end()) for m in re.finditer(pattern, string)) starts = [0] + [i[1] for i in splits] ends = [i[0] for i in splits] + [len(string)] return [string[start:end] for start, end in zip(starts, ends)]print(megasplit(r'(?<!foo)(?=bar)', 'foobarbarbazbar'))print(megasplit(r'o', 'foobarbarbazbar'))
如果您确定匹配项仅是零宽度,则可以使用分割的开头来获得更简单的代码:
import redef zerowidthsplit(pattern, string): splits = list(m.start() for m in re.finditer(pattern, string)) starts = [0] + splits ends = splits + [ len(string) ] return [string[start:end] for start, end in zip(starts, ends)]print(zerowidthsplit(r'(?<!foo)(?=bar)', 'foobarbarbazbar'))
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)