在语料库语言学中,为了得到词表,有时需要对字符串中的标点进行处理,刚刚发现一个非常实用的方法,就是采用Python自带的maketrans和translate方法,实现字符的批量映射,这同时也为批量替换字符提供了参考。
from string import punctuation as punct #引入punctuation模块,给它起个别名:punct
s="Hello! Life is short, and I like Python. Do you like it?" # 设定要替换的字符串
transtab=str.maketrans({key:" " for key in punct}) #生成映射字典,把所有标点映身为空格
s1=s.translate(transtab) # 批量映射后,把结果赋值给s1
print(s1)
显示结果如下:
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)