去除数字,特殊字符,只保留汉字
import re s = '1123*#$ 中abc国' str = re.sub('[a-zA-Z0-9'!"#$%&'()*+,-./:;<=>?@,。?★、…【】《》?“”‘'![\]^_`{|}~s]+', "", s) # 去除不可见字符 str = re.sub('[01020304050607x08x09x0ax0bx0cx0dx0ex0fx10x11x12x13x14x15x16x17x18x19x1a]+', '', x) print(str) # 结果为:中国
去除特殊字符,只保留汉子,字母、数字
import re string = "123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》" print(string) 123我123456abcdefgABCVDFF?/ ,。,.:;:''';'''[]{}()()《》 sub_str = re.sub(u"([^u4e00-u9fa5u0030-u0039u0041-u005au0061-u007a])","",string) print(sub_str) 123我123456abcdefgABCVDFF
正则表达式说明
更多关于python正则过滤字母、数字及特殊字符方法请查看下面相关链接
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)