内置
unipredata模块可以做到这一点:
>>> import unipredata>>> foo = u'1234567890'>>> unipredata.normalize('NFKC', foo)u'1234567890'
“ NFKC”代表“规范化形式KC
[兼容性分解,后跟规范组合]”,并将全角字符替换为半角字符,这些半角字符与Unipre等效。
请注意,它还会同时规范化所有其他内容,例如单独的重音符号和罗马数字符号。
欢迎分享,转载请注明来源:内存溢出
内置
unipredata模块可以做到这一点:
>>> import unipredata>>> foo = u'1234567890'>>> unipredata.normalize('NFKC', foo)u'1234567890'
“ NFKC”代表“规范化形式KC
[兼容性分解,后跟规范组合]”,并将全角字符替换为半角字符,这些半角字符与Unipre等效。
请注意,它还会同时规范化所有其他内容,例如单独的重音符号和罗马数字符号。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)