这
unipredata.normalize可能对您有帮助。
基本上,如果您对来自db的数据进行规范化,并且将选择规范化为相同的形式,那么使用
str.find,
str.__contains__(即
in)
str.index和朋友时应该会得到更好的结果。
>>> u1 = chr(281)>>> u2 = chr(101) + chr(808)>>> print(u1, u2)ę ę>>> u1 == u2False>>> unipredata.normalize('NFC', u2) == u1True
NFC代表“ 普通形式组合”
形式。您可以在这里阅读有关其他可能形式的一些说明。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)