感谢Martijn Pieters,解决方案来自于正则表达式的世界,特别是以下代码(基于他对上面第一个链接的回答):
import retry: # UCS-4 highpoints = re.compile(u'[U00010000-U0010ffff]')except re.error: # UCS-2 highpoints = re.compile(u'[uD800-uDBFF][uDC00-uDFFF]')# mytext = u'<some string containing 4-byte chars>'mytext = highpoints.sub(u'u25FD', mytext)
我要替换的字符是
WHITE MEDIUM SMALL SQUARE (U+25FD)FYI,但可以是任何字符。
对于像我这样不熟悉UCS的用户来说,这是一个用于Unipre转换的系统,并且给定的Python构建将包括对UCS-2或UCS-4变体的支持,每种变体在字符支持上都有不同的上限。
加上此代码,字符串似乎可以在MySQL 5.1中永久保存。
希望这对其他情况相同的人有所帮助!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)