utf8_general_ci和utf8_unicode_ci有什么区别?[重复]

utf8_general_ci和utf8_unicode_ci有什么区别?[重复],第1张

utf8_general_ci和utf8_unicode_ci有什么区别?[重复]

utf8_general_ci
这是一种非常简单的排序规则,在Unipre上很破损,这种排序对普通Unipre文本给出的 结果不正确
。它的作用是:

  • 转换为Unipre规范化形式D以进行规范分解
  • 删除任何组合字符
  • 转换为大写

这在Unipre上无法正常工作,因为它不了解Unipre大小写。单独使用Unipre框比处理ASCII格式的方法要复杂得多。例如:

  • “ẞ”的小写字母是“ß”,但是“ß”的大写字母是“ SS”。
  • 有两个小写的希腊语西格玛,但只有一个大写的西格玛。考虑“Σίσυφος”。
  • 像“ø”这样的字母不会分解为“ o”加变音符号,这意味着它不会正确排序。

还有许多其他的细微之处。

  1. utf8_unipre_ci
    使用标准 Unipre排序规则算法 ,支持所谓的扩展和连字,例如:德语字母ß(U + 00DF LETTER SHARP S)在“ ss”附近排序字母Œ(U + 0152 LATIN CAPITAL LIGATURE OE)在“ OE”附近排序”。

utf8_general_ci
不支持扩展名/连字号,而是将所有这些字母排序为单个字符,有时顺序错误。

  1. utf8_unipre_ci
    一般 所有脚本更准确。例如,在西里尔字母上:
    utf8_unipre_ci
    适用于所有以下语言:俄语,保加利亚语,白俄罗斯语,马其顿语,塞尔维亚语和乌克兰语。utf8_general_ci仅适用于西里尔文的俄语和保加利亚子集。白俄罗斯语,马其顿语,塞尔维亚语和乌克兰语中使用的多余字母排序不正确。

成本

utf8_unipre_ci
是,它是一个 稍微
有点慢
utf8_general_ci
。但这就是您为正确性付出的代价。您可能会得到一个错误的快速答案,或者是一个稍微慢一些的正确答案。你的选择。永远难以证明给出错误的答案是正确的,因此最好假设它
utf8_general_ci
不存在并始终使用
utf8_unipre_ci
。好吧,除非您想要错误的答案。

资料来源:http :
//forums.mysql.com/read.php?103,187048,188748#msg-188748



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4956148.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-13
下一篇 2022-11-13

发表评论

登录后才能评论

评论列表(0条)

保存