PostgreSQL使用捷克排序规则对unicode字符进行了不正确的排序

PostgreSQL使用捷克排序规则对unicode字符进行了不正确的排序,第1张

概述我有一个表,其排序规则设置为cs_CZ(捷克语): Name | Encoding | Collation | CType-----------+----------+-------------+------------- foo | UTF8 | cs_CZ.UTF-8 | cs_CZ.UTF-8 但是当我按字符串排序时,结果没有排序,因为它应该根据捷克字母 我有一个表,其排序规则设置为cs_CZ(捷克语):
name   | EnCoding |  Collation  |    CType-----------+----------+-------------+------------- foo       | UTF8     | cs_CZ.UTF-8 | cs_CZ.UTF-8

但是当我按字符串排序时,结果没有排序,因为它应该根据捷克字母表:

=> SELECT surname FROM foo ORDER BY surname;     surname     -----------------ADaĎbDcE

所以它的排序就像unicode重音字符(Ď)被转换为没有重音(D)的ASCII版本一样.但捷克语字母表是:… C – > D – > Ď – > E …,因此返回的订单不正确(在此示例中应该是:A – > Da – > Dc – >&b;> E).

这是常见的Postgresql行为吗?有没有办法按捷克字母顺序正确排序?

编辑:尝试Postgres 9.1.4,两者都有相同的行为.它是一个Arch linux机器.
EDIT2:调整后的例子,Ď是真正的问题.

它是正确的. á,ď,é,ě,í,ó,ť,ú,ů,ý的重音应该被忽略见 article

捷克排序规则有点复杂:)

总结

以上是内存溢出为你收集整理的PostgreSQL使用捷克排序规则对unicode字符进行了不正确的排序全部内容,希望文章能够帮你解决PostgreSQL使用捷克排序规则对unicode字符进行了不正确的排序所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1181213.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-02
下一篇 2022-06-02

发表评论

登录后才能评论

评论列表(0条)

保存