Swift中的字符串和字符比较不区分语言环境是什么意思？_随笔

Swift中的字符串和字符比较不区分语言环境是什么意思？

（现在已为Swift 3更新所有代码示例。）

夫特串与比较<确实基于逐一比较所谓“Unipre范式
d”（其可以与被计算decomposedStringWithCanonicalMapping）

例如，分解

"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS

是两个Unipre代码点的序列

U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS

出于演示目的，我编写了一个小的String扩展名，该扩展名将String 的内容转储为Unipre代码点的数组：

extension String {    var unipredata: String {        return self.unipreScalars.map { String(format: "%04X", let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()print(someStrings)// ["a", "ã", "ă", "ä", "ǟ", "b"]
.value) }.joined(separator: ",")    }}

现在，让我们取一些字符串，用<以下命令对其进行排序：

for str in someStrings {    print("(str)  (str.unipreData)  (str.decomposedStringWithCanonicalMapping.unipreData)")}

并将每个字符串（原始和分解
形式）的Unipre代码点转储到排序数组中：

äx  00E4,0078  0061,0308,0078ǟx  01DF,0078  0061,0308,0304,0078ǟψ  01DF,03C8  0061,0308,0304,03C8äψ  00E4,03C8  0061,0308,03C8

The output

let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()

很好地显示了该比较是通过分解形式的Unipre代码点的字典顺序进行的。

如以下
示例所示，对于多个字符的字符串也是如此。用

äx  00E4,0078  0061,0308,0078ǟx  01DF,0078  0061,0308,0304,0078ǟψ  01DF,03C8  0061,0308,0304,03C8äψ  00E4,03C8  0061,0308,03C8

以上循环的输出是

"äx" < "ǟx", but "äψ" > "ǟψ"

意思就是

let locale = Locale(identifier: "sv") // svenskavar someStrings = ["ǟ", "ä", "ã", "a", "ă", "b"]someStrings.sort {    <
.compare(, locale: locale) == .orderedAscending}print(someStrings)// ["a", "ă", "ã", "b", "ä", "ǟ"]

（这至少对我来说是出乎意料的）。

最后，让我们将其与语言环境敏感的顺序进行比较，例如
瑞典语：

As you see, the result is different from the Swift sorting.

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4960265.html

Swift中的字符串和字符比较不区分语言环境是什么意思？

发表评论

评论列表（0条）