(现在已为Swift 3更新所有代码示例。)
夫特串与比较<确实基于逐一比较所谓“Unipre范式
d”(其可以与被计算decomposedStringWithCanonicalMapping)
例如,分解
"ä" = U+00E4 = LATIN SMALL LETTER A WITH DIAERESIS
是两个Unipre代码点的序列
U+0061,U+0308 = LATIN SMALL LETTER A + COMBINING DIAERESIS
出于演示目的,我编写了一个小的String扩展名,该扩展名将String 的内容转储为Unipre代码点的数组:
extension String { var unipredata: String { return self.unipreScalars.map { String(format: "%04X",let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()print(someStrings)// ["a", "ã", "ă", "ä", "ǟ", "b"].value) }.joined(separator: ",") }}
现在,让我们取一些字符串,用<以下命令对其进行排序:
for str in someStrings { print("(str) (str.unipreData) (str.decomposedStringWithCanonicalMapping.unipreData)")}
并将每个字符串(原始和分解
形式)的Unipre代码点转储到排序数组中:
äx 00E4,0078 0061,0308,0078ǟx 01DF,0078 0061,0308,0304,0078ǟψ 01DF,03C8 0061,0308,0304,03C8äψ 00E4,03C8 0061,0308,03C8
The output
let someStrings = ["ǟψ", "äψ", "ǟx", "äx"].sorted()
很好地显示了该比较是通过分解形式的Unipre代码点的字典顺序进行的。
如以下
示例所示,对于多个字符的字符串也是如此。用
äx 00E4,0078 0061,0308,0078ǟx 01DF,0078 0061,0308,0304,0078ǟψ 01DF,03C8 0061,0308,0304,03C8äψ 00E4,03C8 0061,0308,03C8
以上循环的输出是
"äx" < "ǟx", but "äψ" > "ǟψ"
意思就是
let locale = Locale(identifier: "sv") // svenskavar someStrings = ["ǟ", "ä", "ã", "a", "ă", "b"]someStrings.sort {<.compare(, locale: locale) == .orderedAscending}print(someStrings)// ["a", "ă", "ã", "b", "ä", "ǟ"]
(这至少对我来说是出乎意料的)。
最后,让我们将其与语言环境敏感的顺序进行比较,例如
瑞典语:
As you see, the result is different from the Swift sorting.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)