归一化使某些等效序列产生相同的流.例如,U 0065(e)之后是U 0301(组合急性重音)相当于U 00E9(é).
NFD将所有这些字符串分解成其组成部分(例如将U 00E9转换成U 0065,然后是U 0301).如果一行中有两个或更多个组合字符,则会根据规则重新排序,这些规则会给出一致性(ḉ可以使用cedilla,紧随其后的是紧急程序或紧随其后的cedilla,我们需要一致的排序才能拥有相同的字符串生成). NFD主要用于内部处理,作为另一项任务的一部分,例如剥离重音或产生NFC.
NFC从NFD开始,然后在可能的情况下将字符组合在一起,除了一些例外以确保使用一个版本的Unicode的标准化字符串与另一个版本保持一致.
NFKD比NFD更进一步,以替代某些相似的人物. ⑤例如被替换为5.这种“损害”文本(用户可能合理地选择5超过5,因为很好的理由),但对于搜索(在Google上搜索“鱼”,并返回“鱼”的结果是有用的,因为它将long-s与短s相同),并在某些情况下作为限制,以避免类似但不同的角色的安全问题. NKFC首先做NFKD,然后以与NFC相同的方式组合.
http://unicode.org/reports/tr15/完全瘦,“使用NFC,但不用担心”重复简短的答案.
总结以上是内存溢出为你收集整理的表单 – 哪种更好的Unicode归一化表单?全部内容,希望文章能够帮你解决表单 – 哪种更好的Unicode归一化表单?所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)