分隔Unicode连字符

分隔Unicode连字符,第1张

分隔Unicode连字符

U + FB00是兼容字符。通常,Unipre不支持连字的单独代码点(认为是否使用连字以及何时使用连字是布局决定,并且不影响数据的存储方式)。其中
一些 仍然可以允许往返转换与 确实 将连字表示为单独实体的旧编码兼容。

幸运的是,该字符结扎代表的信息
存在于Unipre数据文件和最有能力的字符串处理系统具有数据内置。

在Java中,你需要使用的

Normalizer
类和
NFKC
形式:

String ff ="uFB00";String normalized = Normalizer.normalize(ff, Form.NFKC);System.out.println(ff + " = " + normalized);

这将打印

ff = ff


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5561334.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存