U + FB00是兼容字符。通常,Unipre不支持连字的单独代码点(认为是否使用连字以及何时使用连字是布局决定,并且不影响数据的存储方式)。其中
一些 仍然可以允许往返转换与 确实 将连字表示为单独实体的旧编码兼容。
幸运的是,该字符结扎代表的信息 是
存在于Unipre数据文件和最有能力的字符串处理系统具有数据内置。
在Java中,你需要使用的
Normalizer类和
NFKC形式:
String ff ="uFB00";String normalized = Normalizer.normalize(ff, Form.NFKC);System.out.println(ff + " = " + normalized);
这将打印
ff = ff
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)