此方法在Java中效果很好(纯粹是为了消除变音符号,也就是重音符号)。
它基本上将所有带有重音符号的字符转换为它们的不带重音字符的字符,然后将它们合并为变音符号。现在,你可以使用正则表达式删除变音符号。
import java.text.Normalizer;import java.util.regex.Pattern;public String deAccent(String str) { String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); Pattern pattern = Pattern.compile("\p{InCombiningDiacriticalMarks}+"); return pattern.matcher(nfdNormalizedString).replaceAll("");}
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)