最佳答案
众所周知,下面的代码可以将重音字符转换为纯文本:
Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
我用这个方法替换了我的“手工制作”方法,但是我需要理解替换 All 的“ regex”部分
1)什么是「合并发音符号」 ?
2)它的文件在哪里? (和类似的?)
谢谢。