我正在寻找一个算法,可以映射之间的字符与变音符(波涛,回旋曲线,凯特,变音,Caron)和他们的“简单”字符。
例如:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n
á --> a
ä --> a
ấ --> a
ṏ --> o
等等。
我想在 Java 中完成这项工作,尽管我怀疑它应该是 Unicode-y 类型的,并且在任何语言中都应该能够轻松地完成。
用途: 便于查找带有变音符号的单词。例如,如果我有一个网球运动员的数据库,并且输入了 Björn _ Borg,我也会保留 Bjorn _ Borg,这样如果有人输入 Bjorn 而不是 Björn,我就可以找到它。