我想比较几个字符串,找出最相似的。我想知道是否有任何库、方法或最佳实践可以返回哪些字符串与其他字符串更相似。例如:
这种比较会得出结论,前者比后者更为相似。
我想我需要一些方法,比如:
double similarityIndex(String s1, String s2)
有这种东西吗?
编辑: 我为什么要这么做?我正在编写一个脚本,将 MS 项目文件的输出与处理任务的一些遗留系统的输出进行比较。由于遗留系统的字段宽度非常有限,因此添加值时描述会缩短。我想要一些半自动化的方法来查找从 MS 项目的条目是类似的条目在系统上,所以我可以得到生成的关键。它有缺点,因为它仍然需要手动检查,但它将节省大量的工作