最佳答案
我需要找到一种相当有效的方法来检测单词中的音节,
看不见-> in-vi-sib-le
有一些音节规则可以使用:
V 简历 越共 CVC 闭路电视 CCCV CVCC
V 是元音 C 是辅音 * 。 例如:
发音(5前名词词组; CV-CVC-CV-V-CVC)
我尝试过几种方法,其中包括使用正则表达式(只有当你想要计算音节时才有帮助)或硬编码规则定义(一种被证明效率非常低的蛮力方法) ,最后使用有限状态自动机(没有得到任何有用的结果)。
我的应用程序的目的是在给定的语言中创建一个包含所有音节的字典。这本字典稍后将用于拼写检查应用程序(使用贝叶斯分类器)和文本语音合成。
如果有人能给我除了我以前的方法之外的另一种解决这个问题的方法,我将不胜感激。
我在 Java 中工作,但是任何 C/C + + ,C # ,Python,Perl 的技巧对我来说都是可行的。