最佳答案
自然语言处理(NLP) ,特别是对于英语来说,已经发展成为一个阶段,在这个阶段,如果存在“完美的”引理词根化词,词干分析将成为一种古老的技术。这是因为词干分析器将单词/标记的表面形式改变为一些无意义的词干。
然后再一次“完美”外延化的定义是值得怀疑的,因为不同的 NLP 任务将需要不同的外延化水平。例如 在动词/名词/形容词形式之间转换单词。
茎生植物
[in]: having
[out]: hav
Lemmatizer
[in]: having
[out]: have
所以问题是,现在英语词干还有用吗?因为我们有大量的词素化工具用于英语
如果没有,那么我们应该如何继续构建鲁棒的引理化程序
可以承受 nounify
,verbify
,adjectify
和 adverbify
预处理
如何将词素化任务轻松地扩展到其他语言 有着与英语相似的形态结构