最佳答案
我想在 python 中使用 wordnet lemmatizer,我了解到默认的 pos 标签是 NOUN,它不会输出动词的正确引理,除非 pos 标签被明确指定为 VERB。
我的问题是什么是最好的拍摄,以执行上述外延准确?
我做了使用 nltk.pos_tag
的 POS 标签,我迷失在整合树银行 POS 标签,以文字网兼容 POS 标签。请帮帮我
from nltk.stem.wordnet import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
tagged = nltk.pos_tag(tokens)
我得到的输出标签在 NN,JJ,VB,RB。我如何改变这些字网兼容标签?
我还需要用带标签的语料库来训练 nltk.pos_tag()
吗? 或者我可以直接用它来评估我的数据吗?