最佳答案
我估计通常我的标题的答案是去阅读文档,但是我浏览了 NLTK 书,但是它没有给出答案。我对巨蟒还是个新手。
我有一些 .txt
文件,我希望能够使用 NLTK 为 nltk_data
语料库提供的语料库函数。
我试过 PlaintextCorpusReader
,但我无法进一步:
>>>import nltk
>>>from nltk.corpus import PlaintextCorpusReader
>>>corpus_root = './'
>>>newcorpus = PlaintextCorpusReader(corpus_root, '.*')
>>>newcorpus.words()
我如何分割 newcorpus
句子使用庞克?我尝试使用 punk 函数,但是 punk 函数不能读取 PlaintextCorpusReader
类?
你还能告诉我如何将分段数据写入文本文件吗?