机器学习包中的分类器,比如 lilinear 和 nltk,提供了一种方法 show_most_informative_features()
,这对于调试特性非常有帮助:
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
我的问题是,在 scikit-learn 中是否实现了类似的分类器。我查了文件,但没找到类似的东西。
如果还没有这样的函数,是否有人知道如何得到这些值的变通方法?