假定某同学使用Naive Bayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中不正确的是?

2297 次浏览
  • A、无法用两列特征相同时所得到的结论来分析问题
朴素贝叶斯的条件就是每个变量相互独立。在贝叶斯理论系统中,都有一个重要的条件独立性假设:假设所有特征之间相互独立,这样才能将联合概率拆分。 此外,若高度相关的特征在模型中引入两次, 这样增加了这一特征的重要性, 则它的性能因数据包含高度相关的特征而下降。正确做法是评估特征的相关矩阵,并移除那些高度相关的特征。 补充说明 C选项已删除前半句话“当两列特征高度相关时” 而高度相关和相同类似,它们都会导致朴素贝叶斯公式对模型的估计不准确,所以C选项描述正确,题目问的是不正确的,故不可以选C。
挑战失败
2年前
挑战失败
2年前
挑战失败
2年前
挑战失败
2年前
挑战失败
3年前