在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方案哪个是相对不合理的( )(假设precision=TP/(TP+FP),recall=TP/(TP+FN))

2131 次浏览
  • A、Accuracy:(TP+TN)/all
  • B、F-value:2*recall*precision/(recall+precision)
  • C、G-mean:sqrt(precision*recall)
  • D、AUC:ROC曲线下面积
对于分类器,主要的评价指标有precision,recall,F-score,以及ROC曲线等。 在二分类问题中,我们主要关注的是测试集的正样本能否正确分类。当样本不均衡时,比如样本中负样本数量远远多于正样本,此时如果负样本能够全部正确分类,而正样本只能部分正确分类,那么(TP+TN)可以得到很高的值,也就是Accuracy是个较大的值,但是正样本并没有取得良好的分类效果。因此A选项是不合理的。在样本不均衡时,可以采用BCD选项方法来评价。
挑战成功
1年前
挑战成功
2年前
挑战成功
2年前
挑战成功
2年前
挑战失败
2年前
挑战成功
2年前
挑战失败
2年前
挑战成功
2年前
挑战失败
2年前
挑战成功
2年前

微信公众号

有课学公众号
  • 微信公众号: geekdaxue