最佳答案
在 scikit-learn 中,我很难理解 roc_auc_score()
和 auc()
之间的区别(如果有的话)。
进出口试图预测一个二进制输出与不平衡类(约1.5% 的 Y = 1)。
model_logit = LogisticRegression(class_weight='auto')
model_logit.fit(X_train_ridge, Y_train)
false_positive_rate, true_positive_rate, thresholds = roc_curve(Y_test, clf.predict_proba(xtest)[:,1])
auc(false_positive_rate, true_positive_rate)
Out[490]: 0.82338034042531527
还有
roc_auc_score(Y_test, clf.predict(xtest))
Out[493]: 0.75944737191205602
有人能解释一下这种区别吗?我以为两者都只是在计算 ROC 曲线下的面积。可能是因为不平衡的数据集,但我不能找出为什么。
谢谢!