最佳答案
我需要把我的数据分成训练集(75%)和测试集(25%)。我现在用下面的代码做到这一点:
X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo)
但是,我想对我的训练数据集进行分层。我该怎么做?我一直在研究 StratifiedKFold
方法,但是没有指定75%/25% 的分割,只对训练数据集进行了分层。