我们建立一个5000个特征, 100万数据的机器学习模型. 我们怎么有效地应对这样的大数据训练 :

1350 次浏览
  • A、我们随机抽取一些样本, 在这些少量样本之上训练
  • B、我们可以试用在线机器学习算法
  • C、我们应用PCA算法降维, 减少特征数
  • D、B 和 C
  • E、A 和 B
  • F、以上所有
答案:F 由于样本数过多或者特征数过多, 而不能单机完成训练, 可以用小批量样本训练, 或者在线累计式训练, 或者主成分PCA降维方式减少特征数量再进行训练。选项中的少量样本是相对于大数据量来说的,实际上并不少,具体的训练数据量要满足模型训练精度的前提。
挑战成功
2年前
挑战失败
2年前
挑战失败
2年前
挑战失败
2年前
挑战失败
2年前
挑战失败
2年前
挑战成功
3年前
挑战失败
3年前
gy
挑战成功
3年前
gy
挑战失败
3年前