在其它条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题?

1553 次浏览
  • A、SVM 算法中使用高斯核 /RBF核代替
  • B、减少神经网络隐藏层节点数
  • C、增加训练集数量
  • D、删除稀疏的特征
机器学习中发生过拟合的主要原因有: (1)使用过于复杂的模型; (2)数据噪声较大; (3)训练数据少。 由此对应的降低过拟合的方法有: (1)简化模型假设,或者使用惩罚项限制模型复杂度; (2)进行数据清洗,减少噪声; (3)收集更多训练数据。 本题中,高斯核的使用增加了模型复杂度,容易引起过拟合。选择合适的核函数以及软边缘参数C就是训练SVM的重要因素。一般来讲,核函数越复杂,模型越偏向于过拟合;删除稀疏的特征越大模型越偏向于过拟合,反之则拟合不足。
挑战成功
5个月前
挑战成功
2年前
挑战成功
2年前
挑战失败
2年前
挑战失败
2年前
挑战失败
2年前
挑战成功
3年前
挑战成功
3年前
挑战失败
3年前
挑战成功
3年前