在一个n维的空间中, 最好的检测outlier(离群点)的方法是()

1646 次浏览
  • A、作正态分布概率图
  • B、作盒形图
  • C、马氏距离
  • D、作散点图
马氏距离是基于卡方分布的,度量多元outlier离群点的统计方法。有M个样本向量X1~Xm,协方差矩阵记为S,均值记为向量μ,则其中样本向量X到u的马氏距离表示为: (协方差矩阵中每个元素是各个矢量元素之间的协方差Cov(X,Y),Cov(X,Y) = E{ [X-E(X)] [Y-E(Y)]},其中E为数学期望)也就是欧氏距离了。  若协方差矩阵是对角矩阵,公式变成了标准化欧氏距离。(2)马氏距离的优缺点:量纲无关,排除变量之间的相关性的干扰。
挑战成功
1年前
挑战失败
1年前
挑战失败
1年前
挑战失败
1年前
挑战成功
2年前
挑战成功
2年前
挑战失败
2年前
挑战成功
3年前
挑战成功
3年前
挑战失败
3年前

微信公众号

有课学公众号
  • 微信公众号: geekdaxue