引言 : 我有一个超过30,000个整数值的列表,范围从0到47,包括从一些连续分布中抽样的 [0,0,0,0,..,1,1,1,1,...,2,2,2,2,...,47,47,47,...]
。列表中的值不一定是有顺序的,但是顺序对于这个问题并不重要。
问题 : 根据我的分布,我想计算任何给定值的 p 值(看到更大值的概率)。例如,您可以看到,0的 p 值将接近1,而较高数字的 p 值将趋向于0。
我不知道自己是否正确,但为了确定概率,我认为我需要将我的数据与最适合描述我的数据的理论分布相匹配。我假设需要某种拟合优度检验来确定最佳模型。
有没有一种方法可以在 Python (Scipy
或 Numpy
)中实现这样的分析?
你能举些例子吗?