最佳答案
我有一个包含一列 ID 的数据框架,所有其他列都是我想要计算 z 分数的数值。下面是其中的一部分:
ID Age BMI Risk Factor
PT 6 48 19.3 4
PT 8 43 20.9 NaN
PT 2 39 18.1 3
PT 9 41 19.5 NaN
我的一些列包含 NaN 值,我不想把它们包含到 z 分数计算中,所以我打算使用一个提供给这个问题的解决方案: 如何得分正常化熊猫栏与奶奶?
df['zscore'] = (df.a - df.a.mean())/df.a.std(ddof=0)
我有兴趣将此解决方案应用于除 ID 列之外的所有列,以生成一个新的数据框架,我可以使用该数据框架将其保存为 Excel 文件
df2.to_excel("Z-Scores.xlsx")
因此,基本上,我如何计算每个列的 z 分数(忽略 NaN 值)并将所有内容推入一个新的数据框架?
旁白: 在熊猫中有一个概念叫做“索引”,这让我感到害怕,因为我不太理解它。如果索引是解决这个问题的关键部分,请简化你对索引的解释。