最佳答案
我有一个数据帧df
,我从它到groupby
使用了几列:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()
通过上述方式,我几乎得到了我需要的表(数据框)。缺少的是一个额外的列,其中包含每个组中的行数。换句话说,我有平均值,但我也想知道使用了多少数字来获得这些平均值。例如,在第一组中有8个值,在第二组中有10个等等。
简而言之:如何获取数据框的分组统计信息?