我有一个 python-anda-DataFrame,其中第一列是 "user_id"
,其余的列是标记(从 "Tag_0"
到 "Tag_122"
)。
我有以下格式的数据:
UserId Tag_0 Tag_1
7867688 0 5
7867688 0 3
7867688 3 0
7867688 3.5 3.5
7867688 4 4
7867688 3.5 0
我的目标是为每个 user _ id 实现 Sum(Tag)/Count(NonZero(Tags))
df.groupby('user_id').sum()
,给我 sum(tag)
,但是我对计算非零值毫无头绪
是否可以在一个命令中实现 Sum(Tag)/Count(NonZero(Tags))
?
在 MySQL 中,我可以这样做:-
select user_id, sum(tag)/count(nullif(tag,0)) from table group by 1
如有任何帮助,我将不胜感激。