我正在使用 PySpark DataFrames 分析一些数据,假设我有一个正在聚合的 DataFrame df
:
(df.groupBy("group")
.agg({"money":"sum"})
.show(100)
)
这会给我:
group SUM(money#2L)
A 137461285853
B 172185566943
C 271179590646
聚合工作得很好,但我不喜欢新列名 SUM(money#2L)
。有没有一种方法可以将这个列重命名为从 .agg
方法可读的内容?也许有些东西更类似于在 dplyr
中会做的事情:
df %>% group_by(group) %>% summarise(sum_money = sum(money))