计算 PostgreSQL 中的累积和

小开

最佳答案

基本上，你需要一个窗口功能。这是现在的标准功能。除了真正的窗口函数外，你还可以在 Postgres 使用任何聚合函数作为窗口函数，方法是附加一个 OVER子句。

这里的特殊困难在于正确分区和排序顺序:

SELECT ea_month, id, amount, ea_year, circle_id
, sum(amount) OVER (PARTITION BY circle_id
ORDER BY ea_year, ea_month) AS cum_amt
FROM   tbl
ORDER  BY circle_id, ea_year, ea_month;

还有没有 GROUP BY。

每一行的和是从分区的第一行到当前行计算出来的——或者引用手册来确定:

默认的帧选项是 RANGE UNBOUNDED PRECEDING，即与 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW相同 ORDER BY，这将框架设置为 < strong > 分区中的所有行通过当前行的最后一个 ORDER BY对等点启动

强调我的。这是您所追求的累积(或“运行”)总和。

在默认的 RANGE模式下，排序顺序相同的行在此查询中是 「同侪」-相同的 (circle_id, ea_year, ea_month)。所有这些都显示相同的运算和，所有对等点都加到这个和中。但是我假设您的表是 (circle_id, ea_year, ea_month)上的 UNIQUE，那么排序顺序是确定的，没有行具有对等点。(你也可以使用更便宜的 ROWS模式。)

Postgres 11增加了新的 frame_exclusion选项包含/排除对等点的工具:

聚合不在同一组中的所有值

现在，ORDER BY ... ea_month< strong > 不能使用月份名称的字符串 .Postgres 将根据地区设置按字母顺序排序。

如果在表中存储了实际的 date值，则可以正确排序。如果没有，我建议在表中用 date类型的单列 the_date替换 ea_year和 ea_month。

用 to_date()改变你所拥有的:

  to_date(ea_year || ea_month , 'YYYYMonth') AS the_date

为了便于显示，可以使用 to_char()获取原始字符串:

  to_char(the_date, 'Month') AS ea_month
to_char(the_date, 'YYYY')  AS ea_year

虽然被这个不幸的设计困住了，这个方法还是可行的:

SELECT ea_month, id, amount, ea_year, circle_id
, sum(amount) OVER (PARTITION BY circle_id ORDER BY the_date) AS cum_amt
FROM   (SELECT *, to_date(ea_year || ea_month, 'YYYYMonth') AS the_date FROM tbl) sub
ORDER  BY circle_id, mon;