如果 expr 是整数类型,则为 BIGINT。 如果 expr DECIMAL(p, s) ,则结果为 DECIMAL(p + min(10, 31-p), s) 。 如果 expr 是一个间隔,则结果类型与 expr 匹配。

否则为 DOUBLE。

如果指定了 DISTINCT ,则只对唯一值求和。

如果结果溢出结果类型,则 Databricks SQL 会引发 ARITHMETIC_OVERFLOW 错误。 要返回 NULL,请改为使用 try_sum

在 Databricks Runtime 中,如果 spark.sql.ansi.enabled false ,则 BIGINT 的溢出不会导致错误,而是会将结果“换行”。

> SELECT sum(col) FROM VALUES (5), (10), (15) AS tab(col);
> SELECT sum(col) FILTER(WHERE col <15)
    FROM VALUES (5), (10), (15) AS tab(col);
> SELECT sum(DISTINCT col) FROM VALUES (5), (10), (10), (15) AS tab(col);
> SELECT sum(col) FROM VALUES (NULL), (10), (15) AS tab(col);
> SELECT sum(col) FROM VALUES (NULL), (NULL) AS tab(col);
-- try_sum overflows a BIGINT
> SELECT try_sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
-- In ANSI mode sum returns an error if it overflows BIGINT
> SELECT sum(c1) FROM VALUES(5E18::BIGINT), (5E18::BIGINT) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW
-- try_sum overflows an INTERVAL
> SELECT try_sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
-- sum returns an error on INTERVAL overflow
> SELECT sum(c1) FROM VALUES(INTERVAL '100000000' YEARS), (INTERVAL '100000000' YEARS) AS tab(c1);
 Error: ARITHMETIC_OVERFLOW
  • avg 聚合函数
  • max 聚合函数
  • mean 聚合函数
  • min 聚合函数
  • try_sum 聚合函数
  • try_avg aggregate 函数
  •