sudo yum install postgresql12-contrib
然后再次执行上面的 create extension 命令安装 tablefunc 模块。
接下来就可以通过 crosstab 函数将行转换成列,例如:
select *
from crosstab(
$$select product||'-'||channel pc,product,channel, to_char(saledate, 'YYYYMM'), sum(amount)
from sales_data
group by product||'-'||channel, product, channel, to_char(saledate, 'YYYYMM')
order by 1$$,
$$select distinct to_char(saledate, 'YYYYMM') from sales_data order by 1$$
as ct(pc text, product text, channel text,
"201901" numeric, "201902" numeric, "201903" numeric,
"201904" numeric, "201905" numeric, "201906" numeric);
crosstab 函数包含 2 个字符串类型的参数,都是查询语句;第一个 select 语句用于构造源数据,crosstab 的源数据需要指定一个标识每个结果行的字段,示例中使用 pc;第二个 select 语句的结果用于构造转换之后的字段;as 子句用于定义返回结果的字段类型。
pc |product |channel |201901 |201902 |201903 |201904 |201905 |201906 |
桔子-京东|桔子 |京东 |41289.00|43913.00|49803.00|49256.00|64889.00|62649.00|
桔子-店面|桔子 |店面 |41306.00|37906.00|48866.00|48673.00|58998.00|58931.00|
桔子-淘宝|桔子 |淘宝 |43488.00|37598.00|48621.00|49919.00|58530.00|64626.00|
苹果-京东|苹果 |京东 |38269.00|40593.00|56552.00|56662.00|64493.00|62045.00|
苹果-店面|苹果 |店面 |43845.00|40539.00|44909.00|55646.00|56771.00|64933.00|
苹果-淘宝|苹果 |淘宝 |42969.00|43289.00|48769.00|58052.00|58872.00|59844.00|
香蕉-京东|香蕉 |京东 |36879.00|36981.00|51748.00|54801.00|64936.00|60688.00|
香蕉-店面|香蕉 |店面 |41210.00|39420.00|50884.00|52085.00|60249.00|67597.00|
香蕉-淘宝|香蕉 |淘宝 |42468.00|41955.00|52780.00|54971.00|56504.00|59213.00|
接下来还需要增加一个总计行和总计列:
select coalesce(product, '【全部产品】') "产品", coalesce(channel, '【所有渠道】') "渠道",
sum("201901") "一月", sum("201902") "二月", sum("201903") "三月",
sum("201904") "四月", sum("201905") "五月", sum("201906") "六月",
sum("201901"+"201902"+"201903"+"201904"+"201905"+"201906") "总计"
from crosstab(
$$select product||'-'||channel pc,product,channel, to_char(saledate, 'YYYYMM'), sum(amount)
from sales_data
group by product||'-'||channel, product, channel, to_char(saledate, 'YYYYMM')
order by 1$$,
$$select distinct to_char(saledate, 'YYYYMM') from sales_data order by 1$$
as ct(pc text, product text, channel text,
"201901" numeric, "201902" numeric, "201903" numeric,
"201904" numeric, "201905" numeric, "201906" numeric)
group by rollup (product, channel);
我们基于 crosstab 函数的结果增加了一些总计数据并且修改了返回字段的名称,让结果更加接近 EXCEL 数据透视表:
产品 |渠道 |一月 |二月 |三月 |四月 |五月 |六月 |总计 |
桔子 |京东 | 41289| 43913| 49803| 49256| 64889| 62649| 311799|
桔子 |店面 | 41306| 37906| 48866| 48673| 58998| 58931| 294680|
桔子 |淘宝 | 43488| 37598| 48621| 49919| 58530| 64626| 302782|
桔子 |【所有渠道】|126083|119417|147290|147848|182417|186206| 909261|
苹果 |京东 | 38269| 40593| 56552| 56662| 64493| 62045| 318614|
苹果 |店面 | 43845| 40539| 44909| 55646| 56771| 64933| 306643|
苹果 |淘宝 | 42969| 43289| 48769| 58052| 58872| 59844| 311795|
苹果 |【所有渠道】|125083|124421|150230|170360|180136|186822| 937052|
香蕉 |京东 | 36879| 36981| 51748| 54801| 64936| 60688| 306033|
香蕉 |店面 | 41210| 39420| 50884| 52085| 60249| 67597| 311445|
香蕉 |淘宝 | 42468| 41955| 52780| 54971| 56504| 59213| 307891|
香蕉 |【所有渠道】|120557|118356|155412|161857|181689|187498| 925369|
【全部产品】|【所有渠道】|371723|362194|452932|480065|544242|560526|2771682|
数据透视表是一个非常实用的数据分析功能,可以用于实现复杂的数据分类汇总和对比分析。本文介绍了在 PostgreSQL 中实现数据透视表的三种方式,包括使用 CASE 条件表达式和分组聚合相结合、聚合函数的 FILTER 子句以及扩展模块 tablefunc 中的 crosstab 函数生成数据透视表。
如果觉得文章对你有用,欢迎关注❤️、评论📝、点赞👍!
数据透视表(Pivot Table)是进行数据汇总、分析、浏览和展示的强大工具,可以帮助我们了解数据中的对比情况、模式和趋势,是数据分析师和运营人员必备技能之一。本文介绍了在 PostgreSQL 中实现数据透视表的三种方式,包括使用 CASE 条件表达式和分组聚合相结合、聚合函数的 FILTER 子句以及扩展模块 tablefunc 中的 crosstab 函数生成数据透视表。
交叉表(Cross Tabulations)是一种常用的分类汇总表格。使用交叉表查询,显示源于表中某个字段的汇总值,并将它们分组,其中一组列在数据表的左侧,另一组列在数据表的上部。行和列的交叉处可以对数据进行多种汇总计算,如:求和、平均值、记数、最大值、最小值等。使用交叉表查询数据非常直观明了,被广泛应用。交叉表查询也是数据库的一个特点。
select 表1.组名,
(select 表1.成员姓名 from 表2 b where 表1.成员1id=表2.成员id) as 成员1id,
(select 表1.成员姓名 from 表2 b where 表1.成员2
做过数据清洗ETL工作的都知道,行列转换是一个常见的数据整理需求。在不同的编程语言中有不同的实现方法,比如SQL中使用case+group,或者Power BI的M语言中用拖放组件实现。今天正好需要在PostgreSQL中处理一个数据行列转换,就把这个方法记录下来。
首先明确一下啥叫行列转换,因为这个叫法也不是很统一,有的地方叫转置,有的地方叫透视,不一而足。我们就以下表为例,定义如下:
oracle11g开始内置了数据透视表pivot table这一功能,可以用来实现行列转换的功能,但是在数据量较大的时候使用性能就会较差。
pivot语法为:
SELECT ...
FROM ...
PIVOT [XML]
(pivot_clause
pivot_for_clause
pivot_in_clause )
WH...
PostgreSQL中的crosstab(行转列函数)
行转列是一个非常有用的功能,如果不适用行转列函数,则通用做法是使用 case when 。不过,接下来,介绍一下今天的新主角–crosstab
一、安装扩展
环境:centos7 、pg10(yum 安装)、扩展组件 tablefunc
crosstab 需要按照扩展tablefunc
[root@uzong ~]# su postgre...
PostgreSQL是一个历史悠久的数据库,历史可以追溯到1973年,最早由2014计算机图灵奖得主,关系数据库的鼻祖Michael_Stonebraker操刀设计,PostgreSQL具备与Oracle类似的功能、性能、架构以及稳定性。
Postgr...
UPDATE table_name
SET column1 = value1, column2 = value2, ...
WHERE some_column = some_value;
其中,table_name 是要更新的数据表的名称,column1、column2 等是要更新的列名,value1、value2 等是要更新的值。WHERE 子句用于指定要更新的行,some_column 是要匹配的列名,some_value 是要匹配的值。
例如,要将学生表中名字为 Tom 的学生的年龄改为 20 岁,可以这样写:
UPDATE student
SET age = 20
WHERE name = 'Tom';
这将更新 student 表中名字为 Tom 的学生的年龄为 20 岁。