从11g到19c，Oracle列转行函数listagg的增强史

原创

Hehuyi_In_666 2022-04-05 11:09:45 博主文章分类：Oracle ©著作权

文章标签 listagg 列转行 Oracle 新特性 xml 文章分类 Html/CSS 前端开发

©著作权归作者所有：来自51CTO博客作者Hehuyi_In_666的原创作品，请联系作者获取转载授权，否则将追究法律责任

一、构造测试表

本文中的示例依赖于以下测试表

CREATE TABLE emp (
  empno    NUMBER(4) PRIMARY KEY,
  ename    VARCHAR2(10),
  job      VARCHAR2(9),
  mgr      NUMBER(4),
  hiredate DATE,
  sal      NUMBER(7,2),
  comm     NUMBER(7,2),
  deptno   NUMBER(2)
);

INSERT INTO emp VALUES (7369,'SMITH','CLERK',7902,to_date('17-12-1980','dd-mm-yyyy'),800,NULL,20);
INSERT INTO emp VALUES (7499,'ALLEN','SALESMAN',7698,to_date('20-2-1981','dd-mm-yyyy'),1600,300,30);
INSERT INTO emp VALUES (7521,'WARD','SALESMAN',7698,to_date('22-2-1981','dd-mm-yyyy'),1250,500,30);
INSERT INTO emp VALUES (7566,'JONES','MANAGER',7839,to_date('2-4-1981','dd-mm-yyyy'),2975,NULL,20);
INSERT INTO emp VALUES (7654,'MARTIN','SALESMAN',7698,to_date('28-9-1981','dd-mm-yyyy'),1250,1400,30);
INSERT INTO emp VALUES (7698,'BLAKE','MANAGER',7839,to_date('1-5-1981','dd-mm-yyyy'),2850,NULL,30);
INSERT INTO emp VALUES (7782,'CLARK','MANAGER',7839,to_date('9-6-1981','dd-mm-yyyy'),2450,NULL,10);
INSERT INTO emp VALUES (7788,'SCOTT','ANALYST',7566,to_date('13-JUL-87','dd-mm-rr')-85,3000,NULL,20);
INSERT INTO emp VALUES (7839,'KING','PRESIDENT',NULL,to_date('17-11-1981','dd-mm-yyyy'),5000,NULL,10);
INSERT INTO emp VALUES (7844,'TURNER','SALESMAN',7698,to_date('8-9-1981','dd-mm-yyyy'),1500,0,30);
INSERT INTO emp VALUES (7876,'ADAMS','CLERK',7788,to_date('13-JUL-87', 'dd-mm-rr')-51,1100,NULL,20);
INSERT INTO emp VALUES (7900,'JAMES','CLERK',7698,to_date('3-12-1981','dd-mm-yyyy'),950,NULL,30);
INSERT INTO emp VALUES (7902,'FORD','ANALYST',7566,to_date('3-12-1981','dd-mm-yyyy'),3000,NULL,20);
INSERT INTO emp VALUES (7934,'MILLER','CLERK',7782,to_date('23-1-1982','dd-mm-yyyy'),1300,NULL,10);

commit;

从11g到19c，Oracle列转行函数listagg的增强史_xml

二、12.1以前

Oracle 12c之前有一个内部函数wm_concat，用法超级简单

SELECT wm_concat(ename)

用途是把原本应该按列显示的ename，合并到一行显示并且用逗号分隔开

从11g到19c，Oracle列转行函数listagg的增强史_xml_02

也可以分组合并，例如

SELECT mgr, wm_concat(ename)
FROM emp
GROUP BY mgr;

从11g到19c，Oracle列转行函数listagg的增强史_xml_03

三、 12.1版本

1. 简单用法

从12.1开始，Oracle取消了wm_concat内部函数。其实11gR2开始，oracle就引入了listagg函数，固定语法如下：

LISTAGG(col_name, ',') WITHIN GROUP (ORDER BY col_name)

可以看到，它可以自己设置分隔符，还可以对分隔字段排序了。

我们也先来看一个最简单的用法

SELECT LISTAGG(ename, ',') WITHIN GROUP (ORDER BY ename) employees FROM emp;

从11g到19c，Oracle列转行函数listagg的增强史_listagg_04

再试试前面的按分组合并

COLUMN employees FORMAT A40

SELECT mgr, LISTAGG(ename, ',') WITHIN GROUP (ORDER BY ename) AS employees
FROM emp
GROUP BY mgr;

从11g到19c，Oracle列转行函数listagg的增强史_新特性_05

2. 字符串超长

不过listagg函数输出是有长度限制的(varchar2(4000))，超过该长度会收到报错 ORA-01489: result of string concatenation is too long

在以下示例中，我们使用CROSS JOIN来强制进行大型聚合。

COLUMN employees FORMAT A40
SELECT LISTAGG(ename, ',') WITHIN GROUP (ORDER BY ename) AS employees
FROM emp
 CROSS JOIN (SELECT level FROM dual CONNECT BY level <= 100); -- emp 14行*100行=1400个ename合并

从11g到19c，Oracle列转行函数listagg的增强史_Oracle_06

如果转换后的长度确实超过4000应该怎么办，网上找到了几种解决方法：

使用 xmlagg 函数
使用 stragg 函数
自己创建 PL/SQL 连接函数，并 returns type CLOB

3. 测试 xmlagg 函数

用法是：

rtrim(xmlagg(xmlelement(e,to_char(col_name),',').extract('//text()')

SELECT rtrim(xmlagg(xmlelement(e,ename,',').extract('//text()')))
FROM emp
CROSS JOIN (SELECT level FROM dual CONNECT BY level <= 100);

这里遇到另一个问题，虽然合并后的字段可以超过4000长度了，但又遇到另一个报错，解决方法后面补充

从11g到19c，Oracle列转行函数listagg的增强史_Oracle_07

三、 12.2版本

在12.2中，可以添加ON OVERFLOW TRUNCATE子句来优雅地处理溢出错误。默认情况下，truncate文字是省略号（'...'），并包含溢出字符的计数。

COLUMN employees FORMAT A40
SELECT LISTAGG(ename, ',' ON OVERFLOW TRUNCATE) WITHIN GROUP (ORDER BY ename) AS employees
FROM emp
CROSS JOIN (SELECT level FROM dual CONNECT BY level <= 100);

从11g到19c，Oracle列转行函数listagg的增强史_新特性_08

从11g到19c，Oracle列转行函数listagg的增强史_Oracle_09

如果遇到缺少右括号的报错，说明数据库版本太低，识别不了这个语法

从11g到19c，Oracle列转行函数listagg的增强史_新特性_10

如果不想使用省略号，也可以指定自己的truncate文字。在下面的示例中，我们使用了 ~~~。

COLUMN employees FORMAT A40
SELECT LISTAGG(ename, ',' ON OVERFLOW TRUNCATE '~~~') WITHIN GROUP (ORDER BY ename) AS employees
FROM emp
CROSS JOIN (SELECT level FROM dual CONNECT BY level <= 100);

从11g到19c，Oracle列转行函数listagg的增强史_xml_11

也可以通过添加WITHOUT COUNT来省略计数，默认值相当于显式使用WITH COUNT。

COLUMN employees FORMAT A40
SELECT LISTAGG(ename, ',' ON OVERFLOW TRUNCATE '~~~' WITHOUT COUNT) WITHIN GROUP (ORDER BY ename) AS employees
FROM emp
CROSS JOIN (SELECT level FROM dual CONNECT BY level <= 100);

从11g到19c，Oracle列转行函数listagg的增强史_listagg_12

四、 19c版本

1. LISTAGG DISTINCT

19c中，LISTAGG 增加了通过 distinct 关键字从结果中删除重复项的功能。

还是用上面那个示例表，我们在部门10中添加一些名为“MILLER”的额外人员，以便在聚合列表中为我们提供重复项。

INSERT INTO emp VALUES (9998,'MILLER','ANALYST',7782,to_date('23-1-1982','dd-mm-yyyy'),1600,NULL,10);
INSERT INTO emp VALUES (9999,'MILLER','MANADER',7782,to_date('23-1-1982','dd-mm-yyyy'),1500,NULL,10);
COMMIT;

正如预期的那样，我们现在在部门10中看到多个名为“MILLER”的条目

COLUMN employees FORMAT A40
SELECT deptno, LISTAGG(ename, ',') WITHIN GROUP (ORDER BY ename) AS employees
FROM   emp
GROUP BY deptno
ORDER BY deptno;

从11g到19c，Oracle列转行函数listagg的增强史_Oracle_13

如果想删除重复项，我们该怎么办？

2. 解决方案：19c之前

需要我们手动去重，可以用分析函数或者distinct

法1：用ROW_NUMBER分析函数删除重复项，然后使用常规LISTAGG函数。

COLUMN employees FORMAT A40
SELECT e2.deptno, LISTAGG(e2.ename, ',') WITHIN GROUP (ORDER BY e2.ename) AS employees
FROM (SELECT e.*,ROW_NUMBER() OVER (PARTITION BY e.ename ORDER BY e.empno) AS myrank FROM emp e) e2
WHERE e2.myrank = 1
GROUP BY e2.deptno
ORDER BY e2.deptno;

从11g到19c，Oracle列转行函数listagg的增强史_xml_14

法2：用distinct在内联视图中去重，然后使用常规LISTAGG函数。

COLUMN employees FORMAT A40
SELECT e2.deptno, LISTAGG(e2.ename, ',') WITHIN GROUP (ORDER BY e2.ename) AS employees
FROM (SELECT DISTINCT e.deptno, e.ename FROM emp e) e2
GROUP BY e2.deptno
ORDER BY e2.deptno;

从11g到19c，Oracle列转行函数listagg的增强史_列转行_15

3. 解决方案：19c及之后

19c引入了一种更简单的解决方案，可以直接在listagg函数中包含distinct关键字。

SELECT deptno, LISTAGG(DISTINCT ename, ',') WITHIN GROUP (ORDER BY ename) AS employees
FROM   emp
GROUP BY deptno
ORDER BY deptno;

从11g到19c，Oracle列转行函数listagg的增强史_listagg_16

参考

ORACLE-BASE - LISTAGG Function Enhancements in Oracle Database 12c Release 2 (12.2)

ORACLE-BASE - LISTAGG DISTINCT in Oracle Database 19c

上一篇：千年万岁，椒花颂声

下一篇：postgresql源码学习（三）—— 事务ID分配

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯