java groupby 多字段 groupby多个字段先后顺序

转载

mob64ca14122c74 2023-12-03 22:46:22

文章标签 java groupby 多字段数据库数据执行顺序 MySQL 文章分类 Java 后端开发

在SQL中使用GROUP BY来对SELECT的结果进行数据分组，在具体使用GROUP BY之前需要知道一些重要的规定。

GROUP BY子句可以包含任意数目的列。也就是说可以在组里再分组，为数据分组提供更细致的控制。
如果在GROUP BY子句中指定多个分组，数据将在最后指定的分组上汇总。
GROUP BY子句中列出的每个列都必须是检索列或有效的表达式（但不能是聚集函数）。如果在SELECT中使用了表达式，则必须在GROUP BY子句中指定相同的表达式。不能使用别名。
除了聚集计算语句外，SELECT语句中的每一列都必须在GROUP BY子句中给出。
如果分组列中有NULL值，则NULL将作为一个分组返回。如果有多行NULL值，它们将分为一组。
GROUP BY子句必须在WHERE子句之后，ORDER BY之前。

过滤分组

对分组过于采用HAVING子句。HAVING子句支持所有WHERE的操作。HAVING与WHERE的区别在于WHERE是过滤行的，而HAVING是用来过滤分组。

另一种理解WHERE与HAVING的区别的方法是，WHERE在分组之前过滤，而HAVING在分组之后以每组为单位过滤。

分组与排序

一般在使用GROUP BY子句时，也应该使用ORDER BY子句。这是保证数据正确排序的唯一方法。

SQL SELECT语句的执行顺序：

from子句组装来自不同数据源的数据；
where子句基于指定的条件对记录行进行筛选；
group by子句将数据划分为多个分组；
使用聚集函数进行计算；
使用having子句筛选分组；
计算所有的表达式；
使用order by对结果集进行排序；
select 集合输出。

举个例子吧。

1	select 考生姓名, max(总成绩) as max总成绩
2	from tb_Grade
3	where 考生姓名 is not null
4	group by 考生姓名
5	having max(总成绩) > 600
6	order by max总成绩

在上面的示例中 SQL 语句的执行顺序如下：

首先执行 FROM 子句, 从 tb_Grade 表组装数据源的数据
执行 WHERE 子句, 筛选 tb_Grade 表中所有数据不为 NULL 的数据
执行 GROUP BY 子句, 把 tb_Grade 表按 "学生姓名" 列进行分组
计算 max() 聚集函数, 按 "总成绩" 求出总成绩中最大的一些数值
执行 HAVING 子句, 筛选课程的总成绩大于 600 分的.
执行 ORDER BY 子句, 把最后的结果按 "Max 成绩" 进行排序.

注：如果使用了连接join和on，则会在where执行之前先执行on，然后执行join，接着才去执行where。

java groupby 多字段 groupby多个字段先后顺序_数据

附：

MySQL中的聚集函数：

1、count（）返回某列的行数
2、avg（）返回某列的平均值
3、max（）返回某列的最大值
4、min（）返回某列的最小值
5、sum（）返回某列的和
6、distinct 去除重复值
注：avg（）忽略值为null的行，count（*）时统计所有行，count（列）时忽略为null的行

MySQL的语句执行顺序

MySQL的语句一共分为11步，如下图所标注的那样，最先执行的总是FROM操作，最后执行的是LIMIT操作。其中每一个操作都会产生一张虚拟的表，这个虚拟的表作为一个处理的输入，只是这些虚拟的表对用户来说是透明的，但是只有最后一个虚拟的表才会被作为结果返回。如果没有在语句中指定某一个子句，那么将会跳过相应的步骤。

java groupby 多字段 groupby多个字段先后顺序_MySQL_02

下面我们来具体分析一下查询处理的每一个阶段

FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1
ON: 对虚表VT1进行ON筛选，只有那些符合<join-condition>的行才会被记录在虚表VT2中。
JOIN：如果指定了OUTER JOIN（比如left join、 right join），那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中，产生虚拟表VT3, rug from子句中包含两个以上的表的话，那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤，一直到处理完所有的表为止。
WHERE：对虚拟表VT3进行WHERE条件过滤。只有符合<where-condition>的记录才会被插入到虚拟表VT4中。
GROUP BY: 根据group by子句中的列，对VT4中的记录进行分组操作，产生VT5.
CUBE | ROLLUP: 对表VT5进行cube或者rollup操作，产生表VT6.
HAVING：对虚拟表VT6应用having过滤，只有符合<having-condition>的记录才会被插入到虚拟表VT7中。
SELECT：执行select操作，选择指定的列，插入到虚拟表VT8中。
DISTINCT：对VT8中的记录进行去重。产生虚拟表VT9.
ORDER BY: 将虚拟表VT9中的记录按照<order_by_list>进行排序操作，产生虚拟表VT10.
LIMIT：取出指定行的记录，产生虚拟表VT11, 并将结果返回。