======01【###group by 多个字段,字段顺序对查询结果数据没有影响,只是record顺序不同而已】
group by 后面的字段顺序 只是影响了结果的顺序
不会影响结果的值。
如果是 group by a,b
那么就是按照 order by a,b 的顺序分组,因为分组是需要先排序的
反之 group by b,a 就是按照b,a的顺序分组
案例:
--> 测试数据:[tb]
IF OBJECT_ID('[tb]') IS NOT NULL DROP TABLE [tb]
GO
CREATE TABLE [tb]([col1] INT,[col2] INT,[col3] INT)
INSERT [tb]
SELECT 1,3,5 UNION ALL
SELECT 1,3,5 UNION ALL
SELECT 2,1,8 UNION ALL
SELECT 2,1,8 UNION ALL
SELECT 3,2,3 UNION ALL
SELECT 3,2,3 UNION ALL
SELECT 4,0,NULL UNION ALL
SELECT 4,0,NULL
--------------开始查询--------------------------
SELECT * FROM [tb] GROUP BY [col1] ,[col2] ,[col3]
SELECT * FROM [tb] GROUP BY [col3] ,[col2] ,[col1]
SELECT * FROM [tb] GROUP BY [col2] ,[col3] ,[col1]
SELECT * FROM [tb] GROUP BY [col1] ,[col2] ,[col3] ORDER BY [col1] ,[col2] ,[col3]
SELECT * FROM [tb] GROUP BY [col3] ,[col2] ,[col1] ORDER BY [col1] ,[col2] ,[col3]
SELECT * FROM [tb] GROUP BY [col2] ,[col3] ,[col1] ORDER BY [col1] ,[col2] ,[col3]
/*
col1 col2 col3
----------- ----------- -----------
1 3 5
2 1 8
3 2 3
4 0 NULL
(4 行受影响)
col1 col2 col3
----------- ----------- -----------
4 0 NULL
3 2 3
1 3 5
2 1 8
(4 行受影响)
col1 col2 col3
----------- ----------- -----------
4 0 NULL
2 1 8
3 2 3
1 3 5
(4 行受影响)
col1 col2 col3
----------- ----------- -----------
1 3 5
2 1 8
3 2 3
4 0 NULL
(4 行受影响)
col1 col2 col3
----------- ----------- -----------
1 3 5
2 1 8
3 2 3
4 0 NULL
(4 行受影响)
col1 col2 col3
----------- ----------- -----------
1 3 5
2 1 8
3 2 3
4 0 NULL
(4 行受影响)
*/
======02拓展:【GROUP BY分组查询与SQL执行顺序】
在SQL中使用GROUP BY来对SELECT的结果进行数据分组,在具体使用GROUP BY之前需要知道一些重要的规定。
- GROUP BY子句可以包含任意数目的列。也就是说可以在组里再分组,为数据分组提供更细致的控制。
- 如果在GROUP BY子句中指定多个分组,数据将在最后指定的分组上汇总。
- GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用了表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名。
- 除了聚集计算语句外,SELECT语句中的每一列都必须在GROUP BY子句中给出。
- 如果分组列中有NULL值,则NULL将作为一个分组返回。如果有多行NULL值,它们将分为一组。
- GROUP BY子句必须在WHERE子句之后,ORDER BY之前。
过滤分组
对分组过于采用HAVING子句。HAVING子句支持所有WHERE的操作。HAVING与WHERE的区别在于WHERE是过滤行的,而HAVING是用来过滤分组。
另一种理解WHERE与HAVING的区别的方法是,WHERE在分组之前过滤,而HAVING在分组之后以每组为单位过滤。
分组与排序
一般在使用GROUP BY子句时,也应该使用ORDER BY子句。这是保证数据正确排序的唯一方法。
SQL SELECT语句的执行顺序:
- from子句组装来自不同数据源的数据;
- where子句基于指定的条件对记录行进行筛选;
- group by子句将数据划分为多个分组;
- 使用聚集函数进行计算;
- 使用having子句筛选分组;
- 计算所有的表达式;
- 使用order by对结果集进行排序;
- select 集合输出。
举个例子吧。
1 select 考生姓名, max(总成绩) as max总成绩
2 from tb_Grade
3 where 考生姓名 is not null
4 group by 考生姓名
5 having max(总成绩) > 600
6 order by max总成绩
在上面的示例中 SQL 语句的执行顺序如下:
- 首先执行 FROM 子句, 从 tb_Grade 表组装数据源的数据
- 执行 WHERE 子句, 筛选 tb_Grade 表中所有数据不为 NULL 的数据
- 执行 GROUP BY 子句, 把 tb_Grade 表按 "学生姓名" 列进行分组
- 计算 max() 聚集函数, 按 "总成绩" 求出总成绩中最大的一些数值
- 执行 HAVING 子句, 筛选课程的总成绩大于 600 分的.
- 执行 ORDER BY 子句, 把最后的结果按 "Max 成绩" 进行排序.
注:如果使用了连接join和on,则会在where执行之前先执行on,然后执行join,接着才去执行where。
附:
MySQL中的聚集函数:
1、count()返回某列的行数
2、avg()返回某列的平均值
3、max()返回某列的最大值
4、min()返回某列的最小值
5、sum()返回某列的和
6、distinct 去除重复值
注:avg()忽略值为null的行,count(*)时统计所有行,count(列)时忽略为null的行