1. 在具体使用GROUP BY子句前,需要知道一些重要的规定

  • GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。
  • 如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。
  • GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名。
  • 除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句中给出。
  • 如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。
  • GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。

【注】:使用WITH ROLLUP关键字,可以得到每个分组(包括NULL)以及每个分组汇总级别(针对每个分组)的值。如下(运行结果,左图):

SELECT spancount, COUNT(*)
FROM article
GROUP BY spancount WITH ROLLUP;

未加WITH ROLLUP的查询(结果如,右图):

SELECT spancount, COUNT(*)
FROM article
GROUP BY spancount;

MySQL分组命令 mysql分组having_MySQL分组命令

            

MySQL分组命令 mysql分组having_MySQL_02

2. 过滤分组(HAVING)

WHERE过滤指定的是行而不是分组。事实上,WHERE没有分组的概念。

那么,不使用WHERE使用什么呢?MySQL为此目的提供了另外的子句,那就是HAVING子句。HAVING非常类似于WHERE。事实上,目前为止所学过的所有类型的WHERE子句都可以用HAVING来替代。唯一的差别是WHERE过滤行,而HAVING过滤分组。HAVING支持所有WHERE操作符。

SELECT spancount, COUNT(*)
FROM article
GROUP BY spancount
HAVING count(*) > 10;

MySQL分组命令 mysql分组having_MySQL_03

【注】:HAVING和WHERE的差别

这里有另一种理解方法,WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。这是一个重要的区别,WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。

3. 分组和排序

虽然GROUP BY和ORDER BY经常完成相同的工作,但它们是非常不同的。

表1. ORDER BY与GROUP BY

ORDER BY

GROUP BY

排序产生的输出

分组行。但输出可能不是分组的顺序

任意列都可以使用(甚至非选择的列也可以使用)

只可能使用选择列或表达式列,而且必须使用每个选择列表达式

不一定需要

如果与聚集函数一起使用列(或表达式),则必须使用

【注】:不要忘记ORDER BY

一般在使用GROUP BY子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。

4. SELECT子句顺序

表2. SELECT子句及其顺序

子句

说明

是否必须使用

SELECT

要返回的列或表达式


FROM

从中检索数据的表

仅在从表选择数据时使用

WHERE

行级过滤


GROUP BY

分组说明

仅在按组计算聚集时使用

HAVING

组级过滤


ORDER BY

输出排序顺序


LIMIT

要检索的行数