mysql常用语句——GROUP BY和HAVING

创建表结构

create table `employ_info` (
   `id` int(11) NOT NULL AUTO_INCREMENT,
   `name` char(20) NOT NULL DEFAULT '',
   `dept` char(20) NOT NULL DEFAULT '',
   `salary` varchar(255) NOT NULL DEFAULT '',
   `edlevel` int(11) NOT NULL DEFAULT 0,
   `hiredate` varchar(255) NOT NULL DEFAULT '',
   PRIMARY KEY(`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8;

添加表内容

INSERT INTO `employ_info` VALUES(1,'张三','开发部','2000','3','2009-10-11'),
(2,'李四','开发部','2500','3','2009-10-11'),
(3,'王五','设计部','2600','5','2010-10-02'),
(4,'王六','设计部','2300','4','2010-10-03'),
(5,'马七','设计部','2100','4','2010-10-05'),
(6,'赵八','销售部','3000','5','2010-10-07'),
(7,'钱九','销售部','3100','7','2010-10-07'),
(8,'孙十','销售部','3500','7','2010-10-06');

GROUP BY语法可以根据给定数据列的每个成员对查询结果进行分组统计,最终得到一个分组汇总表。
select子句中的列名必须为分组列或列函数,列函数对于group by子句定义的每个组返回一个结果。
某个员工信息表结构和数据如下:

mysql> select * from employ_info;
+----+--------+-----------+--------+---------+------------+
| id | name   | dept      | salary | edlevel | hiredate   |
+----+--------+-----------+--------+---------+------------+
|  1 | 张三   | 开发部    | 2000   |       3 | 2009-10-11 |
|  2 | 李四   | 开发部    | 2500   |       3 | 2009-10-11 |
|  3 | 王五   | 设计部    | 2600   |       5 | 2010-10-02 |
|  4 | 王六   | 设计部    | 2300   |       4 | 2010-10-03 |
|  5 | 马七   | 设计部    | 2100   |       4 | 2010-10-05 |
|  6 | 赵八   | 销售部    | 3000   |       5 | 2010-10-07 |
|  7 | 钱九   | 销售部    | 3100   |       7 | 2010-10-07 |
|  8 | 孙十   | 销售部    | 3500   |       7 | 2010-10-06 |
+----+--------+-----------+--------+---------+------------+
8 rows in set (0.07 sec)

我想列出每个部门最高薪水的结果,sql语句如下:

mysql> select dept,max(salary) AS MAXIMUM from employ_info group by dept;
+-----------+---------+
| dept      | MAXIMUM |
+-----------+---------+
| 开发部    | 2500    |
| 设计部    | 2600    |
| 销售部    | 3500    |
+-----------+---------+
3 rows in set (0.37 sec)

解释一下这个结果:
1、 满足“SELECT子句中的列名必须为分组列或列函数”,因为SELECT有group by中包含的列dept;
2、“列函数对于group by子句定义的每个组各返回一个结果”,根据部门分组,对每个部门返回一个结果,就是每个部门的最高薪水。
将where子句与group by子句一起使用
分组查询可以在形成组和计算列函数之前具有消除非限定行的标准where子句。必须在group by子句之前指定where子句

例如,查询公司2010年入职的各个部门每个级别里的最高薪水

mysql> select dept,edlevel,MAX(salary) AS MAXIMUM from employ_info group by dept,edlevel;
+-----------+---------+---------+
| dept      | edlevel | MAXIMUM |
+-----------+---------+---------+
| 开发部    |       3 | 2500    |
| 设计部    |       4 | 2300    |
| 设计部    |       5 | 2600    |
| 销售部    |       5 | 3000    |
| 销售部    |       7 | 3500    |
+-----------+---------+---------+
5 rows in set (0.00 sec)

mysql> select dept,edlevel,MAX(salary) AS MAXIMUM from employ_info where hiredate='2010-01-01' group by dept,edlevel;
Empty set (0.00 sec)

mysql> select dept,edlevel,MAX(salary) AS MAXIMUM from employ_info where hiredate='2010-01-07' group by dept,edlevel;
Empty set (0.00 sec)

在SELECT语句中指定的每个列名也在GROUP BY子句中提到,未在这两个地方提到的列名将产生错误。GROUP BY子句对dept和edlevel的每个唯一组合各返回一行。

GROUP BY子句之后使用Having子句

可应用限定条件进行分组,以便系统仅对满足条件的组返回结果。因此,在GROUP BY子句后面包含了一个HAVING子句。HAVING类似于WHERE(唯一的差别是WHERE过滤行,HAVING过滤组)AVING支持所有WHERE操作符。

例如,查找雇员数超过2个的部门的最高和最低薪水:

mysql> select dept,MAX(salary) as MAXIMUM,MIN(salary) as MINIMUM from employ_info group by dept having count(*)>2 order by dept;
+-----------+---------+---------+
| dept      | MAXIMUM | MINIMUM |
+-----------+---------+---------+
| 设计部    | 2600    | 2100    |
| 销售部    | 3500    | 3000    |
+-----------+---------+---------+
2 rows in set (0.09 sec)

例如,查找雇员平均工资大于3000的部门的最高薪水和最低薪水:

mysql> select dept,max(salary) as MAXIMUM,MIN(salary) as MINIMUM from employ_info group by dept having avg(salary)>3000 order by dept;
+-----------+---------+---------+
| dept      | MAXIMUM | MINIMUM |
+-----------+---------+---------+
| 销售部    | 3500    | 3000    |
+-----------+---------+---------+
1 row in set (0.00 sec)