聚合函数

  • 常见的几个聚合函数
  • 1、avg():求平均数
  • 2、sum():求和
  • 3、max():求最大值
  • 4、min():求最小值
  • 5、count(*)返回记录总数
  • 分组函数
  • 使用GROUP BY子句将表中的数据分成若干组
  • having的使用


常见的几个聚合函数

1、avg():求平均数
2、sum():求和

字符串求和、求平均数,没有意义、不合理
avg():求平均数、sum():求和,只适用在数值类型 !!!

mysql> SELECT AVG(salary), MAX(salary),MIN(salary), SUM(salary)
    -> FROM employees
    -> WHERE job_id LIKE '%REP%';
+-------------+-------------+-------------+-------------+
| AVG(salary) | MAX(salary) | MIN(salary) | SUM(salary) |
+-------------+-------------+-------------+-------------+
| 8272.727273 |    11500.00 |     6000.00 |   273000.00 |
+-------------+-------------+-------------+-------------+
1 row in set (0.23 sec)
3、max():求最大值
4、min():求最小值

可以对任意数据类型的数据使用 MIN 和 MAX 函数。

mysql> SELECT MIN(hire_date), MAX(hire_date)
    -> FROM employees;
+----------------+----------------+
| MIN(hire_date) | MAX(hire_date) |
+----------------+----------------+
| 1987-06-17     | 2000-04-21     |
+----------------+----------------+
1 row in set (0.10 sec)
5、count(*)返回记录总数

1、适用于任意数据类型
2、count(expr) 返回expr不为空的记录总数

问题:用count(*),count(1),count(列名)谁好呢?
count(1)和count(100)都没啥区别
count(*) 和 count(1) 没啥区别,但好于具体的count(列名)。

不要使用 count(列名)来替代 count(*) 
说明:count(*)会统计值为 NULL 的行,而 count(列名)不会统计此列为 NULL 值的行。
案例:查询公司的平均奖金率

错误的:原因:聚合函数会自动过滤null值,而求平均数要用总数除以每一个人,包括null(没有奖金的)
select avg(commission_pct) 
from employees;

正确的:
select avg(ifnull(commission_pct,0))
或者sum(commission_pct)/count(ifnull(commission_pct,0)),
from employees;

分组函数

使用GROUP BY子句将表中的数据分成若干组

明确:WHERE一定放在FROM后面

案例:查询各个部门的平均薪资和最高工资
select department_id,avg(ifnull(salary,0)),max(salary)
from employees
group by department_id;

二级分组

select department_id,job_id,max(salary)
from employees
group by department,job_id;

总结:

  • 1、二级分组,直接加个逗号,跟着后面写就完事了
  • 2、select 中出现的 非组函数,必须声明在 group by 中
  • 使用 with rollup 关键字之后,在所有查询出的分组记录之后增加一条记录, 该记录计算查询出的所有记录的总和,即统计记录数量。
  • 但是使用了with rollup后就不可以使用排序 order by
SELECT department_id,AVG(salary)
FROM employees
WHERE department_id > 80
GROUP BY department_id WITH ROLLUP;

having的使用

案例:查询各个部门的最高工资比10000高的部门信息
select department_id,max(salary)
from employees
group by department_id
having max(salary)>10000 ;

总结:
1、前提是使用了聚合函数
2、having 不能单独使用,必须要跟 group by 一起使用
3、having 用来过滤聚合函数的
4、having 的效率比where 低

where 和 having 的对比

对比

优点

缺点

WHERE

先筛选数据再关联,执行效率高

不能使用分组中的计算函数进行筛选

HAVING

可以使用分组中的计算函数

在最后的结果集中进行筛选,执行效率较低

开发中的选择:
WHERE 和 HAVING 也不是互相排斥的,我们可以在一个查询里面同时使用
统计函数的条件用 HAVING,普通条件用WHERE。