mysql 窗口函数性能 mysql中窗口函数_mysql 窗口函数


一、窗口函数

1、基本语法


<


2、大概分类

专用窗口函数


比如 rank,dense_rank, row_number等


聚合函数


比如 sum,count,avg,max,min等


二、如何使用窗口函数(聚合函数作为窗口函数)

1、聚合函数 + over()函数

问题:求每个店铺,每天的销量和全部销量的均值对比;


mysql 窗口函数性能 mysql中窗口函数_mysql 窗口函数性能_02

店铺销量表——shop_sale


-- 一般的解决办法


第一段代码虽然可以实现我们的需求,但代码略繁琐,窗口函数可以简化代码;

over()函数的作用,就是将聚合结果显示在每条单独的记录中。

2、partition by 子句

上面的例子,展示的是“每个店铺,每天销量和全部销量均值作比较”;

但如果店铺之间的差异不大,那么用全部销量的均值作为比较标准还可以,如果店铺之间的销量差异很大,那么就不具备可比性了,店铺销量自己和自己比;

这里的需求分成2部分,一是所有店铺的每日销量,二是店铺的销量均值;


-- 一般的解决方案


partition by 的作用类似于 group by,但确实在over()函数中使用,按照指定的列进行分组,聚合函数就会在分好的组内运算。

3、order by 子句

order by 子句比较好理解,即在over()函数中进行指定的排序;

为什么需要order by子句呢?还是用上面的例子。

上面的例子,考虑到了店铺之间销量的差异问题,所以店铺用自己的销量均值作比较,但还是不够严谨,因为我们不能用未来的信息和现在的信息进行比较;

比如 1月2日的销量,在求均值时就不应该包含1月3日的销量,而只应该包括1月2日及之前的销量,这种聚合方式也被叫做【顺序聚合】。


select


三、专用窗口函数

1、序列函数:rank,dense_4rank,row_number,以及3者的区别:


mysql 窗口函数性能 mysql中窗口函数_mysql分组后组内排序_03


select


案例:如何使用排名函数解决 Top N 问题——每组最大/小的N条记录

按课程号分组取成绩最大值所在行的数据


mysql 窗口函数性能 mysql中窗口函数_mysql 窗口函数_04


笨办法 , 关联子查询


select


窗口函数的解题思路


select


2、ntile()函数

ntile()函数,是在默认不对表进行任何操作之前,进行切片分组。


select


先按照 shopname 分组,然后在组内按照销量升序排列,最后切片分组


mysql 窗口函数性能 mysql中窗口函数_mysql分组后组内排序_05


3、lag() 和 lead() 函数

lag()是指向后移动,lead()是指向前移动;

怎么理解这2个函数?

lag(),就相当于在Excel中,某个单元格前面插入一行时,【活动单元格下移】;

lead(),则相当于【活动单元格上移】,只不过Excel中没有这个选项罢了;

这2个函数有什么用?

比如说:按照shopname分组,求各分组内,前后2天的销量之差。


mysql 窗口函数性能 mysql中窗口函数_mysql分组后组内排序_06


select


mysql 窗口函数性能 mysql中窗口函数_mysql窗口函数_07

运行结果

4、移动平均

rows 行数 preceding,表示本行以及前2行的平均。


select


四、总结

1、窗口函数的功能:

1、同时具有分组和排序的功能;
2、不减少原表的行数,经常用于组内排名;

2、注意事项:

窗口函数是对where 或 group by 子句处理后的结果进行操作,所以窗口函数理论上只能写在select子句中。

3、窗口函数的使用场景:

1、Top N问题
2、排名问题
3、组内比较问题(聚合函数)
4、移动平均