lead()函数和lag()这两个在实际业务中其实用的并没有那么多,不过在sql的面试当中倒是经常出现需要用到lead()和lag()这两个函数的问题,且通常使用这个函数的案例其实都是取连续的日期,之前硬是靠自关联写了一大堆sql写出来的(汗),今天突然发现了这两个函数,就正好写一下吧使用.
lead()函数里面可以输入三个参数:(字段,向前行数,值如果为null的话的补充值)
不过这两个一个是取前一条数据,一个是取后一条,我这里拿具体的例子来写一下吧
场景1:
select
day_id as ss
,lead(day_id,1,null) over(order by day_id) etime
from imedw.dim_pub_date
这里day_id是一个具体日期,over开窗函数里没有加distribute by 字段
这样的话etime就是当前行的上一行
场景2:
select
day_id as ss
,lead(day_id,1,null) over(distribute by user_id order by day_id) etime
from imedw.dim_pub_date
这样的话,就在over里面进行了分组操作,即把每一个user_id看做一个整体,只取单个user的向前一条数据,你可以理解为,场景二是场景一的细化,把每一个user_id拆成了一个场景一
这里涉及一点开窗的知识.
具体工作当中,还是场景2更常见一些