MYSQL lag() 和lead()函数使用介绍_随笔

LAG()函数是一个窗口函数，允许您从当前行向前看多行数据。与LEAD()函数类似，LEAD()函数对于计算同一结果集中当前行和后续行之间的差异非常有用。

LAG语法： LAG(列名,[offset], [default_value]) OVER ( PARTITION BY 列名,... ORDER BY 列名 [ASC|DESC],... )

LEAD语法： LEAD(列名,[offset], [default_value]) OVER ( PARTITION BY 列名,... ORDER BY 列名 [ASC|DESC],... )

offset：offset是从当前行偏移的行数，以获取值。offset必须是一个非负整数。如果offset为零，则LEAD()函数计算当前行的值。如果省略 offset，则LEAD()函数默认使用一个。

default_value：如果没有后续行，则LEAD()函数返回default_value。例如，如果offset是1，则最后一行的返回值为default_value。如果您未指定default_value，则函数返回 NULL 。

PARTITION BY子句：PARTITION BY子句将结果集中的行划分LEAD()为应用函数的分区。如果PARTITION BY未指定子句，则结果集中的所有行都将被视为单个分区。

ORDER BY子句：ORDER BY子句确定LEAD()应用函数之前分区中行的顺序。

用途举例：

ps：

不适合计算留存，举例说明：

求3日留存用户，以下为用户登录表login_history_table：

首先使用LEAD函数对用户登录时间做偏移，SQL如下：

结果如下：

根据上面查询到的结果，3日留存用户中不能统计到abc，而实际应该包含abc，因为该用户20211022登录后，在3天后的20211025日又重新登录了。

分别在 MySQL5.7.25-log 和 8.0.16 环境中实现类似Oracle的分析函数(8.0版本中已支持，直接使用即可)。

一、创建测试数据

二、row_number() over()

三、rank() over()

四、dense_rank() over()

五、lag() over()

六、lead() over()

七、待补充

例1：不分组，全部数据添加序列号，类Oracle 的rownum伪列

例2：先按roomid分组，再按照deviceid,counter排序，类Oracle 的row_number() OVER(PARTITION BY ORDER BY )

例1：不分组，全部数据按 roomid 排序，再添加序号，类Oracle 的rank() OVER(ORDER BY)

例2：先按roomid分组，再按deviceid排序，类Oracle 的rank() OVER(PARTITION BY ORDER BY)

例1：不分组，全部数据按roomid排序，再添加序号，类Oracle 的dense_rank() OVER(ORDER BY)

例2：先按roomid分组，再按deviceid排序，类Oracle 的dense_rank() OVER(PARTITION BY ORDER BY)

例1：不分组，全部数据按roomid,deviceid升序排序，类Oracle 的lag() OVER(ORDER BY)

例2：先按roomid分组，再按roomid,deviceid排序，类Oracle 的lag() OVER(PARTITION BY ORDER BY)

例1：不分组，全部数据按roomid,deviceid,counter升序排序，类Oracle 的lead() OVER(ORDER BY)

例2：先按roomid分组，再按deviceid,counter排序，类Oracle 的lead() OVER(PARTITION BY ORDER BY)

MySQL从8.0开始支持窗口函数。也就是分析函数

序号函数：ROW_NUMBER()、RANK()、DENSE_RANK()

分布函数：PERCENT_RANK()、CUME_DIST()

前后函数：LAG()、LEAD()

头尾函数：FIRST_VALUE()、LAST_VALUE()

其它函数：NTH_VALUE()、NTILE()

例子：

首先有一个表字段：id score（分数）user_id

1.序号函数：ROW_NUMBER()、RANK()、DENSE_RANK()

用途：显示分区中的当前行号,对查询结果进行排序.

ROW_NUMBER()：顺序排序——1、2、3 RANK()：并列排序，跳过重复序号——1、1、3 DENSE_RANK()：并列排序，不跳过重复序号——1、1、2

执行sql:

2.分布函数：PERCENT_RANK()、CUME_DIST()

用途：每行按照公式(rank-1) / (rows-1)进行计算。其中，rank为RANK()函数产生的序号，rows为当前窗口的记录总行数

3.前后函数：LAG()、LEAD()

LAG和LEAD分析函数可以在同一次查询中取出同一字段的前N行的数据(LAG)和后N行的数据(LEAD)作为独立的列

在实际应用当中，若要用到取今天和昨天的某字段差值时，LAG和LEAD函数的应用就显得尤为重要。当然，这种 *** 作可以用表的自连接实现，但是LAG和LEAD与LEFT JOIN、RIGHT JOIN等自连接相比，效率更高，SQL更简洁。下面我就对这两个函数做一个简单的介绍。

函数语法如下：

lag(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)

lead(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)

参数说明：

exp_str是字段名

offset是偏移量，即是上1个或上N个的值，假设当前行在表中排在第10行，则offset 为3，则表示我们所要找的数据行就是表中的第7行(即10-3=7)。

defval默认值，当两个函数取上N/下N个值，当在表中从当前行位置向前数N行已经超出了表的范围时，LAG()函数将defval这个参数值作为函数的返回值，若没有指定默认值，则返回NULL，那么在数学运算中，总要给一个默认值才不会出错。

执行sql:

以第一行为例：4.0上一条记录（lag）是没有的,所有有赋予默认值0，4.0的下一条记录（lead）还是4.0,可以通过偏移量调整上下N条记录

注意：这里是序号的上一条或下一条

4.头尾函数：FIRST_VALUE(expr)、LAST_VALUE(expr)

用途：返回第一个(FIRST_VALUE(expr))或最后一个(LAST_VALUE(expr))expr的值

执行sql:

FIRST_VALUE()的结果容易理解，直接在结果的所有行记录中输出同一个满足条件的首个记录；

LAST_VALUE()默认统计范围是 rows between unbounded preceding and current row，也就是取当前行数据与当前行之前的数据的比较。

那么如果我们直接在每行数据中显示最后的那个数据，需在order by 条件的后面加上语句： rows between unbounded preceding and unbounded following ，也就是前面无界和后面无界之间的行比较。

加上语句，执行sql:

结果：

简单理解就是，取最大的还是最小的结合ORDER BY使用，或者取第一个还是或者最后一个

参考： https://baijiahao.baidu.com/s?id=1728966619393719484&wfr=spider&for=pc

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/8522882.html

MYSQL lag() 和lead()函数使用介绍

发表评论

评论列表（0条）