mysql8新特性_随笔

->PERCENT_RANK() OVER w AS pr,

->id, category_id, category, NAME, price, stock

->FROM goods

->WHERE category_id = 1 WINDOW w AS (PARTITION BY category_id ORDER BY price DESC)

| 1 | 0 | 6 | 1 | 女装/女士精品 | 呢绒外套 | 399.90 | 1200 |

| 2 | 0.2 | 3 | 1 | 女装/女士精品 | 卫衣 | 89.90 | 1500 |

| 2 | 0.2 | 4 | 1 | 女装/女士精品 | 牛仔裤 | 89.90 | 3500 |

| 4 | 0.6 | 2 | 1 | 女装/女士精品 | 连衣裙 | 79.90 | 2500 |

| 5 | 0.8 | 1 | 1 | 女装/女士精品 | T恤 | 39.90 | 1000 |

| 6 | 1 | 5 | 1 | 女装/女士精品 | 百褶裙 | 29.90 | 500 |

6 rows in set (0.00 sec)

2．CUME_DIST()函数

CUME_DIST()函数主要用于查询小于或等于某个值的比例。

举例：查询goods数据表中小于或等于当前价格的比例。

mysql>SELECT CUME_DIST() OVER(PARTITION BY category_id ORDER BY price ASC) AS cd,

->id, category, NAME, price

->FROM goods

| 0.5 | 2 | 女装/女士精品 | 连衣裙 | 79.90 |

| 0.8333333333333334 | 3 | 女装/女士精品 | 卫衣 | 89.90 |

| 0.8333333333333334 | 4 | 女装/女士精品 | 牛仔裤 | 89.90 | | 1 | 6 | 女装/女士精品 | 呢绒外套 | 399.90 | | 0.16666666666666666 | 9 | 户外运动 | 登山杖 | 59.90 |

| 0.5 | 7 | 户外运动 | 自行车 | 399.90 |

| 0.5 | 10 | 户外运动 | 骑行装备 | 399.90 |

| 0.6666666666666666 | 12 | 户外运动 | 滑板 | 499.90 |

| 0.8333333333333334 | 11 | 户外运动 | 运动外套 | 799.90 |

| 1 | 8 | 户外运动 | 山地自行车 | 1399.90 |

总之，递归公用表表达式对于查询一个有共同的根节点的树形结构数据，非常有用。它可以不受层级的

限制，轻松查出所有节点的数据。如果用其他的查询方式，就比较复杂了。

3.3 小结

公用表表达式的作用是可以替代子查询，而且可以被多次引用。递归公用表表达式对查询有一个共同根

节点的树形结构数据非常高效，可以轻松搞定其他查询方式难以处理的查询。

接上一篇，这一篇主要介绍三类窗口函数，分布函数、前后函数和头尾函数。

【分布函数】

PERCENT_RANK基于RANK()函数的排序结果，percent_ranks列按照公式(rank-1) / (rows-1)带入rank值（row_num列）和rows值，其中，rank为RANK()函数产生的序号，rows为当前窗口的记录总行数。

CUME_DIST，分组内小于等于当前rank值的行数/分组内总行数，这个函数比percen_rank使用场景更多。可以用于计算大于等于或小于等于当前订单金额的订单比例有多少。

【前后函数】

分区中位于当前行前n行（LAG）或后n行(LEAD)的记录值。这两个函数在实际中还是有使用场景，比如要查询上一个订单距离当前订单的时间间隔，或者本条订单距离下一条订单的时间间隔。

如果要计算距离上一条订单的天数，只需要增加一列，用DATEDIFF函数把两个日期相减就可以了。如果是第一条订单，就会返回空值。

【头尾函数】

头尾函数FIRST_VAL和LAST_VAL函数，用来得到分区中的第一个或最后一个指定参数的值。可以用来查询每个用户第一次和最后一次的订单数据信息，然后就行比较 *** 作。需要注意的是，最后一条订单时间是基于当前订单时间来看的，所有是等于当前订单时间。

End

◆ PowerBI开场白

◆ Python高德地图可视化

◆ Python不规则条形图

MySQL从8.0开始支持窗口函数。也就是分析函数

序号函数：ROW_NUMBER()、RANK()、DENSE_RANK()

分布函数：PERCENT_RANK()、CUME_DIST()

前后函数：LAG()、LEAD()

头尾函数：FIRST_VALUE()、LAST_VALUE()

其它函数：NTH_VALUE()、NTILE()

例子：

首先有一个表字段：id score（分数）user_id

1.序号函数：ROW_NUMBER()、RANK()、DENSE_RANK()

用途：显示分区中的当前行号,对查询结果进行排序.

ROW_NUMBER()：顺序排序——1、2、3 RANK()：并列排序，跳过重复序号——1、1、3 DENSE_RANK()：并列排序，不跳过重复序号——1、1、2

执行sql:

2.分布函数：PERCENT_RANK()、CUME_DIST()

用途：每行按照公式(rank-1) / (rows-1)进行计算。其中，rank为RANK()函数产生的序号，rows为当前窗口的记录总行数

3.前后函数：LAG()、LEAD()

LAG和LEAD分析函数可以在同一次查询中取出同一字段的前N行的数据(LAG)和后N行的数据(LEAD)作为独立的列

在实际应用当中，若要用到取今天和昨天的某字段差值时，LAG和LEAD函数的应用就显得尤为重要。当然，这种 *** 作可以用表的自连接实现，但是LAG和LEAD与LEFT JOIN、RIGHT JOIN等自连接相比，效率更高，SQL更简洁。下面我就对这两个函数做一个简单的介绍。

函数语法如下：

lag(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)

lead(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)

参数说明：

exp_str是字段名

offset是偏移量，即是上1个或上N个的值，假设当前行在表中排在第10行，则offset 为3，则表示我们所要找的数据行就是表中的第7行(即10-3=7)。

defval默认值，当两个函数取上N/下N个值，当在表中从当前行位置向前数N行已经超出了表的范围时，LAG()函数将defval这个参数值作为函数的返回值，若没有指定默认值，则返回NULL，那么在数学运算中，总要给一个默认值才不会出错。

执行sql:

以第一行为例：4.0上一条记录（lag）是没有的,所有有赋予默认值0，4.0的下一条记录（lead）还是4.0,可以通过偏移量调整上下N条记录

注意：这里是序号的上一条或下一条

4.头尾函数：FIRST_VALUE(expr)、LAST_VALUE(expr)

用途：返回第一个(FIRST_VALUE(expr))或最后一个(LAST_VALUE(expr))expr的值

执行sql:

FIRST_VALUE()的结果容易理解，直接在结果的所有行记录中输出同一个满足条件的首个记录；

LAST_VALUE()默认统计范围是 rows between unbounded preceding and current row，也就是取当前行数据与当前行之前的数据的比较。

那么如果我们直接在每行数据中显示最后的那个数据，需在order by 条件的后面加上语句： rows between unbounded preceding and unbounded following ，也就是前面无界和后面无界之间的行比较。

加上语句，执行sql:

结果：

简单理解就是，取最大的还是最小的结合ORDER BY使用，或者取第一个还是或者最后一个

参考： https://baijiahao.baidu.com/s?id=1728966619393719484&wfr=spider&for=pc

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/8570658.html

mysql8新特性

发表评论

评论列表（0条）