直观理解:MySQL常用窗口函数

直观理解:MySQL常用窗口函数,第1张

  窗口函数(window functions),也叫分析函数和OLAP函数,MySQL在8.0之后开始支持窗口函数。窗口函数可以用来对数据进行实时分析处理,和group by有类似之处,其区别在于窗口会对每个分组之后的数据按行进行分别 *** 作,而group by一般对分组之后的函数使用聚合函数汇总,做不到对不同的group中的行数据进行分别 *** 作。这就简单介绍几种常见的MySQL窗口函数。下表中列出了几种常见的窗口函数,并对其基本功能进行了描述。接下来我们会以一段示例,来展示MySQL中窗口函数的用途和效果。

  假设我们存在一张如下的员工工资表,接下来我们将以这张表对窗口函数的使用方法进行简单的演示。

  窗口函数的语法如下,所有的窗口函数均遵循以下语法:

其中 frame_clause 语法如下。

接下来我们将展示一些场景的窗口函数的用法和效果。

示例: 对所有员工按照薪资降序排序,并给出对应的row_number、rank和dense_rank的排名

示例: 对每个部门的员工按照薪资降序排序,并给出对应的row_number、rank和dense_rank的排名

示例: 对所有员工按照薪资降序排序,并给出对应的row_number、rank和dense_rank的排名,最终结果按照员工号进行排序输出。

示例: 找出每个部门工资最高的人。

示例: a.将所有员工按照工资递增的顺序分成4组。b.根据员工入职日期升序分成7组。

示例: 获取每个部门,按工资从低到高得累计和。

示例: 获取每个部门得工资累计和。

示例: 获取整个公司的薪资按照薪资递增的累计和。

示例: 获取整个公司的薪资按照薪资递增的前两行和后一行范围内的薪资和。

示例: 每个部门的平均工资。

示例: 获取整个公司的薪资按照薪资递增的前两行和后一行范围内的薪资平均值。

示例: 根据薪资排序,获取CUME_DIST()和PERCENT_RANK()

示例: a. 获取每个人入职前一行的数据,默认值为"2021-01-01"b. 获取每个人入职前两行的数据,不设置默认值c. 获取每个人入职后一行的数据,默认值为"2022-01-01"d. 获取每个人入职后两行的数据,不设置默认值

示例: a. 按照入职日期顺序排序,找出当前每个部门最先入职的人的薪资。b. 按照入职日期顺序排序,找出当前每个部门最后入职的人的薪资。

示例: a.获取截至当前工资第二高的人的工资。b.获取第二个入职的人的工资。

网上找的其实我也看不懂 嘿嘿

mysql_errnoMySQL 数据库函数库

mysql_errno

返回错误信息代码。

语法: int mysql_errno(int [link_identifier])

返回值: 整数

函数种类: 数据库功能

内容说明

本函数可以得到 MySQL 数据库服务器的错误代码。通常用在 PHP 网页程序开发阶段,作为 PHP 与 MySQL 的除错用。

mysql_error

(PHP 3, PHP 4, PHP 5)

mysql_error -- 返回上一个 MySQL *** 作产生的文本错误信息

说明

string mysql_error ( [resource link_identifier] )

返回上一个 MySQL 函数的错误文本,如果没有出错则返回 ''(空字符串)。如果没有指定连接资源号,则使用上一个成功打开的连接从 MySQL 服务器提取错误信息。

从 MySQL 数据库后端来的错误不再发出警告,要用 mysql_error() 来提取错误文本。注意本函数仅返回最近一次 MySQL 函数的执行(不包括 mysql_error() 和 mysql_errno())的错误文本,因此如果要使用此函数,确保在调用另一个 MySQL 函数之前检查它的值。

MySQL从8.0开始支持窗口函数。也就是分析函数

序号函数:ROW_NUMBER()、RANK()、DENSE_RANK()

分布函数:PERCENT_RANK()、CUME_DIST()

前后函数:LAG()、LEAD()

头尾函数:FIRST_VALUE()、LAST_VALUE()

其它函数:NTH_VALUE()、NTILE()

例子:

首先有一个表字段:id score(分数)user_id

1.序号函数:ROW_NUMBER()、RANK()、DENSE_RANK()

用途:显示分区中的当前行号,对查询结果进行排序.

ROW_NUMBER():顺序排序——1、2、3 RANK():并列排序,跳过重复序号——1、1、3 DENSE_RANK():并列排序,不跳过重复序号——1、1、2

执行sql:

2.分布函数:PERCENT_RANK()、CUME_DIST()

用途:每行按照公式(rank-1) / (rows-1)进行计算。其中,rank为RANK()函数产生的序号,rows为当前窗口的记录总行数

3.前后函数:LAG()、LEAD()

LAG和LEAD分析函数可以在同一次查询中取出同一字段的前N行的数据(LAG)和后N行的数据(LEAD)作为独立的列

在实际应用当中,若要用到取今天和昨天的某字段差值时,LAG和LEAD函数的应用就显得尤为重要。当然,这种 *** 作可以用表的自连接实现,但是LAG和LEAD与LEFT JOIN、RIGHT JOIN等自连接相比,效率更高,SQL更简洁。下面我就对这两个函数做一个简单的介绍。

函数语法如下:

lag(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)

lead(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)

参数说明:

exp_str是字段名

offset是偏移量,即是上1个或上N个的值,假设当前行在表中排在第10行,则offset 为3,则表示我们所要找的数据行就是表中的第7行(即10-3=7)。

defval默认值,当两个函数取上N/下N个值,当在表中从当前行位置向前数N行已经超出了表的范围时,LAG()函数将defval这个参数值作为函数的返回值,若没有指定默认值,则返回NULL,那么在数学运算中,总要给一个默认值才不会出错。

执行sql:

以第一行为例:4.0上一条记录(lag)是没有的,所有有赋予默认值0,4.0的下一条记录(lead)还是4.0,可以通过偏移量调整上下N条记录

注意:这里是序号的上一条或下一条

4.头尾函数:FIRST_VALUE(expr)、LAST_VALUE(expr)

用途:返回第一个(FIRST_VALUE(expr))或最后一个(LAST_VALUE(expr))expr的值

执行sql:

FIRST_VALUE()的结果容易理解,直接在结果的所有行记录中输出同一个满足条件的首个记录;

LAST_VALUE()默认统计范围是 rows between unbounded preceding and current row,也就是取当前行数据与当前行之前的数据的比较。

那么如果我们直接在每行数据中显示最后的那个数据,需在order by 条件的后面加上语句: rows between unbounded preceding and unbounded following , 也就是前面无界和后面无界之间的行比较。

加上语句,执行sql:

结果:

简单理解就是,取最大的还是最小的结合ORDER BY使用,或者取第一个还是或者最后一个

参考: https://baijiahao.baidu.com/s?id=1728966619393719484&wfr=spider&for=pc


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/6158173.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-16
下一篇 2023-03-16

发表评论

登录后才能评论

评论列表(0条)

保存