Mysql 的rank 函数如何实现
表特征:
mysql>select * from test
+------+------+
| a| b|
+------+------+
|1 | 20 |
|1 | 21 |
|1 | 24 |
|2 | 20 |
|2 | 32 |
|2 | 14 |
+------+------+
6 rows in set (0.00 sec)
现在,我们以a分组,查询b列最大的2个值。 这条sql要怎么写了?
1.创建表
Create Table: CREATE TABLE `sam` (
`a` int(11) DEFAULT NULL,
`b` int(11) DEFAULT NULL
) ENGINE=MyISAM DEFAULT CHARSET=utf8
2.插入模拟数据
INSERT INTO `sam` VALUES (1,10),(1,15),(1,20),(1,25),(2,20),(2,22),(2,33),(2,45)
+------+------+
| a| b|
+------+------+
|1 | 10 |
|1 | 15 |
|1 | 20 |
|1 | 25 |
|2 | 20 |
|2 | 22 |
|2 | 33 |
|2 | 45 |
+------+------+
3.SQL实现
select a,b,rownum,rank from
(select ff.a,ff.b,@rownum:=@rownum+1 rownum,if(@pa=ff.a,@rank:=@rank+1,@rank:=1) as rank,@pa:=ff.a
FROM
(select a,b from sam group by a,b order by a asc,b desc) ff,(select @rank:=0,@rownum:=0,@pa=null) tt) result
having rank <=2
4.结果:
+------+------+--------+------+
| a| b| rownum | rank |
+------+------+--------+------+
|1 | 25 | 1 |1 |
|1 | 20 | 2 |2 |
|2 | 45 | 5 |1 |
|2 | 33 | 6 |2 |
+------+------+--------+------+
4 rows in set (0.00 sec)
转:Mysql
的rank
函数如何实现
表特征:
mysql>
select
*
from
test
+------+------+
|
a
|
b
|
+------+------+
|
1
|
20
|
|
1
|
21
|
|
1
|
24
|
|
2
|
20
|
|
2
|
32
|
|
2
|
14
|
+------+------+
6
rows
in
set
(0.00
sec)
现在,我们以a分组,查询b列最大的2个值。
这条sql要怎么写了?
1.创建表
Create
Table:
CREATE
TABLE
`sam`
(
`a`
int(11)
DEFAULT
NULL,
`b`
int(11)
DEFAULT
NULL
)
ENGINE=MyISAM
DEFAULT
CHARSET=utf8
2.插入模拟数据
INSERT
INTO
`sam`
VALUES
(1,10),(1,15),(1,20),(1,25),(2,20),(2,22),(2,33),(2,45)
+------+------+
|
a
|
b
|
+------+------+
|
1
|
10
|
|
1
|
15
|
|
1
|
20
|
|
1
|
25
|
|
2
|
20
|
|
2
|
22
|
|
2
|
33
|
|
2
|
45
|
+------+------+
3.SQL实现
select
a,b,rownum,rank
from
(select
ff.a,ff.b,@rownum:=@rownum+1
rownum,if(@pa=ff.a,@rank:=@rank+1,@rank:=1)
as
rank,@pa:=ff.a
FROM
(select
a,b
from
sam
group
by
a,b
order
by
a
asc,b
desc)
ff,(select
@rank:=0,@rownum:=0,@pa=null)
tt)
result
having
rank
<=2
4.结果:
+------+------+--------+------+
|
a
|
b
|
rownum
|
rank
|
+------+------+--------+------+
|
1
|
25
|
1
|
1
|
|
1
|
20
|
2
|
2
|
|
2
|
45
|
5
|
1
|
|
2
|
33
|
6
|
2
|
+------+------+--------+------+
4
rows
in
set
(0.00
sec)
MySQL从8.0开始支持窗口函数。也就是分析函数
序号函数:ROW_NUMBER()、RANK()、DENSE_RANK()
分布函数:PERCENT_RANK()、CUME_DIST()
前后函数:LAG()、LEAD()
头尾函数:FIRST_VALUE()、LAST_VALUE()
其它函数:NTH_VALUE()、NTILE()
例子:
首先有一个表字段:id score(分数)user_id
1.序号函数:ROW_NUMBER()、RANK()、DENSE_RANK()
用途:显示分区中的当前行号,对查询结果进行排序.
ROW_NUMBER():顺序排序——1、2、3 RANK():并列排序,跳过重复序号——1、1、3 DENSE_RANK():并列排序,不跳过重复序号——1、1、2
执行sql:
2.分布函数:PERCENT_RANK()、CUME_DIST()
用途:每行按照公式(rank-1) / (rows-1)进行计算。其中,rank为RANK()函数产生的序号,rows为当前窗口的记录总行数
3.前后函数:LAG()、LEAD()
LAG和LEAD分析函数可以在同一次查询中取出同一字段的前N行的数据(LAG)和后N行的数据(LEAD)作为独立的列
在实际应用当中,若要用到取今天和昨天的某字段差值时,LAG和LEAD函数的应用就显得尤为重要。当然,这种 *** 作可以用表的自连接实现,但是LAG和LEAD与LEFT JOIN、RIGHT JOIN等自连接相比,效率更高,SQL更简洁。下面我就对这两个函数做一个简单的介绍。
函数语法如下:
lag(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)
lead(exp_str,offset,defval) OVER(PARTITION BY …ORDER BY …)
参数说明:
exp_str是字段名
offset是偏移量,即是上1个或上N个的值,假设当前行在表中排在第10行,则offset 为3,则表示我们所要找的数据行就是表中的第7行(即10-3=7)。
defval默认值,当两个函数取上N/下N个值,当在表中从当前行位置向前数N行已经超出了表的范围时,LAG()函数将defval这个参数值作为函数的返回值,若没有指定默认值,则返回NULL,那么在数学运算中,总要给一个默认值才不会出错。
执行sql:
以第一行为例:4.0上一条记录(lag)是没有的,所有有赋予默认值0,4.0的下一条记录(lead)还是4.0,可以通过偏移量调整上下N条记录
注意:这里是序号的上一条或下一条
4.头尾函数:FIRST_VALUE(expr)、LAST_VALUE(expr)
用途:返回第一个(FIRST_VALUE(expr))或最后一个(LAST_VALUE(expr))expr的值
执行sql:
FIRST_VALUE()的结果容易理解,直接在结果的所有行记录中输出同一个满足条件的首个记录;
LAST_VALUE()默认统计范围是 rows between unbounded preceding and current row,也就是取当前行数据与当前行之前的数据的比较。
那么如果我们直接在每行数据中显示最后的那个数据,需在order by 条件的后面加上语句: rows between unbounded preceding and unbounded following , 也就是前面无界和后面无界之间的行比较。
加上语句,执行sql:
结果:
简单理解就是,取最大的还是最小的结合ORDER BY使用,或者取第一个还是或者最后一个
参考: https://baijiahao.baidu.com/s?id=1728966619393719484&wfr=spider&for=pc
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)