技术分享 | MySQL 分组需求探秘_随笔

前两天同事有个 MySQL 数据分组的需求，如下测试数据，需要找出每个 name 分组中 create_date 最近的记录：

需要注意的是，此处用的 MySQL 是5.6，最初是使用这条语句：

<pre class="custom" data-tool="mdnice编辑器" style="margin-top: 10pxmargin-bottom: 10pxborder-radius: 5pxbox-shadow: rgba(0, 0, 0, 0.55) 0px 2px 10px">select name, value, create_date, update_date from t1 group by name order by create_date desc </pre>

用这条 SQL 得到的其实只是每个 name 分组中最先插入的记录，然后按照 create_date 进行了降序排列，和原始需求，完全不同。

此时可采用分而治之的策略，先做排序，再做分组：

<pre class="custom" data-tool="mdnice编辑器" style="margin-top: 10pxmargin-bottom: 10pxborder-radius: 5pxbox-shadow: rgba(0, 0, 0, 0.55) 0px 2px 10px">select * from (select name, value, create_date, update_date from t1 order by create_date desc) t group by t.name </pre>

当然，针对此需求，可能有其他方法，有兴趣的朋友，可以尝试写写，共享一下。

可能有细心的朋友会发现个问题，就是上述 SQL 中的 group by ，好像有些奇怪，如果按照常规，select 中的字段需要出现在 group by 中，上述语句竟然没报错？

如果我们在 MySQL 5.7 执行相同的语句：

因此从5.6升级到5.7，很可能出现这种相同的 SQL 执行结果不同的现象，这对兼容性测试的要求就会很高，究其原因，一方面是特性决定的，另一方面就是各种配置参数不同导致的。

可以在5.7的 sql_mode 中删除这个 ONLY_FULL_GROUP_BY ，即可达到5.6相同效果了，或者改写 SQL ，例如：

<pre class="custom" data-tool="mdnice编辑器" style="margin-top: 10pxmargin-bottom: 10pxborder-radius: 5pxbox-shadow: rgba(0, 0, 0, 0.55) 0px 2px 10px">select * from t1 a where create_date = (select max(create_date) from t1 b where a.name = b.name) </pre>

或者，

<pre class="custom" data-tool="mdnice编辑器" style="margin-top: 10pxmargin-bottom: 10pxborder-radius: 5pxbox-shadow: rgba(0, 0, 0, 0.55) 0px 2px 10px">select * from t1 a where not exists (select * from t1 b where a.name = b.name and b.create_date >a.create_date) </pre>

MySQL 8.0支持 row_number()函数， *** 作应该和如下 Oracle 相近的。

Oracle 中可以使用 row_number()实现此需求：

<pre class="custom" data-tool="mdnice编辑器" style="margin-top: 10pxmargin-bottom: 10pxborder-radius: 5pxbox-shadow: rgba(0, 0, 0, 0.55) 0px 2px 10px">select * from (select name, create_date, row_number() over (partition by name order by create_date desc) as r from t1) where r=1 </pre>

如何分组数据，以便能汇总表内容的子集。这涉及两个新SELECT语句子句，分别是GROUP BY子句和HAVING子句。

分组允许把数据分为多个逻辑组，以便能对每个组进行聚集计算。

分组是在SELECT语句的GROUP BY 子句中建立的。

来看例子理解：

mysql>select vend_id,COUNT(*) AS num_prods from products group by vend_id

也就是不同的Id的商品总数都能分别查出来。

除了能用GROUP BY分组数据外，Mysql还允许过滤分组，规定包括哪些分组，排除哪些分组。

也就是HAVING子句。

mysql>select cust_id,COUNT( /) AS orders from orders GROUP BYcust_id HAVINGCOUNT( /) >=2

注意：这里HAVING换成WHERE是不管用的。HAVING针对于分组。

WHERE在数据分组前进行过滤，HAVING在数据分组后进行过滤。

那么咱么看看怎么混合WHERE和HAVING。

mysql>select vend_id, COUNT( / ) AS num_prods from products where prod_price>=10 group byvend_id HAVING COUNT( /) >=2

mysql>select order_num,SUM(quantity*item_price) AS ordertotal

from orderitems

GROUP BY order_num

HAVING SUM(quantity*item_price) >=50

order by ordertotal

第二节为大家介绍了数据的查询，这一小节为大家深入讲解查询过程中的数据分组和排序，分组关键字为：group by，排序关键字为：order by，过滤分组的关键字为：having；

group by：对查询的数据按照某一类型进行分组， group by 一般用在order by子句之前，where子句之后

order by：对查询的数据进行某一类进行排序或对分组后的数据进行排序

having：对分组后的数据进行条件过滤

继续以上一章创建的客户表为例，表名： customer ，表有列： cus_id,cus_no,cus_name,cus_age,cus_adds。

eg：查询客户的基本信息，以id进行分组： select cus_id,count(*) as num from customer group by cus_id num表示对应的cus_id有多少客户数据，查询结果如下

如果分组的列中有null值，那么null将作为一个分组返回，如果有多个行都为null值，它们将会被分为一组返回。 group by 必须用在where子句之后，order by子句之前。

除group by可以进行分组过滤数据外，having也可以进行过滤分组；having过滤和where类似，唯一区别在于where是过滤行，而having是过滤分组，可看以下列子：

eg：查询以id分组后数据总量两条以上的数据： select cus_id,count(*) as num from customer group by cus_id having count(*) >= '2'满足条件的就只有一条数据

order by主要用于数据排序的情况，当查询数据量较大时，有序的数据会让人更好地直观观察数据，order by 关键字用于对结果集按照一个列或者多个列进行排序。此外order by 关键字默认按照升序对记录进行排序。如果需要按照降序对记录进行排序，您可以使用 DESC 关键字。使用方法如下

eg：查询客户的基本信息，以年龄进行排序，默认升序：select * from customer order by cus_age

eg：查询客户的基本信息，以年龄进行排序，降序方式排序：select * from customer order by cus_age DESC

升序使用ASC，降序使用DESC，系统默认为升序。注意两者之间的差异

当对多个列进行排序时，order by使用方法如下：

order by A,B --过滤数据都是默认按升序排列

order by A desc,B --过滤数据时 A 降序，B 升序排列

order by A ,B desc --过滤数据时 A 升序，B 降序排列

desc 或者 asc 只对它紧跟着的第一个列名有效，其他不受影响，仍然是默认的升序。

本小节介绍排序分组就到这里了，通过多分组排序的介绍，知道了group by，order by，having三者之间的差异和区别，大家可以在自己电脑多编写几个脚本，深入了解三个关键字的使用。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/8334508.html

技术分享 | MySQL 分组需求探秘

发表评论

评论列表（0条）