mysql GROUP BY、DISTINCT、ORDER BY语句优化_随笔

GROUP BY、DISTINCT、ORDERBY这几类子句比较类似，GROUP BY默认也是要进行ORDERBY排序的，笔者在本书中把它们归为一类，优化的思路也是类似的。

可以考虑的优化方式如下。

1、尽量对较少的行进行排序。

2、如果连接了多张表，ORDERBY的列应该属于连接顺序的第一张表。

3、利用索引排序，如果不能利用索引排序，那么EXPLAIN查询语句将会看到有filesort。

4、GROUP BY、ORDERBY语句参考的列应该尽量在一个表中，如果不在同一个表中，那么可以考虑冗余一些列，或者合并表。

5、需要保证索引列和ORDERBY的列相同，且各列均按相同的方向进行排序。

6、增加sort_buffer_size。 sort_buffer_size是为每个排序线程分配的缓冲区的大小。增加该值可以加快ORDERBY或GROUP BY *** 作。但是，这是为每个客户端分配的缓冲区，因此不要将全局变量设置为较大的值，因为每个需要排序的连接都会分配sort_buffer_size大小的内存。

7、增加read_rnd_buffer_size。当按照排序后的顺序读取行时，通过该缓冲区读取行，从而避免搜索硬盘。将该变量设置为较大的值可以大大改进ORDER BY的性能。但是，这是为每个客户端分配的缓冲区，因此你不应将全局变量设置为较大的值。相反，只用为需要运行大查询的客户端更改会话变量即可。

8、改变tmpdir变量指向基于内存的文件系统或其他更快的磁盘。如果MySQL服务器正作为复制从服务器被使用，那么不应将“--tmpdir”设置为指向基于内存的文件系统的目录，或者当服务器主机重启时将要被清空的目录。因为，对于复制从服务器，需要在机器重启时仍然保留一些临时文件，以便能够复制临时表或执行LOADDATAINFILE *** 作。如果在服务器重启时丢失了临时文件目录下的文件，那么复制将会失败。

9、指定ORDERBY NULL。默认情况下，MySQL将排序所有GROUP BY的查询，如果想要避免排序结果所产生的消耗，可以指定ORDERBY NULL。例如：SELECT count(*) cnt, cluster_id FROM stat GROUP BY cluster_id ORDER BY NULL LIMIT 10·

10、优化GROUP BY WITHROLLUP。 GROUP BY WITHROLLUP可以方便地获得整体分组的聚合信息（superaggregation），但如果存在性能问题，可以考虑在应用层实现这个功能，这样往往会更高效，伸缩性也更佳。

11、使用非GROUP BY的列来代替GROUP BY的列。比如，原来是“GROUP BYxx_name,yy_name”，如果GROUP BYxx_id可以得到一样的结果，那么使用GROUP BYxx_id也是可行的。

12、可以考虑使用Sphinx等产品来优化GROUP BY语句，一般来说，它可以有更好的可扩展性和更佳的性能。

只有5种吗？我知道十种以上的说。

索引（没我得全表查询了）

改变数据储引擎（MyISAM没事务再也不用担心锁表了）

增加冗余数来减少连表查询数（消耗硬盘空间减少CPU使用）

调整查询顺序减少查询量优先（数量少了连表的笛卡儿积也少了）

全文索引（文字长度有限制，而且IO使用量会大增，但是妥妥的快）

查询尽量不要用函数（函数可是不走索引的哦亲）

查询变量类型要提前对好减少系统负担（我提前改变了系统你就不用检测了）

升级服务器硬件（没什么是氪金解决不了的）

配置好临时表空间，合理理由临时表减少主表查询抢资源（唯我独查）

合理理由函数减少系统的判断（明明都能确认内容不同你用UNION 系统还是傻傻的查一遍是否重复 UNION ALL则跳过这个步骤同理 inner join 和 left join 也一样）

强制走索引（复合索引的情况有时候手动走比系统判断要好哦）

脏读、幻读等（你堵车我绕路）

数据归档，迁移（没用的数据要进仓哦，别占着主表的资源）

表的碎片整理（迁移后碎片整理更健康哦亲）

索引重构（数据都走了索引也应该重构一下才能保证速度哦）

善用存储过程（串N个表（N大于10）的查询千万别一个SQL到底，分布式查询在吧结果集合并吧骚年）

预处理数据（mysql也有job哦，对于经常要子查询的数据可以先弄个明细表根据主表在后台进行补完，查询的时候就更方便了）

懒得说了。。。。。。。。。。。。。。。。。。

mysql优化是一个大方向，大的是要分布式、读写分离，小的是对sql语句进行优化。不过大多问的也是对sql语句优化，网上很多资料，我就大体说说。

1、explain+索引。

在你要查询的语句前加explain，看下有没有用到索引，如果出现type为all的，则说明有必要添加下索引。（附多表查询速度比较：表关联>exists>in）慢查询优化是一大块。

2、预统计。

很经常需要对历史的数据进行过滤统计。比如移动需要统计上个月电话小时数超过N小时的人，那么如果直接取原始数据，那将很慢，此时如果每天晚上凌晨都对数据进行预统计，统计每个人每天电话时数，那再来过滤就很快。

3、分表分区。

分表分区也是为了提高搜索速度。例如，公交车的gps行驶记录，gps每隔15s报一次，一辆车一天运行12小时，一天就要插入4*60*12条记录，N辆车就要再乘，其数量极大，所以经常按月分表，分表里再按上报时间做日分区，这样就达到很大的优化，想查询某段时间，mysql很快就可以定位到。

4、表结构。

表结构很重要，经常需要多表关联查询一些字段，有时可以冗余下放到同一张表。

mysql优化很有意思，多去查阅些资料，多去尝试，对你有好处的。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/6166262.html

mysql GROUP BY、DISTINCT、ORDER BY语句优化

发表评论

评论列表（0条）