注:下面的讨论和结论是基于 InnoDB 引擎的。
首先要弄清楚 count() 的语义。count() 是一个聚合函数,对于返回的结果集,一行行地判断,如果 count 函数的参数不是 NULL,累计值就加 1,否则不加。最后返回累计值。
所以,count(*)、count(1)和count(主键 id) 都表示返回满足条件的结果集的总行数;而 count(字段),则表示返回满足条件的数据行里面,参数“字段”不为 NULL 的总个数。
至于分析性能差别的时候,记住这么几个原则:
扫描全表,读到server层,判断字段可空,拿出该字段所有值,判断每一个值是否为空,不为空则累加
扫描全表,读到server层,判断字段不可空,按行累加。
扫描全表,但不取值,server层收到的每一行都是1,判断不可能是null,按值累加。
注意:count(1)执行速度比count(主键 id)快的原因:从引擎返回 id 会涉及到解析数据行,以及拷贝字段值的 *** 作。
MySQL 执行count(*)在优化器做了专门优化。因为count(*)返回的行一定不是空。扫描全表,但是不取值,按行累加。
看到这里,你会说优化器就不能自己判断一下吗,主键 id 肯定是非空的,为什么不能按照 count(*) 来处理,多么简单的优化。当然 MySQL 专门针对这个语句进行优化也不是不可以。但是这种需要专门优化的情况太多了,而且 MySQL 已经优化过 count(*) 了,你直接使用这种语句就可以了。
count(可空字段) <count(非空字段) = count(主键 id) <count(1) count(*)
执行效果:
1. count(1) and count(*)
当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了!
从执行计划来看,count(1)和count(*)的效果是一样的。但是在表做过分析之后,count(1)会比count(*)的用时少些(1w以内数据量),不过差不了多少。
如果count(1)是聚索引,id,那肯定是count(1)快。但是差的很小的。
因为count(*),自动会优化指定到那一个字段。所以没必要去count(1),用count(*),sql会帮你完成优化的 因此:count(1)和count(*)基本没有差别!
2. count(1) and count(字段)
两者的主要区别是
count(1) 会统计表中的所有的记录数,包含字段为null 的记录。
count(字段) 会统计该字段在表中出现的次数,忽略字段为null 的情况。即不统计字段为null 的记录。
无数次听到“不要写count(*)要写count(1),count(*)跑得慢”这种错误说法。
为什么count(1)与count(*)性能相同呢? 因为执行计划相同,性能相同 。本篇以oracle 11g为例讲解
首先 Oracle不允许纯空行数据(即所有字段皆为null),所以count(1)与count(*)结果必然相同,首先在无索引情况下 count(1) count(*) count(object_id) 的执行计划全部一样全表扫描:
有索引情况再看,count(1) count(*) count(object_id) 一样,快速全扫描
Create Index IND_test_a On a (object_id,0) --为什么建object,0组合索引 因为oracle索引不存null,所以加上0保证所有行都在索引中
如果将索引改为 Create Index IND_test_a On a (object_id)会怎么样呢?count(1)与count(*)无法走索引,因为索引并没有包含所有行,只能全表扫秒,而count(object)可以走索引快速全扫描。
SQL优化不能靠瞎猜,而是分析SQL背后的实际执行逻辑。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)