MySql or和in的区别_随笔

网上有很多人都在谈论or与in的使用，有的说二者没有什么区别，其实不然，估计是测试做的不够，其实or的效率为O(n)，而in的效率为O(log2n)，当基数越大时，in的效率就能凸显出来了。

有人做了这么一组实验(测试库数据为1000万条记录)：A组分别用or与in查询3条记录，B组分别用or与in查询120条记录,C组分别用or与in查询500条记录,D组分别用or与in查询1000条记录.

第一种情况，目标列为主键的情况，4组测试执行计划一样，执行的时间也基本没有区别。

A组or和in的执行时间： or的执行时间为：0.002s in的执行时间为：0.002s

B组or和in的执行时间： or的执行时间为：0.004s in的执行时间为：0.004s

C组or和in的执行时间： or的执行时间为：0.006s in的执行时间为：0.005s

D组or和in的执行时间： or的执行时间为：0.017s in的执行时间为：0.014s

第二种情况，目标列为一般索引的情况，4组测试执行计划一样，执行的时间也基本没有区别。

A组or和in的执行时间： or的执行时间为：0.002s in的执行时间为：0.002s

B组or和in的执行时间： or的执行时间为：0.006s in的执行时间为：0.005s

C组or和in的执行时间： or的执行时间为：0.008s in的执行时间为：0.008s

D组or和in的执行时间： or的执行时间为：0.020s in的执行时间为：0.019s

第三种情况，目标列没有索引的情况，4组测试执行计划就不一样，执行的时间也有了很大的区别。

A组or和in的执行时间： or的执行时间为：5.016s in的执行时间为：5.071s

B组or和in的执行时间： or的执行时间为：1min 02s in的执行时间为：5.018s

C组or和in的执行时间： or的执行时间为：1min 50s in的执行时间为：5.010s

D组or和in的执行时间： or的执行时间为：6min 13s in的执行时间为：5.047s

结论：

in和or的效率，取决目标条件列是否有索引或者是否是主键，如果有索引或者主键性能没啥差别，如果没有索引，in的性能要远远优于or.

MySQL中使用IN会不会走索引

文章很短，先看下结论，在看下文。

结论：IN肯定会走索引，但是当IN的取值范围较大时会导致索引失效，走全表扫描

navicat可视化工具使用explain函数查看sql执行信息

场景1：当IN中的取值只有一个主键时

我们只需要注意一个最重要的type 的信息很明显的提现是否用到索引：

type结果值从好到坏依次是：

system >const >eq_ref >ref >fulltext >ref_or_null >index_merge >unique_subquery >index_subquery >range >index >ALL

all:全表扫描

index:另一种形式的全表扫描，只不过他的扫描方式是按照索引的顺序

range：有范围的索引扫描，相对于index的全表扫描，他有范围限制，因此要优于index

ref: 查找条件列使用了索引而且不为主键和unique。其实，意思就是虽然使用了索引，但该索引列的值并不唯一，有重复。这样即使使用索引快速查找到了第一条数据，仍然不能停止，要进行目标值附近的小范围扫描。但它的好处是它并不需要扫全表，因为索引是有序的，即便有重复值，也是在一个非常小的范围内扫描。

const:通常情况下，如果将一个主键放置到where后面作为条件查询，mysql优化器就能把这次查询优化转化为一个常量。至于如何转化以及何时转化，这个取决于优化器

一般来说，得保证查询至少达到range级别，最好能达到ref，type出现index和all时，表示走的是全表扫描没有走索引，效率低下，这时需要对sql进行调优。

当extra出现Using filesor或Using temproary时，表示无法使用索引，必须尽快做优化。

possible_keys：sql所用到的索引

key：显示MySQL实际决定使用的键（索引）。如果没有选择索引，键是NULL

rows: 显示MySQL认为它执行查询时必须检查的行数。

这里可以参考之前写的一篇：用MySQL 执行计划分析 DATE_FORMAT 函数对索引的影响

场景2：扩大IN中的取值范围

此时仍然走了索引，但是效率降低了

场景3：继续扩大IN的取值范围

看上面的图，发现此时已经没有走索引了，而是全表扫描。

在说一下结论

结论：IN肯定会走索引，但是当IN的取值范围较大时会导致索引失效，走全表扫描。

By the way：如果使用了 not in，则不走索引。

五索引分类

直接创建索引和间接创建索引

直接创建索引 CREATE INDEX mycolumn_index ON mytable (myclumn)

间接创建索引定义主键约束或者唯一性键约束可以间接创建索引

普通索引和唯一性索引

普通索引 CREATE INDEX mycolumn_index ON mytable (myclumn)

唯一性索引保证在索引列中的全部数据是唯一的对聚簇索引和非聚簇索引都可以使用

CREATE UNIQUE COUSTERED INDEX myclumn_cindex ON mytable(mycolumn)

单个索引和复合索引

单个索引即非复合索引

复合索引又叫组合索引在索引建立语句中同时包含多个字段名最多个字段

CREATE INDEX name_index ON username(firstname lastname)

聚簇索引和非聚簇索引(聚集索引群集索引)

聚簇索引物理索引与基表的物理顺序相同数据值的顺序总是按照顺序排列

CREATE CLUSTERED INDEX mycolumn_cindex ON mytable(mycolumn) WITH

ALLOW_DUP_ROW(允许有重复记录的聚簇索引)

非聚簇索引 CREATE UNCLUSTERED INDEX mycolumn_cindex ON mytable(mycolumn)

六索引的使用

当字段数据更新频率较低查询使用频率较高并且存在大量重复值是建议使用聚簇索引

经常同时存取多列且每列都含有重复值可考虑建立组合索引

复合索引的前导列一定好控制好否则无法起到索引的效果如果查询时前导列不在查询条件中则该复合索引不会被使用前导列一定是使用最频繁的列

多表 *** 作在被实际执行前查询优化器会根据连接条件列出几组可能的连接方案并从中找出系统开销最小的最佳方案连接条件要充份考虑带有索引的表行数多的表内外表的选择可由公式外层表中的匹配行数*内层表中每一次查找的次数确定乘积最小为最佳方案

where子句中对列的任何 *** 作结果都是在sql运行时逐列计算得到的因此它不得不进行表搜索而没有使用该列上面的索引如果这些结果在查询编译时就能得到那么就可以被sql优化器优化使用索引避免表搜索(例 select * from record where substring(card_no )=

&&select * from record where card_no like % )任何对列的 *** 作都将导致表扫描它包括数据库函数计算表达式等等查询时要尽可能将 *** 作移至等号右边

where条件中的 in 在逻辑上相当于 or 所以语法分析器会将in ( ′ ′)转化为column= ′ or column= ′来执行我们期望它会根据每个or子句分别查找再将结果相加这样可以利用column上的索引但实际上它却采用了 or策略即先取出满足每个or子句的行存入临时数据库的工作表中再建立唯一索引以去掉重复行最后从这个临时表中计算结果因此实际过程没有利用column上索引并且完成时间还要受tempdb数据库性能的影响 in or子句常会使用工作表使索引失效如果不产生大量重复值可以考虑把子句拆开拆开的子句中应该包含索引

要善于使用存储过程它使sql变得更加灵活和高效

lishixinzhi/Article/program/MySQL/201311/29603

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/6155066.html

MySql or和in的区别

发表评论

评论列表（0条）