mysql按主键排序为什么比索引快_随笔

MYSQL官方文档介绍索引是一种方便快速查询数据的数据结构。用我们生活中的例子来讲，索引就好比书的目录，如果没有目录，每次你想要查找某些内容，你必须从头开始查找，这样的效率极其低下。

索引一般比较大，所以大部分情况下索引是存在磁盘的索引文件上，也有可能是存在数据文件上。

索引的种类有很多：主键索引（这是最常见的一种索引，主键不能为空且必须唯一）、唯一索引（相对于主键索引，它的值可以为空）、全文索引（在char、varchar、text类型可以使用）、普通索引、前缀索引。按照列数来区分：单一索引、组合索引（多字段组成）

2.MYSQL索引的数据结构

在讲解MYSQL索引的数据结构之前，我们先看看了解一下其他的数据结构，看看他们的优缺点进行对比。

2.1 二叉树

二叉树简单来说就是左节点大于右节点，在理想的情况下，他的查找速度就接近与二分法的性能O(log2n)。因为在内存排序的时间是非常快的，可以忽略不计，所以总的消耗时间就取决于IO的 *** 作次数。二叉树查找速度取决树高,每次查询接口都是一次IO *** 作，也是性能的瓶颈所在。

但是也会有这种一种情况,同样也是二叉树，但是他的树非常高，导致查询一次需要多次IO *** 作，效率及其低下

2.2 平衡二叉树

平衡二叉树可以解决二叉树不稳定导致查询效率低下的缺点。平衡二叉树的特点：树的左右节点层级最高相差一层。在插入或者删除的情况下，通过左旋转或右旋转使得整个二叉树平衡，不会出现层级相差很多的情况。平衡二叉树的性能接近二分法查找O(log2n)。

平衡二叉树查找id为8的记录，只需要IO *** 作2次即可。但是仔细想一下，如果数据量很多呢？假设数据表有100W的数据，根据O(log2n)计算，大约需要20次IO *** 作。磁盘寻道大概需要10ms，总的查询时间为20 * 10 = 0.2，效率也比较低下。

还有就是平衡二叉树不支持范围查询，范围查询每次都需要从根节点遍历，效率及其低下。

2.3 B-树(改造二叉树成多叉树)

之前的几种树形结构适合与小数据量的内存查找，也叫做内查找。在1970年，R.Bayer和E.Mccreight提出了一种适合于外查找的平衡多叉树B-树。MYSQL数据文件是存在磁盘的，每次都是按照一页大小（一般而16K）读取内存。像二叉树、平衡二叉树，每次读取节点都要进行一次IO *** 作，所以树越高IO *** 作次数越多。想要提高

既然查询速度特别快而且你也只需要排名前一百条的语句，可以用where语句再过滤一下，然后对查询出来的语句再进行排序。相对来说需要排序的数据量会少一些。

例如：

1、select top 100 * from mytable order by operateDate；

2、select * from (select top 100 * from mytable ) a order by a.operateDate；

如果表内数据量比较大的话，2 的速度是优于1的。毕竟1是先对表内所有数据排序，然后再进行查询，2只需要排序过滤之后的数据。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/8498711.html

mysql按主键排序为什么比索引快

发表评论

评论列表（0条）