mysql索引有什么用？_随笔

先正面回答你的问题

数据是否重复不是建立索引的重要依据，甚至都不是依据。

只要不完全重复（所有元组的该元素都一样），那么建立索引就是有意义的。

即使当前数据完全重复，也不是不能建立索引，这种情况有点复杂，不细说了。

对于你后面的疑问，可以给你一个如何建立索引的忠告，“如何查就如何建”。

索引的建立，唯一的原因就是为了查询（广义的查询），实际上建立索引会使得数据存储所占空间变大，有时索引所占的空间会查过数据本身的空间。索引的建立也会使得数据插入时变慢，特殊情况下，慢的难以忍受，所以dba的重要工作之一，就是检查索引层级并优化。

索引建立的唯一好处，就是按照索引查询时，变快了。type，status这2个字段是否适合建立索引，就要看你是否要按照这2个字段进行检索。而检索的顺序决定了如何建立索引。

对于索引类型和索引方式，我建议就

normal

和

btree

就适用于大多数情况。若你参与的是一个大数据处理项目，对数据存储和检索有特别要求，那么需要分析多个层面，比如数据吞吐量、数据的方差、平均差等等很多参数才考虑是否用聚集索引等（mysql好像还没聚集索引），至于是否是唯一索引，我建议不使用，即使能判定数据是唯一的也不要用，全文索引也没有必要。

mysql的索引类型及使用索引时的注意事项有：

一、普通索引。这是最基本的索引，它没有任何限制。它有以下几种创建方式：

1、创建索引

代码如下:

CREATE INDEX indexName ON mytable(username(length))

如果是CHAR，VARCHAR类型，length可以小于字段实际长度；如果是BLOB和TEXT类型，必须指定 length，下同。

2、修改表结构

代码如下:

ALTER mytable ADD INDEX [indexName] ON (username(length)) -- 创建表的时候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, INDEX [indexName] (username(length)) )

-- 删除索引的语法：

DROP INDEX [indexName] ON mytable

二、唯一索引。它与前面的普通索引类似，不同的就是：索引列的值必须唯一，但允许有空值。如果是组合索引，则列值的组合必须唯一。它有以下几种创建方式：

代码如下:

CREATE UNIQUE INDEX indexName ON mytable(username(length))

-- 修改表结构

ALTER mytable ADD UNIQUE [indexName] ON (username(length))

-- 创建表的时候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, UNIQUE [indexName] (username(length)) )

三、主键索引。它是一种特殊的唯一索引，不允许有空值。一般是在建表的时候同时创建主键索引：

代码如下:

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, PRIMARY KEY(ID) )

当然也可以用 ALTER 命令。记住：一个表只能有一个主键。

四、组合索引。为了形象地对比单列索引和组合索引，为表添加多个字段：

代码如下:

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL, city VARCHAR(50) NOT NULL, age INT NOT NULL )

为了进一步榨取MySQL的效率，就要考虑建立组合索引。就是将 name, city, age建到一个索引里：

代码如下:

ALTER TABLE mytable ADD INDEX name_city_age (name(10),city,age)[code]

建表时，usernname长度为 16，这里用 10。这是因为一般情况下名字的长度不会超过10，这样会加速索引查询速度，还会减少索引文件的大小，提高INSERT的更新速度。

如果分别在 usernname，city，age上建立单列索引，让该表有3个单列索引，查询时和上述的组合索引效率也会大不一样，远远低于我们的组合索引。虽然此时有了三个索引，但MySQL只能用到其中的那个它认为似乎是最有效率的单列索引。

建立这样的组合索引，其实是相当于分别建立了下面三组组合索引：usernname,city,age usernname,city usernname 为什么没有 city，age这样的组合索引呢？这是因为MySQL组合索引“最左前缀”的结果。简单的理解就是只从最左面的开始组合。并不是只要包含这三列的查询都会用到该组合索引，下面的几个SQL就会用到这个组合索引：

[code]

SELECT * FROM mytable WHREE username="admin" AND city="郑州" SELECT * FROM mytable WHREE username="admin"

五索引分类

直接创建索引和间接创建索引

直接创建索引 CREATE INDEX mycolumn_index ON mytable (myclumn)

间接创建索引定义主键约束或者唯一性键约束可以间接创建索引

普通索引和唯一性索引

普通索引 CREATE INDEX mycolumn_index ON mytable (myclumn)

唯一性索引保证在索引列中的全部数据是唯一的对聚簇索引和非聚簇索引都可以使用

CREATE UNIQUE COUSTERED INDEX myclumn_cindex ON mytable(mycolumn)

单个索引和复合索引

单个索引即非复合索引

复合索引又叫组合索引在索引建立语句中同时包含多个字段名最多个字段

CREATE INDEX name_index ON username(firstname lastname)

聚簇索引和非聚簇索引(聚集索引群集索引)

聚簇索引物理索引与基表的物理顺序相同数据值的顺序总是按照顺序排列

CREATE CLUSTERED INDEX mycolumn_cindex ON mytable(mycolumn) WITH

ALLOW_DUP_ROW(允许有重复记录的聚簇索引)

非聚簇索引 CREATE UNCLUSTERED INDEX mycolumn_cindex ON mytable(mycolumn)

六索引的使用

当字段数据更新频率较低查询使用频率较高并且存在大量重复值是建议使用聚簇索引

经常同时存取多列且每列都含有重复值可考虑建立组合索引

复合索引的前导列一定好控制好否则无法起到索引的效果如果查询时前导列不在查询条件中则该复合索引不会被使用前导列一定是使用最频繁的列

多表 *** 作在被实际执行前查询优化器会根据连接条件列出几组可能的连接方案并从中找出系统开销最小的最佳方案连接条件要充份考虑带有索引的表行数多的表内外表的选择可由公式外层表中的匹配行数*内层表中每一次查找的次数确定乘积最小为最佳方案

where子句中对列的任何 *** 作结果都是在sql运行时逐列计算得到的因此它不得不进行表搜索而没有使用该列上面的索引如果这些结果在查询编译时就能得到那么就可以被sql优化器优化使用索引避免表搜索(例 select * from record where substring(card_no )=

&&select * from record where card_no like % )任何对列的 *** 作都将导致表扫描它包括数据库函数计算表达式等等查询时要尽可能将 *** 作移至等号右边

where条件中的 in 在逻辑上相当于 or 所以语法分析器会将in ( ′ ′)转化为column= ′ or column= ′来执行我们期望它会根据每个or子句分别查找再将结果相加这样可以利用column上的索引但实际上它却采用了 or策略即先取出满足每个or子句的行存入临时数据库的工作表中再建立唯一索引以去掉重复行最后从这个临时表中计算结果因此实际过程没有利用column上索引并且完成时间还要受tempdb数据库性能的影响 in or子句常会使用工作表使索引失效如果不产生大量重复值可以考虑把子句拆开拆开的子句中应该包含索引

要善于使用存储过程它使sql变得更加灵活和高效

lishixinzhi/Article/program/MySQL/201311/29603

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/8760329.html

mysql索引有什么用？

发表评论

评论列表（0条）