一文让你彻底弄懂MySQL自增列_随笔

MYSQL的自增列在实际生产中应用的非常广泛，相信各位所在的公司or团队，MYSQL开发规范中一定会有要求尽量使用自增列去充当表的主键，为什么DBA会有这样的要求，各位在使用MYSQL自增列时遇到过哪些问题？这些问题是由什么原因造成的呢？本文由浅入深，带领大家彻底弄懂MYSQL的自增机制。

1. 通过auto_increment关键字来指定自增的列，并指定自增列的初始值为1。

[root@localhost][test1]>Create table t(id int auto_increment ,namevarchar(10),primary key(id))auto_increment=1

QueryOK, 0 rows affected (0.63 sec)

2. 自增列上必须有索引，将t表的主键索引删除掉，会报错

[root@localhost][test1]>alter table t drop primary key

ERROR1075 (42000): Incorrect table definitionthere can be only one auto column andit must be defined as a key

3. 设定auto_increment_increment参数，可以调整自增步长，该参数有session级跟global级，在分库分表以及双主or多主的模式下比较有用。

4. 一个表上只能有一个自增列

5. Mysql5.7及以下版本，innodb表的自增值保存在内存中，重启后表的自增值会设为max(id)+1，而myisam引擎的自增值是保存在文件中，重启不会丢失。Mysql8.0开始，innodb的自增id能持久化了，重启mysql，自增ID不会丢。

首先：表中自增列的上限是根据自增列的字段类型来定的。

若设定了自增id充当主键，当达到了自增id的上限值时，会发生什么样的事情呢？还是以上面创建的 t表为例，先回顾它的表结构：

CREATETABLE `t` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`name` varchar(10) COLLATE utf8mb4_binDEFAULT NULL,

PRIMARY KEY (`id`)

)ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin

无符号的int类型，上限是2147483647。这里我们将表的自增值设为2147483647，再插入两行数据：

[root@localhost][test1]>alter table t auto_increment=2147483647

QueryOK, 0 rows affected (0.01 sec)

Records:0 Duplicates: 0 Warnings: 0

[root@localhost][test1]>insert into t(name) values ('test')

QueryOK, 1 row affected (0.01 sec)

[root@localhost][test1]>insert into t(name) values ('test')

ERROR 1062 (23000): Duplicate entry '2147483647' for key 'PRIMARY'

可以看到，第一个插入没问题，因为自增列的值为2147483647，这是达到了上限，还没有超过，第二行数据插入时，则报出主键重复，在达到上限后，无法再分配新的更大的自增值，也没有从1开始从头分配，在这里表的auto_increment值会一直是2147483647。

对于写入量大，且经常删除数据的表，自增id设为int类型还是偏小的，所以我们为了避免出现自增id涨满的情况，这边统一建议自增id的类型设为unsigned bingint，这样基本可以保障表的自增id是永远够用的。

这里内容比较多，innodb是索引组织表，所以涉及到索引的知识，但这不是本文的重点，我们快速回顾索引知识：

1. Innodb索引分为主键跟辅助索引，主键即全表，辅助索引叶子节点保存主键的值，而主键的叶子节点保存数据行，中间节点存着叶子节点的路由值。

2. Innodb存储数据（索引）的单位是页，这里默认是16K，这也意味着，数据本身越小，一个页中能存数据的量越多，而检索效率不仅仅由索引的层数来决定，更是由一次能够缓存的数据量来定，也就是说数据本身越小，则一次IO能够提取到缓冲区的数据越多（OS每次IO的量是固定的4K），查询的效率越好。

其实能够理解索引的结构及索引写入插入、更新的原理，则自然就明白为何建议使用自增id。这里我直接列出使用自增id 当主键的好处吧：

1. 顺序写入，避免了叶的分裂，数据写入效率好

2. 缩小了表的体积，特别是相比于UUID当主键，甚至组合字段当主键时，效果更明显

3. 查询效率好，原因就是我上面说到索引知识的第二点。

4. 某些情况下，我们可以利用自增id来统计大表的大致行数。

5. 在数据归档or垃圾数据清理时，也可方便的利用这个id去 *** 作，效率高。

容易出现不连续的id

有的同志会发现，自己的表中id值存在空洞，如类似于1、2、3、8、9、10这样，有的适合有想依赖于自增id的连续性来实现业务逻辑，所以会想方设法去修改id让其变的连续，其实，这是没有必要的，这一块的业务逻辑交由MySQL实现是很不理智的，表的记录小还好，要是表的数据量很大，修改起来就糟糕了。那么，为什么自增id会容易出现空洞呢？

自增id的修改机制如下：

在MySQL里面，如果字段id被定义为AUTO_INCREMENT，在插入一行数据的时候，自增值的行为如下：

1. 如果插入数据时id字段指定为0、null 或未指定值，那么就把这个表当前的

AUTO_INCREMENT值填到自增字段；

2. 如果插入数据时id字段指定了具体的值，就直接使用语句里指定的值。

根据要插入的值和当前自增值的大小关系，自增值的变更结果也会有所不同。假设，某次要插入的值是X，当前的自增值是Y。

1. 如果X<Y，那么这个表的自增值不变；

2. 如果X≥Y，就需要把当前自增值修改为新的自增值。

新的自增值生成算法是：从auto_increment_offset开始，以auto_increment_increment为步长，持续叠加，直到找到第一个大于X的值，作为新的自增值。

Insert、update、delete *** 作会让id不连续。

Delete、update：删除中间数据，会造成空动，而修改自增id值，也会造成空洞（这个很少）。

Insert：插入报错（唯一键冲突与事务回滚），会造成空洞，因为这时候自增id已经分配出去了，新的自增值已经生成，如下面例子：

[root@localhost][test1]>select * fromt

+----+------+

| id | name |

+----+------+

| 1| aaa |

| 2| aaa |

| 3| aaa |

| 4| aaa |

+----+------+

4 rows in set (0.00 sec)

[root@localhost][test1]>selectAuto_increment from information_schema.tables where table_name='t'

+----------------+

| Auto_increment |

+----------------+

| 5 |

+----------------+

1 row in set (0.00 sec)

[root@localhost][test1]>begin

Query OK, 0 rows affected (0.00 sec)

[root@localhost][test1]>insert intot(name) values('aaa')

Query OK, 1 row affected (0.00 sec)

[root@localhost][test1]>select * fromt

+----+------+

| id | name |

+----+------+

| 1| aaa |

| 2| aaa |

| 3| aaa |

| 4| aaa |

| 5| aaa |

+----+------+

5 rows in set (0.00 sec)

[root@localhost][test1]>selectAuto_increment from information_schema.tables where table_name='t'

+----------------+

| Auto_increment |

+----------------+

| 6 |

+----------------+

1 row in set (0.00 sec)

[root@localhost][test1]>rollback

Query OK, 0 rows affected (0.00 sec)

[root@localhost][test1]>selectAuto_increment from information_schema.tables where table_name='t'

+----------------+

| Auto_increment |

+----------------+

| 6 |

+----------------+

1 row in set (0.01 sec)

[root@localhost][test1]>select * fromt

+----+------+

| id | name |

+----+------+

| 1| aaa |

| 2| aaa |

| 3| aaa |

| 4| aaa |

+----+------+

4 rows in set (0.00 sec)

可以看到，虽然事务回滚了，但自增id已经回不到从前啦，唯一键冲突也是这样的，这里就不做测试了。

在批量插入时（insert select等），也存在空洞的问题。看下面实验：

[root@localhost][test1]>select * fromt

+----+------+

| id | name |

+----+------+

| 1| aaa |

| 2| aaa |

| 3| aaa |

| 4| aaa |

+----+------+

4 rows in set (0.00 sec)

[root@localhost][test1]>selectAuto_increment from information_schema.tables where table_name='t'

+----------------+

| Auto_increment |

+----------------+

| 5 |

+----------------+

1 row in set (0.00 sec)

[root@localhost][test1]>insert intot(name) select name from t

Query OK, 4 rows affected (0.04 sec)

Records: 4 Duplicates: 0 Warnings: 0

[root@localhost][test1]>select * fromt

+----+------+

| id | name |

+----+------+

| 1| aaa |

| 2| aaa |

| 3| aaa |

| 4| aaa |

| 5| aaa |

| 6| aaa |

| 7| aaa |

| 8| aaa |

+----+------+

8 rows in set (0.00 sec)

[root@localhost][test1]>selectAuto_increment from information_schema.tables where table_name='t'

+----------------+

| Auto_increment |

+----------------+

| 12 |

+----------------+

1 row in set (0.00 sec)

可以看到，批量插入，导致下一个id值不为9了，再插入数据，即产生了空洞，这里是由mysql申请自增值的机制所造成的，MySQL在批量插入时，若一个值申请一个id，效率太慢，影响了批量插入的速度，故mysql采用下面的策略批量申请id。

1. 语句执行过程中，第一次申请自增id，会分配1个；

2. 1个用完以后，这个语句第二次申请自增id，会分配2个；

3. 2个用完以后，还是这个语句，第三次申请自增id，会分配4个；

4. 依此类推，同一个语句去申请自增id，每次申请到的自增id个数都是上一次的两倍。

在对自增列进行 *** 作时，存在着自增锁，mysql的innodb_autoinc_lock_mode参数控制着自增锁的上锁机制。该参数有0、1、2三种模式：

0：语句执行结束后释放自增锁，MySQL5.0时采用这种模式，并发度较低。

1：mysql的默认设置。普通的insert语句申请后立马释放，insert select、replace insert、load data等批量插入语句要等语句执行结束后才释放，并发读得到提升

2：所有的语句都是申请后立马释放，并发度大大提升！但是在binlog为statement格式时，主从数据会发生不一致。这一块网上有很多介绍，我不做介绍了。

在彻底了解了MYSQL的自增机制以后，在实际生产中就能灵活避坑，这里建议不要用自增id值去当表的行数，当需要对大表准确统计行数时，可以去count(*)从库，如果业务很依赖大表的准确行数，直接弄个中间表来统计，或者考虑要不要用mysql的innodb来存储数据，这个是需要自己去权衡。另外对于要求很高的写入性能，但写入量又比较大的业务，自增id的使用依然存在热点写入的问题，存在性能瓶颈，这时候可通过分库分表来解决。

雪花算法与Mysql自增的优缺点分别是：

雪花算法优点是：

1、不会重复。

2、有序，不会造成空间浪费和胡乱插入影响性能。

3、生成很快特别是比UUid快得多。

4、相比UUid更小。

缺点是：时间回拨造成错乱。

Mysql自增的优点是：

1、存储空间小。

2、插入和查询性能高。

缺点是：

1、int的范围可能不够大。

2、当要做数据迁移的时候，会很麻烦，主键容易冲突。

3、id自增，自身的业务增长情况很容易被别人掌握。

4、自增在高并发的情况下性能不好。

生成id的代码是：

自增和UUid差异的原因是：mysql数据库一般我们会采用支持事务的Innodb，在Innodb中，采用的是B+数索引。Innodb的存储结构，是聚簇索引。对于聚簇索引顺序主键和随机主键的对效率的影响很大。

自增是顺序主键存储，查找和插入都很方便（插入会按顺序插到前一个的后面），但UUid是无序的，通过计算获得的hashcode也会是无序的（是按照hashcode选择存储位置）。

所以对于他的查找效率很低，而且因为他是无序的，他的插入有可能会插到前面的数据中，会造成很多其他的 *** 作，很影响性能或者很多存储空间因为没有顺序的存储而被空缺浪费。

如何在MYSQL插数据ID自增的方法。

如下参考：

1.在添加字段之前，第一个应该首先检查当前tb1表的结构，如下图所示。

2.实例字段列添加到表，如下所示。

3.再次看表结构和比较之前和之后的情况添加字段，如下图所示。

4.最后，插入新的数据行看到的样子，最后添加自动增长的字段，如下所示。

注意事项：

MySQL使用的SQL语言是访问数据库最常用的标准语言。MySQL软件采用双重许可政策,分为社区版,商业版，由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特性，一般中小网站开发选择MySQL作为数据库。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/6239266.html

一文让你彻底弄懂MySQL自增列

发表评论

评论列表（0条）