CREATE TABLE `reno` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=112 DEFAULT CHARSET=utf8
2、表数据
insert into reno select 5, 'aa'
insert into reno select 7, 'bb'
insert into reno select 9, 'cc'
insert into reno select 18, 'dd'
insert into reno select 23, 'ee'
insert into reno select 30, 'ff'
insert into reno select 40, 'gg'
insert into reno select 45, 'hh'
insert into reno select 99, 'ii'
3、两种尝试
下面两种方案都会造成阻塞,我理解都是事务1获取到了间隙锁,事务2获取插入意向锁阻塞,但是“show engine INNODB status\G”输出结果不一样,
第一种方案
事务1 lock_mode X locks gap before rec 我理解是间隙锁
事务2 lock_mode X locks gap before rec insert intention waiting 我理解是获取插入意向锁
第二种方案
事务1 trx id 9821 lock_mode X 我理解是 Next key锁
事务2 lock_mode X insert intention waiting 我理解是获取插入意向锁
我的疑问 为什么两个方案,事务1获取的锁,以及事务2获取的锁都是不一样的呢
第一种方案
当你开始执行一个 ALTER ,而你遇到了可怕的“元数据锁定等待”,我敢肯定你一定遇见过。我最近遇到了一个案例,其中被更改的表要执行一个很小范围的更新(<100行)。ALTER 在负载测试期间一直等待了几个小时。在停止负载测试后,ALTER 按预期在不到一秒的时间内就完成了。那么这里发生了什么?
检查外键
每当有奇数次锁定时,我的第一直觉就是检查外键。当然这张表有一些外键引用了一个更繁忙的表。但是这种行为似乎仍然很奇怪。对表运行 ALTER 时,会针对子表请求一个 SHARED_UPGRADEABLE 元数据锁。还有针对父级的 SHARED_READ_ONLY 元数据锁。
我们来看看如何根据文档获取元数据锁定[1]:
如果给定锁定有多个服务器,则首先满足最高优先级锁定请求,并且与 max_write_lock_count系统变量有关。写锁定请求的优先级高于读取锁定请求。
[1]:https://dev.mysql.com/doc/refman/en/metadata-locking.html
请务必注意锁定顺序是序列化的:语句逐个获取元数据锁,而不是同时获取,并在此过程中执行死锁检测。
通常在考虑队列时考虑先进先出。如果我发出以下三个语句(按此顺序),它们将按以下顺序完成:
1. INSERT INTO parent2. ALTER TABLE child3. INSERT INTO parent
但是当子 ALTER 语句请求对父进行读取锁定时,尽管排序,但两个插入将在 ALTER 之前完成。以下是可以演示此示例的示例场景:
数据初始化:
CREATE TABLE `parent` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`val` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB
CREATE TABLE `child` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`parent_id` int(11) DEFAULT NULL,
`val` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_parent` (`parent_id`),
CONSTRAINT `fk_parent` FOREIGN KEY (`parent_id`) REFERENCES `parent` (`id`) ON DELETE CASCADE ON UPDATE NO ACTION
) ENGINE=InnoDB
INSERT INTO `parent` VALUES (1, "one"), (2, "two"), (3, "three"), (4, "four")
Session 1:
start transactionupdate parent set val = "four-new" where id = 4Session 2:
alter table child add index `idx_new` (val)Session 3:
start transactionupdate parent set val = "three-new" where id = 3此时,会话 1 具有打开的事务,并且处于休眠状态,并在父级上授予写入元数据锁定。 会话 2 具有在子级上授予的可升级(写入)锁定,并且正在等待父级的读取锁定。最后会话 3 具有针对父级的授权写入锁定:
mysql>select * from performance_schema.metadata_locks+-------------+-------------+-------------------+---------------+-------------+| OBJECT_TYPE | OBJECT_NAME | LOCK_TYPE | LOCK_DURATION | LOCK_STATUS |+-------------+-------------+-------------------+---------------+-------------+| TABLE | child | SHARED_UPGRADABLE | TRANSACTION | GRANTED | <- ALTER (S2)| TABLE | parent | SHARED_WRITE | TRANSACTION | GRANTED | <- UPDATE (S1)| TABLE | parent | SHARED_WRITE | TRANSACTION | GRANTED | <- UPDATE (S3)| TABLE | parent | SHARED_READ_ONLY | STATEMENT | PENDING | <- ALTER (S2)+-------------+-------------+-------------------+---------------+-------------+请注意,具有挂起锁定状态的唯一会话是会话 2(ALTER)。会话 1 和会话 3 (分别在 ALTER 之前和之后发布)都被授予了写锁。排序失败的地方是在会话 1 上发生提交的时候。在考虑有序队列时,人们会期望会话 2 获得锁定,事情就会继续进行。但是,由于元数据锁定系统的优先级性质,会话 3 具有锁定,会话 2 仍然等待。
如果另一个写入会话进入并启动新事务并获取针对父表的写锁定,则即使会话 3 完成,ALTER 仍将被阻止。
只要我保持一个对父表打开元数据锁定的活动事务,子表上的 ALTER 将永远不会完成。更糟糕的是,由于子表上的写锁定成功(但是完整语句正在等待获取父读锁定),所以针对子表的所有传入读取请求都将被阻止!
另外,请考虑一下您通常如何对无法完成的语句进行故障排除。您查看已经打开较长时间的事务(在进程列表和 InnoDB 状态中)。但由于阻塞线程现在比 ALTER 线程更年轻,因此您将看到的最旧的事务/线程是 ALTER 。
这正是这种情况下发生的情况。在准备发布时,我们的客户端正在运行 ALTER 语句并结合负载测试(一种非常好的做法!)以确保顺利发布。问题是负载测试保持对父表打开一个活动的写事务。这并不是说它只是一直在写,而是有多个线程,一个总是活跃的。 这阻止了 ALTER 完成并阻止对相对静态的子表的随后的读请求。
幸运的是,这个问题有一个解决方案(除了从设计模式中驱逐外键)。变量 max_write_lock_count[2] 可用于允许在写入锁定之后在读取锁定之前授予读取锁定连续写锁。默认情况下,此变量设置为 18446744073709551615,如果你对该表发出 10,000 次写入/秒,那么你的读将被锁定 5800 万年……
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)