最近遇到一个由于唯一性索引,导致并发插入产生死锁的场景,在分析死锁产生的原因时,发现这一块还挺有意思的,涉及到MySql中不少的知识点,特此总结记录一下。
image
谈到mysql的锁,可以说的就比较多了,比如行锁、表锁、页锁、元数据锁等,当然我们这里没打算把所有的都细列出来,我们这里主要针对行锁、gap锁进行拓展,以方便分析第二节中,为什么并发插入同样的数据会产生死锁的问题
0. 锁分类
我们最常说的锁,可以区分为共享锁(S)和排它锁(X),在mysql的innodb引擎中,为了解决幻读问题,引入了gap锁以及next key lock;除此之外,还有一种意向锁的,比如插入意向锁
本文将主要介绍的以下几种锁
上面虽然介绍了几种锁的基本定义,但是什么时候是行锁,怎样获取共享锁,排它锁又是在哪些场景下会产生呢?gap lock/next key lock又是怎样解决幻读的呢?
下面所有的都是基于mysql5.7.22 innodb引擎,rr隔离级别进行说明
1.共享锁与排它锁
下表介绍我们的实际使用的sql中,是否会使用锁,以及会产生什么锁
共享锁与排他锁区分
2. 行锁、表锁、gap锁、next-key锁区分
这几个的区分,主要就是看我们最终锁住的效果,比如
行锁和gap锁之间最大的区别是:
3. 实例演示
看上面的两个说明,自然就想在实际的case中操刀分析一下,不同的sql会产生什么样的锁效果
在分析上面几种case之前,我们得先有一个概念,锁是针对索引而言的,这一点非常非常重要
其次不同的索引,我们需要分别进行测试(其实就是唯一索引与普通索引)
3.1 表准备
接下来针对上面的四种场景,设计我们的测试用例,首先我们准备三张表
对应的表结构和初始化数据如下
CREATE TABLE `tn` ( `id` int(11) unsigned NOT NULL, `uid` int(11) unsigned NOT NULL ) ENGINE=InnoDB; CREATE TABLE `tu` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `uid` int(11) unsigned NOT NULL, PRIMARY KEY (`id`), UNIQUE KEY `u_uid` (`uid`) ) ENGINE=InnoDB; CREATE TABLE `ti` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `uid` int(11) unsigned NOT NULL, PRIMARY KEY (`id`), KEY `u_uid` (`uid`) ) ENGINE=InnoDB; INSERT INTO `tn` (`id`, `uid`) VALUES (1, 10), (5, 20), (10, 30); INSERT INTO `tu` (`id`, `uid`) VALUES (1, 10), (5, 20), (10, 30); INSERT INTO `ti` (`id`, `uid`) VALUES (1, 10), (5, 20), (10, 30);
3.2 精确匹配
即我们的sql可以精确命中某条记录时,锁的情况如下:
请注意上面的结论,无索引时锁全表好理解,但是普通索引的TI表,居然还有一个[10, 30)的gap锁就有点超乎我们的想象了;
接下来我们验证一下
上图基本流程如下:
从上面的实测也可以看出,普通索引下添加x锁,居然会加一个gap锁,而且这个gap区间是前一个记录(并包含它),到下一个记录
如 uid = 20, 前后两个记录为(1, 10), (10, 30)
3.3 精确查询未匹配
当我们锁的记录不存在时,锁情况如下:
实测case如下(TN省略,锁全表的没啥测试必要性)
基本流程就不画图了,上面图中已经有文字描述了
从上面的测试也可以看出,uid=30没有被锁住,这里只在uid=(20, 30)这一区间添加了gap锁
唯一索引与普通索引表现一致,会阻塞insert的插入意向锁(后面说这个东西)
3.4 范围查询
当我们锁一段区间时,锁的情况如下:
image.png
简单来说,范围查询时,添加next key lock,根据我们的查询条件,找到最左边和最右边的记录区间
如 uid > 15 and uid < 25,找到的记录是(1, 10), (10, 30)
说明:范围加x锁时,可能锁住不在这个区间的记录,一不小心可能导致死锁哦
3.5 小结
在RR隔离级别中,我们一般认为可以产生锁的语句为:
| 普通索引 | 精确匹配,且命中 | 行锁 + gap lock (上一个记录和下个记录区间,左闭右开,左边记录非行锁) | 普通索引 | 精确匹配,未命中 | gap lock | | 普通索引 | 范围查询 | next key lock |
4. 锁冲突
上面介绍了不同场景下会产生什么样的锁,但是看完之后会有一个疑问,针对行锁其他会话竞争的时候,可以按照X/S锁的规则来,但是这个GAP LOCK貌似只针对insert有效,insert除了加X锁之外是不是还有其他的特殊逻辑?
4.1 插入意向锁
插入意向锁其实是一种特殊的 gap lock,但是它不会阻塞其他锁。假设存在值为 4 和 7 的索引记录,尝试插入值 5 和 6 的两个事务在获取插入行上的排它锁之前使用插入意向锁锁定间隙,即在(4,7)上加 gap lock,但是这两个事务不会互相冲突等待;但是如果这个区间存在gap lock,则会被阻塞;如果多个事务插入相同数据导致唯一冲突,则在重复的索引记录上加读锁
简单来说,它的属性为:
其次一个重要知识点:
4.2 锁冲突矩阵
简单版矩阵
当我们将gap lock(间隙锁), next key lock(next-key锁), Insert Intention lock(插入意向锁)也加入矩阵时,就会复杂很多了
说明:
小结:
针对上面的矩阵,理解下面几个原则即可推导上面矩阵
上面属于基本知识点,接下来我们看一个实际导致死锁的case
0. 表准备
创建一个最简单最基础的表,用于演示
CREATE TABLE `t` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8; INSERT INTO `t` (`id`) VALUES (1);
1. 事务回滚的死锁问题
场景复现:
step1:
-- session1: begin; insert into t values (2); -- session2: begin; insert into t values (2); -- 阻塞 -- session3: begin; insert into t values (2); -- 阻塞
step2:
-- session1: rollback;
原因分析:
死锁日志查看
SHOW ENGINE INNODB STATUS;
2. delete导致死锁问题
和前面操作基本一致,只是第一个会话是删除记录
-- session1: begin; delete from t where id=1; -- session2: begin; insert into t values (1); -- 阻塞 -- session3: begin; insert into t values (1); -- 阻塞
-- session1: