MySQL 你好,死锁
前言
在日常的生活中,相信大家曾或多或少有这么一种体验:” 每到下班高峰期的时候,原本宽坦的交通干道,一时间变得水泄不通,司机和乘客都烦躁不安,喇叭声响成一片,当车卡在十字路口中间,会很尴尬的发现,此时无论想走哪都……”。对于这样的体验,大家都是十分的害怕接触和体验,交通部门也无时无刻为解决交通拥堵问题而努力。
其实上面生活案例中拥堵就类似于——高并发
场景;
而所有方向的车堵在十字路口中间就类似于——数据库死锁
场景。
本章主要围绕 InnoDB 存储引擎
死锁相关的一些概念、产生死锁的原因、死锁场景以及死锁的处理策略。
相关概念
为了更好的认识 死锁
,我们先来了解MySQL
中与死锁相关的一些基本概念。
并发控制
并发控制(Concurrency control)指的是当多个用户同时更新运行时,用于保护数据库完整性的各种技术。
读写锁
为了保证数据库的并发控制,因此 MySQL
设置了两种锁:
- 共享锁(Shared Lock):也叫读锁(Read Lock),允许多个连接可以同一时刻并发的读取同一资源,互不干扰
- 排他锁(Exclusive Lock):也叫写锁(Write Lock),会阻塞其他写锁或者读书的请求,保证同一时刻只有一个连接可以操作数据,包括读
锁策略
所谓 锁策略
就是在锁的开销和数据的安全性之间寻求平衡,这种平衡会影响到性能。目前 InnoDB 存储引擎
有以下两种锁策略:
- Table Lock(表锁)策略:最基本的锁策略,开销最小,加锁快,不会出现死锁,但发生锁冲突概率高,粒度大,并发低
- Row Lock(行锁)策略:粒度最小,发生锁冲突态度低,并发也高,但是开销大,加锁慢,会出现死锁
事务
所谓事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。一个 事务
是需要通过严格 ACID 测试的:
- 原子性(ATOMICITY):一个事务的整个操作,要么全部提交成功,要么全部失败回滚,不能执行其中的某一部分
- 一致性(CONSISTENCY):数据库总是从一个一致性的状态转换到另外一个一致性的状态
- 隔离性(ISOLATION):一个事物所作的修改在提交前,其他事务是看不到的
- 持久性(DURABILITY):一旦事务提交,则其所做的修改就会永久保存到数据库中
隔离级别
SQL 标准制定了四种隔离级别,规定事务的修改对其它事务是否可见
- READ UNCOMMITED(未提交读):未提交也可见,又称
脏读
- READ COMMITED(提交读):只有提交才可见,大多数 DBMS 默认隔离级别都是这个,MySQL 不是,也称不可重复读
- REPEATABLE READ(可重复读),多次重复读取结果一致,MySQL 默认这个级别,解决
脏读
问题,但存在幻读
问题(某个事务读取记录时,另一事务插入了新纪录,原事务再读取记录时产生幻行)。 - SERIALIZABLE(可串行化),最高隔离级别,强制事务串行执行,避免了前面说的幻读问题,并发性能差
隔离级别 | 脏读可能性 | 不可重复读可能性 | 幻读可能性 | 加锁读 |
---|---|---|---|---|
READ UNCOMMITED | Yes | Yes | Yes | No |
READ COMMITED | No | Yes | Yes | No |
REPEATABLE READ | No | No | Yes | No |
SERIALIZABLE | No | No | No | Yes |
死锁的定义
死锁是指 两个或多个事务
在同一资源上相互占用,并请求 锁定
对方占用的资源(我等待你的资源,你却等待我的资源,我们都相互等待,谁也不释放自己占有的资源),从而导致恶性循环的现象:
- 当多个
事务
试图以不同顺序锁定资源时,就可能会产生死锁 - 多个
事务
,同时锁定
同一个资源时,也会产生死锁
死锁的危害
死等和死锁可不是一回事,如果你遇到了死等,大可放心,肯定不是死锁;如果发生了死锁,也大可放心,绝对不会死等。
这是因为 MySQL
内部有一套死锁检测机制,一旦发生死锁会立即回滚一个事务,让另一个事务执行下去。并且这个死锁回滚的的错误消息也会发送给客户端。即使正常的业务中,死锁也时不时会发生,所以遇到死锁不要害怕,因为这也是对数据安全的一种保护,但是若死锁太频繁,那可能会带来许多的问题:
- 使进程得不到正确的结果:处于死锁状态的进程得不到所需的资源,不能向前推进,故得不到结果
- 使资源的利用率降低:处于死锁状态的进程不释放已占有的资源,以至于这些资源不能被其他进程利用,故系统资源利用率降低
- 导致产生新的死锁:其它进程因请求不到死锁进程已占用的资源而无法向前推进,所以也会发生死锁
死锁产生的原因
死锁有四个必要的条件:
- 互斥排他:一个资源每次只能被一个进程使用
- 保持着排他资源又提出新资源请求:一个进程因请求资源而阻塞时,对已获得的资源保持不放
- 不可剥夺:资源不能被抢占,即资源只能在进程完成任务后自动释放
- 环路:有一组等待进程{P0、P1、P2},
P0
等待的资源被P1
所占有,P1
等待的资源被P2
所占有,而P2
等待的又被P0
所占有,形成了一个等待循环
死锁的发生场景
以下的所有场景是基于 InnoDB 存储引擎
并且隔离级别为REPEATABLE-READ
(可重复读)
查询当前的隔离级别:
select @@global.tx_isolation,@@tx_isolation;
+-----------------------+-----------------+
| @@global.tx_isolation | @@tx_isolation |
+-----------------------+-----------------+
| REPEATABLE-READ | REPEATABLE-READ |
+-----------------------+-----------------+
修改隔离级别:
set global transaction isolation level read committed; ## 全局的
set session transaction isolation level read committed; ## 当前会话(session)
创建数据表
CREATE TABLE `deadlock` (`id` int(11) NOT NULL,
`stu_num` int(11) DEFAULT NULL,
`score` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `idx_uniq_stu_num` (`stu_num`),
KEY `idx_score` (`score`)
) ENGINE=InnoDB;
insert into deadlock(id, stu_num, score) values (1, 11, 111);
insert into deadlock(id, stu_num, score) values (2, 22, 222);
insert into deadlock(id, stu_num, score) values (3, 33, 333);
id
主键索引
stu_num
为唯一索引
score
普通索引
为了模拟实际场景,需要在每个会话(session)中执行以下两条命令:
set autocommit=0; ## 关闭自动提交
START TRANSACTION; ## 开始事务
场景一:AB BA
# session A
select * from deadlock where id = 1 for update;
# session B
select * from deadlock where id = 2 for update;
# session A
select * from deadlock where id = 2 for update;
## 因为 session2 已经给 id= 2 分配了写锁
# session B
select * from deadlock where id = 1 for update;
## 1213 - Deadlock found when trying to get lock; try restarting transaction
场景二:同一个事务中,S-lock 升级为 X-lock
# session A
SELECT * FROM deadlock WHERE id = 1 LOCK IN SHARE MODE;
## 获取 S -Lock
# session B
DELETE FROM deadlock WHERE id = 1;
## 想获取 X -Lock,但被 session A 的 S -lock 卡住,目前处于 waiting lock 阶段
# session A
DELETE FROM deadlock WHERE id = 1;
## Error : Deadlock found when trying to get lock; try restarting transaction
## 想获取 X -Lock,sessionA 本身拥有 S -Lock
## 但是由于 sessionB 申请 X -Lock 再前 ##
## 因此 sessionA 不能够从 S -lock 提升到 X-lock
## 需要等待 sessionB 释放才可以获取,所以造成死锁
场景三:主键和二级索引的死锁
CREATE TABLE `deadlock_A` (`id` int(11) NOT NULL,
`stu_num` int(11) DEFAULT NULL,
`score` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_score` (`score`),
KEY `idx_stu_num` (`stu_num`) USING BTREE
) ENGINE=InnoDB;
# deadlock_A 数据
# select * from deadlock_A
| id | stu_num | score |
| ---- | ------- | ----- |
| 1 | 11 | 111 |
| 2 | 33 | 222 |
| 3 | 22 | 333 |
| 4 | 44 | 444 |
# session A
delete from deadlock_A where stu_num > 11;
## 锁二级索引(stu_num)的顺序:22->33->44 锁主键(id)索引的顺序:3->2->4
# session B
delete from deadlock_A where score > 111;
## 锁二级索引(score)的顺序:222->333->444 锁主键(id)索引的顺序:2->3->4
## sessionA 锁主键 3,sessionB 锁主键 2
## sessionA 锁主键 2,sessionB 锁主键 3
## 死锁产生 -》AB BA
## 这个在并发场景,可能会产生。
场景四:间隙锁(Gap Lock)
CREATE TABLE `t2` (`id` int(11) NOT NULL,
`v` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_v` (`v`) USING BTREE
) ENGINE=InnoDB;
# select * from t2
| id | v |
| ---- | ----- |
| 2 | 2 |
| 5 | 5 |
| 10 | 10 |
间隙锁案例
# session A
delete from test where v=5;
# session B
insert into t2 (id,v) values (3,3);
## ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
insert into t2 (id,v) values (9,9);
## ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
insert into t2 (id,v) values (5,11);
## ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
insert into t2 (id,v) values (1,1)
## Affected rows : 1, Time: 5.62sec
insert into t2(id,v) values (10, 10);
## Affected rows : 1, Time: 10.51sec
insert into t2 (id,v) values (9,11);
## Affected rows : 1, Time: 15.51sec
看得出锁的是 id=5 & k=[3,10)的记录。
通过上面案例,大概了解间隙锁的范围后,我们来看看死锁场景:
# session A
update t2 set v = 5 where v =5;
## Affected rows : 1, Time: 12.67sec
# session B
update t2 set v = 10 where v =10;
## Affected rows : 1, Time: 12.88sec
# session A
insert into t2 (id,v) values (7,7);
## waiting
# session B
insert into t2 (id,v) values (8,8);
## Error : Deadlock found when trying to get lock; try restarting transaction
死锁的处理策略
预防死锁
- 同顺序:以固定的顺序访问表和行。比如两个更新数据的事务,事务 A 更新数据的顺序 为 1 ->2;事务 B 更新数据的顺序为 2 ->1。这样更可能会造成死锁
- 尽量保持事务简短:大事务更倾向于死锁,如果业务允许,将大事务拆小
- 一次性锁定:在同一个事务中,尽可能做到一次锁定所需要的所有资源,减少死锁概率
- 降低隔离级别:如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从 RR 调整为 RC,可以避免掉很多因为 gap 锁造成的死锁
- 细粒度锁定(行锁):为表添加合理的索引。可以看到如果不走索引将会为表的每一行记录添加上锁,死锁的概率大大增大
死锁的检测和解除
innodb_lock_wait_timeout 等待锁超时回滚事务:
直观方法是在两个事务相互等待时,当一个等待时间超过设置的某一阀值时,对其中一个事务进行回滚,另一个事务就能继续执行。这种方法简单有效,在 innodb 中,参数 innodb_lock_wait_timeout 用来设置超时时间。
wait-for graph 算法来主动进行死锁检测:
innodb 还提供了 wait-for graph 算法来主动进行死锁检测,每当加锁请求无法立即满足需要并进入等待时,wait-for graph 算法都会被触发。
参考文章
《高性能的 MySQL 第三版》
http://hedengcheng.com/?p=771…
https://www.kancloud.cn/hangh…
https://blog.csdn.net/dqjyong…