关于innodb:InnoDB-的并发控制锁与-MVCC

2次阅读

共计 26033 个字符,预计需要花费 66 分钟才能阅读完成。

原文:https://nullwy.me/2023/07/innodb-locking/
如果感觉我的文章对你有用,请随便赞叹

目前支流数据库事务的并发管制实现,如 MySQL InnoDB、PostgreSQL、Oracle,都应用两阶段封闭 2PL 与 MVCC 技术,但具体实现细节上存在差别。InnoDB 是在以封闭技术为主体的状况下,用 MVCC 技术辅助实现读 - 写、写 - 读操作的并发。PostgreSQL 的并发控制技术是以 MVCC 技术为主,封闭技术为辅。本文次要关注 InnoDB 事务的并发管制实现。

背景常识

并发管制,是数据库系统的 ACID 个性中的隔离性(Isolation))的保障。所谓隔离性,就是事务的执行不应受到其余并发执行事务的烦扰,事务的执行看上去应与其余事务是隔离的。被隔离的执行,等价于事务的某种串行执行,或者说,它等价于一个没有并发的执行。保障串行性可能只容许极小的并发度,采纳较弱隔离性,能带来更高的并发度,是并发事务的正确性和性能之间的斗争。

晚期各大数据库厂商实现并发管制时多采纳基于封闭的并发控制技术,所以在基于封闭的技术背景下,才在 ANSI SQL-92 规范中提出了四种隔离级别:未提交读(Read Uncommitted)、己提交读(Read Committed)、可反复读(Repeatable Read)、可串行化(Serializable)(附注:为了书写简便本文将各个隔离级别顺次缩写为 RU、RC、RR、SER)。ANSI SQL-92 规范的四种隔离级别,是依据三种读异常现象(phenomena)定义的,隔离级别和异常现象的关系如下:

隔离级别 P1 脏读 P2 不可反复读 P4 幻读
Read Uncommitted 可能 可能 可能
Read Committed 防止 可能 可能
Repeatable Read 防止 防止 可能
Serializable 防止 防止 防止

ANSI SQL-92 规范文档对三种读异常现象的定义原文如下 [ref]:

The isolation level specifies the kind of phenomena that can occur during the execution of concurrent SQL-transactions. The following phenomena are possible:
1) P1 (“Dirty read”): SQL-transaction T1 modifies a row. SQL-transaction T2 then reads that row before T1 performs a COMMIT. If T1 then performs a ROLLBACK, T2 will have read a row that was never committed and that may thus be considered to have never existed.
2) P2 (“Non-repeatable read”): SQL-transaction T1 reads a row. SQL-transaction T2 then modifies or deletes that row and performs a COMMIT. If T1 then attempts to reread the row, it may receive the modified value or discover that the row has been deleted.
3) P3 (“Phantom”): SQL-transaction T1 reads the set of rows N that satisfy some <search condition>. SQL-transaction T2 then executes SQL-statements that generate one or more rows that satisfy the <search condition> used by SQL-transaction T1. If SQL-transaction T1 then repeats the initial read with the same <search condition>, it obtains a different collection of rows.

除了脏读、不可反复读和幻读这 3 种读数据异样外,还有写数据异样,即脏写和失落更新。各个异样的含意如下:

  • P0 脏写(Dirty Write):事务 T1 写某数据项,并且未提交或回滚,事务 T2 也写该数据项,而后事务 T1 或事务 T2 回滚,回滚导致另外一个事务的批改被连带回滚。脏写异样会导致事务无奈回滚,原子性无奈失去保障,所以全副隔离级别下都应该防止。脏写也能够叫回滚失落。
  • P1 脏读(Dirty Read):读到了其余事务还未提交的数据。
  • P2 不可反复读(Non-Repeatable):事务 T1 读取某数据项,事务 T2 批改 update 或删除 delete 该数据项,事务 T1 再次读取该数据项,后果不同。
  • P3 幻读(Phantom):事务 T1 读取满足某条件的数据项汇合,事务 T2 生成新的满足该条件的数据项,事务 T2 再次读取满足该条件的数据项汇合,后果不同。
  • P4 失落更新(Lost Update):事务 T1 读取某数据项,事务 T2 更新该数据项并提交,事务 T1 疏忽事务 T2 的更新,间接基于最后的读取数据项做更新并提交,导致事务 T2 的更新失落。失落更新也能够叫笼罩失落。

各个异样的读写操作序列的简化符号示意如下 [Berenson 1995]:

P0: w1[x]...w2[x]...(c1 or a1)                 事务 T2 脏写
A1: w1[x]...r2[x]...(a1 and c2 in any order)   事务 T2 脏读,r2[x] 为脏读
A2: r1[x]...w2[x]...c2...r1[x]...c1            事务 T1 不可反复读,两次 r1[x] 后果不同
A3: r1[P]...w2[y in P]...c2...r1[P]...c1       事务 T1 幻读,两次 r1[P] 后果不同
P4: r1[x]...w2[x]...w1[x]...c1                 事务 T2 更新失落,c1 导致 w2[x] 失落

其中 w1[x] 示意事务 T1 写入记录 x,r1[x] 示意事务 T1 读取记录 x,c1 示意事务 T1 提交,a1 示意事务 T1 回滚,r1[P] 示意事务 T1 依照谓词 P 的条件读取若干条记录,w1[y in P] 示意事务 T1 写入记录 y 满足谓词 P 的条件。

Berenson 的论文评判了 ANSI SQL-92 规范的异样定义。ANSI SQL-92 规范的异样的定义存在歧义,能够严格解释,也能够宽松解释,A1、A2 和 A3 的符号示意为严格解释,按严格解释,某些非凡的异样无奈囊括,所以举荐宽松解释。依照规范的定义,容易引起误会的是,在排除 P1 脏读、P2 不可反复、P3 幻读这三种读异样后就会失去可串行化隔离级别,然而事实并非如此。规范没有定义 P0 脏写和 P4 更新失落异样。另外,基于 MVCC 技术实现的快照隔离(Snapshot Isolation),能防止规范定义的 P1 脏读、P2 不可反复、P3 幻读,并且防止 P0 脏写和 P4 更新失落,但还存在写偏序(Write Skew)异样。

不可反复读和幻读的区别:

  • 不可反复读对于事务 T2 的写操作是更新或删除操作,而幻读对于事务 T2 的写操作是插入(插入的新数据满足条件)或更新(使不满足条件的数据在更新后满足条件)操作。
  • 对于幻读景象中事务 T2 的操作,如果操作是对现有数据的更新或删除操作,则表明这样的操作等同于不可反复读,即是在多个行数据上进行更新或删除,即在多个行数据上批量化重演了不可反复读景象
  • 不可反复读和幻象最大的区别就是前者只须要“锁住”(思考)曾经读过的数据,而幻读须要 对“还不存在的数据“做出预防 。不可反复读景象中事务 T2 着眼于 对现有数据进行操作 ;而幻读景象中事务 T2 着眼于对新增 (或不在锁定范畴内曾经存在的数据上做更新后而得的数据满足了谓词条件) 数据

异样由并发抵触引起,对应关系如下:

  • 写写抵触:P0 脏写、P4 失落更新
  • 写读抵触:P1 脏读
  • 读写抵触:P2 不可反复读、P3 幻读

晚期各大数据库厂商实现并发管制时多采纳基于封闭的并发控制技术,所以在基于封闭的技术背景下,才在 ANSI SQL 规范中提出了四种隔离级别。基于锁的并发控制技术的加锁形式与隔离级别的关系表 [Berenson 1995]:

隔离级别 写锁 数据项的读锁 谓词的读锁
Read Uncommitted 长写锁 无锁要求 无锁要求
Read Commited 长写锁 短读锁 短谓词锁
Repeatable Read 长写锁 长读锁 短谓词锁
Serializable 长写锁 长读锁 长谓词锁

阐明:

  • 短锁(short duration lock),以后正在执行的语句持有锁,语句执行结束锁被开释。长锁(long duration lock),当锁被持有后,直到事务提交之后才被开释。
  • RU 隔离级别,阻止 P0,长写锁
  • RC 隔离级别,阻止 P0、P1,长写锁 + 短读锁 + 短谓词锁
  • RR 隔离级别,阻止 P0、P1、P4、P2,长写锁 + 长写锁 + 短谓词锁
  • SER 隔离级别,阻止 P0、P1、P4、P2、P3,长写锁 + 长写锁 + 长谓词锁

基于锁的并发管制下,隔离级别和异常现象的关系:

隔离级别 P0 脏写 P1 脏读 P4 失落更新 P2 不可反复读 P4 幻读
Read Uncommitted 防止 可能 可能 可能 可能
Read Committed 防止 防止 可能 可能 可能
Repeatable Read 防止 防止 防止 防止 可能
Serializable 防止 防止 防止 防止 防止

各个隔离级别在基于锁的并发控制技术下的具体的实现阐明(参考自腾讯李海翔的《数据库事务处理的艺术》第 2 章):

基于锁的并发管制,读 - 读操作能够并发执行,但读 - 写、写 - 读、写 - 写操作无奈并发执行,阻塞期待。MVCC 联合封闭技术,使得读-写、写-读操作互不阻塞,即只有写-写操作不能并发,并发度被进步到 75%,这就是 MVCC 被广为应用的起因。

InnoDB 的并发管制以封闭技术为主,MVCC 技术为辅助。让咱们先看下 InnoDB 的封闭技术。

共享锁与排他锁

InnoDB 存储引擎实现两种规范的 行级锁 模式,共享锁(读锁)和排他锁(写锁)[doc]:

  • 共享锁(shared lock,S):容许事务读一行数据。
  • 排他锁(exclusive Lock,X):容许事务删除或更新一行数据。

如果事务 T1 持有行 r 上的共享锁(S),则来自某个不同事务 T2 的对行 r 上的锁的申请将按如下形式解决:

  • T2 对 S 锁的申请能够立刻被授予。因而,T1 和 T2 持有 r 上的锁。
  • T2 对 X 锁的申请不能立刻被授予。

如果事务 T1 持有行 r 上的排他锁(X),则某个不同事务 T2 对 r 上任一类型的锁的申请无奈立刻被授予。相同,事务 T2 必须期待事务 T1 开释其对行 r 的锁定。

共享锁和排他锁的兼容性:

待申请 \ 已持有 共享锁 S 排他锁 X
共享锁 S 兼容 抵触
排他锁 X 抵触 抵触

辨别共享锁(读锁)和排它锁(写锁)后,读锁与读锁的并发可被容许进行,并发能力得以进步。

对于 updatedeleteinsert 语句,InnoDB 会主动给波及数据集加排他锁(X);对于一般 select 语句,InnoDB 不会加任何锁(SERIALIZABLE隔离级别下除外);事务能够通过以下语句显式给查问 select 显式加共享锁或排他锁:

  • 共享锁(S):select ... for share
  • 排他锁(X):select ... for update

当初让咱们来试验下共享锁和排他锁。创立 tbl 表,并增加表数据:

create table tbl 
  (a int, b int, c int, d int, primary key(a), unique key(b), key(c));
insert into tbl values
  (10, 10, 10, 10), (20, 20, 20, 20), (30, 30, 30, 30), 
  (40, 40, 40, 40), (50, 50, 50, 50), (60, 60, 60, 60), 
  (70, 70, 70, 70), (80, 80, 80, 80), (90, 90, 90, 90),
  (100, 100, 100, 100);

InnoDB 的排它锁示例,如下:

事务 1 事务 2
mysql> begin; mysql> begin;
— 在 a = 10 的索引记录上增加排他锁
mysql> select * from tbl where a = 10 for update;
— 阻塞,获取 a = 10 的排他锁超时
mysql> update tbl set b = 42 where a = 10;
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
— 阻塞,获取 a = 10 的排他锁超时
mysql> update tbl set b = 42 where a >= 10;
— 阻塞,获取 a = 10 的排他锁超时
mysql> delete from tbl where a = 10;
— 阻塞,获取 a = 10 的排他锁超时
mysql> select * from tbl where a = 10 for update;
— 更新胜利,能够取得其余记录的排他锁
mysql> update tbl set b = 42 where a = 20;
mysql> commit;
— 更新胜利,在事务 1 开释锁后,其余事务能够获取排他锁
mysql> update tbl set b = 42 where a = 10;

InnoDB 的共享锁示例,如下:

事务 1 事务 2
mysql> begin; mysql> begin;
— 在 a = 10 的索引记录上增加共享锁
mysql> select * from tbl where a = 10 for share;
— 获取 a = 10 的共享锁胜利
mysql> select * from tbl where a = 10 for share;
— 阻塞,获取 a = 10 的排他锁超时
mysql> update tbl set b = 42 where a = 10;
mysql> commit;
— 更新胜利,在事务 1 开释锁后,其余事务能够获取排他锁
mysql> update tbl set b = 42 where a = 10;

多粒度与意向锁

InnoDB 存储引擎反对多粒度锁定(multiple granularity locking),这种锁定容许事务在行级上的锁和表级上的锁同时存在。为了反对在不同粒度上进行加锁操作,InnoDB 存储引擎反对一种额定的锁形式,称之为意向锁(Intention Lock)。意向锁是将锁定的对象分为多个档次,意向锁意味着事务心愿在更细粒度上进行加锁。

若将上锁的对象看成一棵树,那么对最上层的对象上锁,也就是对最细粒度的对象进行上锁,那么首先须要对粗粒度的对象上锁。如果须要对页上的记录 r 进行上 X 锁,那么别离须要对数据库 A、表、页上意向锁 IX,最初对记录 r 上 X 锁。若其中任何一个局部导致期待,那么该操作须要期待粗粒度锁的实现。

在一个对象加锁之前,该对象的全副先人节点均加上了意向锁。心愿给某个记录加锁的事务必须遍历从根到记录的门路。在遍历树的过程中,该事务给各节点加上意向锁。

举例来说,假如在表 1 的记录 r 上持有 X 锁,表 1 上必然持有 IX 锁。如果其余事务想在表 1 上加 S 表锁或 X 表锁,但与已有 IX 锁不兼容,所以该事务须要期待。再举例,假如表 1 持有 S 锁,如果其余事务想在表 1 的记录 r 上加 X 锁,须要先取得表 1 的 IX 锁,但与已有 S 锁不兼容,所以该事务须要期待。有了意向锁之后,就能疾速判断行锁和表锁之间是否兼容。

InnoDB 存储引擎反对意向锁设计比拟简练,其意向锁即为 表级别的锁,两种意向锁 [doc]:

  • 动向共享锁(IS):事务打算给数据行加行共享锁(S),事务在给一个数据行加共享锁(S)前必须先获得该表的 IS 锁。
  • 动向排他锁(IX):事务打算给数据行加行排他锁(X),事务在给一个数据行加排他锁(X)前必须先获得该表的 IX 锁。

IS、IX、S、X 锁的兼容性:

待申请 \ 已持有 IS IX S X
IS 兼容 兼容 兼容 抵触
IX 兼容 兼容 抵触 抵触
S 兼容 抵触 兼容 抵触
X 抵触 抵触 抵触 抵触

兼容关系:各种意向锁(IS、IX)之间全副兼容,动向共享锁 IS 和共享锁 S 兼容,共享锁 S 和共享锁 S 兼容,其余抵触。

SQL 语句能够分为数据定义语言(DDL)、数据管制语言(DCL)、数据查询语言(DQL)、数据操纵语言(DML)四种类型的语句,前两种语句,波及的对象在数据之上,所以加锁的范畴,通常是表级,对应表级锁。后两种语句操作的对象是数据,加锁的范畴,通常是数据级,这就对应行级锁。

三种行锁:记录锁、间隙锁和 next-key 锁

InnoDB 行锁分为 3 种类型 [doc]:

  • 记录锁(record lock):对索引记录项加锁。
  • 间隙锁(gap lock):间隙锁,对索引记录项之间的“间隙”、笫一条记录前的“间隙”或最初一条记录后的“间隙“加锁。锁定一个范畴,但不蕴含索引记录自身。
  • next-key 锁(next-key Lock):前两种锁的组合,记录锁 + 间隙锁,锁定一个范畴,并且锁定索引记录自身。(中文世界有时将 next-key lock 翻译为“临键锁”)

如果索引上蕴含 10, 20, 30, 40, 50 这些记录,那么可能的 next-key 锁的锁区间(interval),如下:

(- 无穷, 10]     即,间隙锁 (- 无穷, 10) + 记录锁 10。区间为,左开右闭区间
(10, 20]       即,间隙锁 (10, 20) + 记录锁 20
(20, 30]       即,间隙锁 (20, 30) + 记录锁 30
(30, 40]       即,间隙锁 (30, 40) + 记录锁 40
(40, 50]       即,间隙锁 (40, 50) + 记录锁 50
(50, + 无穷]     即,间隙锁 (50, + 无穷)

最初一个锁区间 (50, + 无穷],对应的是上界伪记录(supremum pseudo-record),不是实在存在的记录。这个锁区间用于避免在最大值 50 之后插入记录。

记录锁总是会去锁住索引记录,如果 InnoDB 存储引擎表在建设的时候没有设置任何一个索引,那么这时 InnoDB 存储引擎会应用隐式的主键来进行锁定。

MySQL 默认的事务隔离级别是可反复读(REPEATABLE-READ),如果把事务隔离级别改成已提交读(READ-COMMITTED),间隙锁会被禁用。禁用间隙锁后,幻读异样会呈现,因为其余事务能够在间隙中插入新行。InnoDB 的间隙锁,就是为了解决幻读异样而引入的。对于幻读异样,参见官网文档 doc。

RR 隔离级别下,InnoDB 的锁通常应用 next-key 锁。然而,在惟一索引(和主键索引)上的等值查问 next-key 锁进化为记录锁,间隙锁并不需要,即仅锁住索引自身,而不是范畴。 如果在惟一索引(和主键索引)上做范畴查问,间隙锁仍然须要。官网文档形容如下 [doc]:

Gap locking is not needed for statements that lock rows using a unique index to search for a unique row. (This does not include the case that the search condition includes only some columns of a multiple-column unique index; in that case, gap locking does occur.)

间隙锁是“纯抑制性的”,间隙锁惟一的作用就是为了避免其余事务的插入到间隙中。间隙锁和间隙锁之间是互不抵触的,所以间隙共享 S 锁和间隙排他 X 锁没有任何区别。

另外,还有一种锁叫 插入意向锁(insert intention lock),基于间隙锁,专门用于 insert 操作。在执行 insert 操作时,须要先申请获取插入意向锁,也就是说,须要先查看以后插入地位上的下一条记录上是否持有间隙锁,如果被间隙锁锁住,则锁抵触,插入被阻塞。多个事务做 insert 操作,被雷同的间隙锁阻塞,如果插入的值各不相同,这些事务的 insert 操作之间不阻塞。

所以,间隙锁与插入意向锁的兼容关系是,已持有的间隙锁与待申请的插入意向锁抵触,而插入意向锁之间兼容,在一个间隙锁锁上能够有多个意向锁期待。

IS、IX、X、S 锁和记录锁、间隙锁、next-key 锁的关系:

  • IS、IX、S、X 是锁模式(lock mode)(源码层面上对应 lock_mode 枚举)。
  • 记录锁、间隙锁、next-key 锁、插入意向锁是行锁类型(record lock type)。
  • 每一种行锁类型,都蕴含 IS、IX、S、X 锁模式,如共享的记录锁、排他的记录锁、共享的间隙录锁、排他的间隙锁等。

锁监控:data_locks 和 data_lock_waits 表

MySQL 8.0 之前,information_schema 库提供 innodb_trxinnodb_locksinnodb_lock_waits 三张表,用来监控事务和诊断潜在的锁问题,具体介绍能够参见官网 5.7 文档 doc。

  • innodb_trx:以后事务表
  • innodb_locks:锁期待中的锁信息表
  • innodb_lock_waits:锁期待中的事务表

在 MySQL 8.0 之前,要想取得以后已持有的锁信息,须要开启参数 innodb_status_output_locks 并且执行命令 show engine innodb status,具体介绍能够参见官网文档“15.17 InnoDB Monitors”,doc。

MySQL 8.0 开始,innodb_locks 表和 innodb_lock_waits 表,被 performance_schema 库的 data_locks 表和 data_lock_waits 表代替。其中值得注意的不同点是,新的 data_locks 表,同时蕴含了已持有的锁和申请中的锁的信息,这样查看以后已持有的锁信息更加不便。相干 SQL 示例:

-- 查问全副锁信息
select * from performance_schema.data_locks \G
-- 查问全副记录锁的锁信息
select * from performance_schema.data_locks where LOCK_TYPE = 'RECORD' \G
-- 查问期待中的锁信息
select * from performance_schema.data_locks where LOCK_STATUS = 'WAITING' \G
-- 查问锁期待中的事务
select * from performance_schema.data_lock_waits \G
-- 应用 sys 库的 innodb_lock_waits 视图
-- 查问锁期待中的事务
select * from sys.innodb_lock_waits \G

命令 show engine innodb status 的输入和 data_locks 表的对应关系,能够参考文章 link。

行锁加锁案例剖析

RR 隔离级别

本文的全副案例采纳的 MySQL 版本为 8.0.30。MySQL 的默认事务隔离级别是 REPEATABLE-READ(可反复读),事务隔离级别能够通过零碎变量 transaction_isolation 管制。

-- 事务隔离级别,默认为可反复读(Repeatable Read)mysql> select @@global.transaction_isolation, @@transaction_isolation;
+--------------------------------+-------------------------+
| @@global.transaction_isolation | @@transaction_isolation |
+--------------------------------+-------------------------+
| REPEATABLE-READ                | REPEATABLE-READ         |
+--------------------------------+-------------------------+
1 row in set (0.00 sec)

tbl 表的数据如下:

mysql> select * from tbl;
+-----+------+------+------+
| a   | b    | c    | d    |
+-----+------+------+------+
|  10 |   10 |   10 |   10 |
|  20 |   20 |   20 |   20 |
|  30 |   30 |   30 |   30 |
|  40 |   40 |   40 |   40 |
|  50 |   50 |   50 |   50 |
|  60 |   60 |   60 |   60 |
|  70 |   70 |   70 |   70 |
|  80 |   80 |   80 |   80 |
|  90 |   90 |   90 |   90 |
| 100 |  100 |  100 |  100 |
+-----+------+------+------+
10 rows in set (0.00 sec)

(a1) 主键索引上的等值查问

SQL 语句:

select * from tbl where a = 10 for update;

data_locks 表中的行锁数据:

mysql> select * from performance_schema.data_locks where LOCK_TYPE = 'RECORD' \G
*************************** 1. row ***************************
               ENGINE: INNODB
       ENGINE_LOCK_ID: 4816436360:185:4:3:140408965390368
ENGINE_TRANSACTION_ID: 56664
            THREAD_ID: 367
             EVENT_ID: 22
        OBJECT_SCHEMA: testdb
          OBJECT_NAME: tbl
       PARTITION_NAME: NULL
    SUBPARTITION_NAME: NULL
           INDEX_NAME: PRIMARY
OBJECT_INSTANCE_BEGIN: 140408965390368
            LOCK_TYPE: RECORD
            LOCK_MODE: X,REC_NOT_GAP
          LOCK_STATUS: GRANTED
            LOCK_DATA: 10

加锁状况:

  • 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)

其余 SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 a = 10 的索引记录上增加共享记录锁(S,REC_NOT_GAP)select * from tbl where a = 10 for share;

-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)update tbl set b = 42 where a = 10;

-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)delete from tbl where a = 10;

加锁与锁抵触 SQL 演示:

事务 1 事务 2
mysql> begin; mysql> begin;
— 在 a = 10 的索引记录上增加排他记录锁
mysql> select * from tbl where a = 10 for update;
— 阻塞,因为 a = 10 上存在排他记录锁
mysql> select * from tbl where a = 10 for update;
— 阻塞,因为 a = 10 上存在排他记录锁
mysql> insert into tbl (a) values (10);
— 插入胜利
mysql> insert into tbl (a) values (9);
— 插入胜利
mysql> insert into tbl (a) values (11);
mysql> rollback; mysql> rollback;

(a2) 惟一索引上的等值查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 b = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where b = 10 for update;

-- 在 b = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 笼罩索引,但零碎会认为接下来要更新数据,因而会顺便给主键索引上满足条件的行加上行锁
select a from tbl where b = 10 for update;

-- 在 b = 10 的索引记录上增加共享记录锁(S,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加共享记录锁(S,REC_NOT_GAP)select * from tbl where b = 10 for share;

-- 在 b = 10 的索引记录上增加共享记录锁(S,REC_NOT_GAP)-- 笼罩索引,所以只在字段 b 上加锁
select a from tbl where b = 10 for share;

-- 在 b = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)update tbl set b = 42 where b = 10;

-- 在 b = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)delete from tbl where b = 10;

下面的全副 SQL,除了走笼罩索引的 select for share 外,其余的加锁范畴都雷同。

(a3) 非惟一索引上的等值查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 c = 10 的索引记录上增加排他 next-key 锁,区间为 (- 无穷, 10](X)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 c = 20 的索引记录上增加排他间隙锁,区间为 (10, 20)(X,GAP)select * from tbl where c = 10 for update;

-- 在 c = 10 的索引记录上增加共享 next-key 锁,区间为 (- 无穷, 10](S)-- 在 a = 10 的索引记录上增加共享记录锁(S,REC_NOT_GAP)-- 在 c = 20 的索引记录上增加共享间隙锁,区间为 (10, 20)(S,GAP)select * from tbl where c = 10 for share;

-- 在 c = 10 的索引记录上增加共享 next-key 锁,区间为 (- 无穷, 10](S)-- 在 c = 20 的索引记录上增加共享间隙锁,区间为 (10, 20)(S,GAP)-- 笼罩索引,所以只在字段 c 上加锁
select a from tbl where c = 10 for share;

-- 在 c = 10 的索引记录上增加排他 next-key 锁,区间为 (- 无穷, 10](X)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 c = 20 的索引记录上增加排他间隙锁,区间为 (10, 20)(X,GAP)update tbl set c = 42 where c = 10;

-- 在 c = 10 的索引记录上增加排他 next-key 锁,区间为 (- 无穷, 10](X)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 c = 20 的索引记录上增加排他间隙锁,区间为 (10, 20)(X,GAP)delete from tbl where c = 10;

下面的全副 SQL,除了走笼罩索引的 select for share 外,其余的加锁范畴都雷同。

加锁与锁抵触 SQL 演示:

事务 1 事务 2
mysql> begin; mysql> begin;
— 在 c = 10 的索引记录上增加排他 next-key 锁,区间为 (- 无穷, 10]
— 在 a = 10 的索引记录上增加排他记录锁
— 在 c = 20 的索引记录上增加排他间隙锁,区间为 (10, 20)
mysql> select * from tbl where c = 10 for update;
— 阻塞,因为 c = 10 上存在排他 next-key 锁
mysql> select from tbl where c = 10 for update;
— 阻塞,因为 a = 10 上存在排他记录锁
mysql> select
from tbl where a = 10 for update;
— 阻塞,因为 c = 10 上存在排他 next-key 锁,区间为 (- 无穷, 10]
mysql> insert into tbl (a, c) values (1, 9);
— 阻塞,因为 c = 10 上存在排他 next-key 锁,区间为 (- 无穷, 10]
mysql> insert into tbl (a, c) values (1, 10);
— 阻塞,因为 c = (10, 20) 区间存在间隙锁
mysql> insert into tbl (a, c) values (1, 11);
— 插入胜利
mysql> insert into tbl (a, c) values (1, 21);
mysql> rollback; mysql> rollback;

(a4) 无索引的等值查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 a 主键的全副索引记录上增加排他 next-key 锁
select * from tbl where d = 10 for update;

因为字段 d 上没有索引,这个 SQL 语句,只能在聚簇索引上全表扫描。加锁状况,在 a 主键的全副索引记录上增加排他 next-key 锁。表 tbl 共 10 条记录,全副的持有的 next-key 锁的锁区间,如下:

(- 无穷, 10]
  (10, 20]
  (20, 30]
  (30, 40]
  (40, 50]
  (50, 60]
  (60, 70]
  (70, 80]
  (80, 90]
  (90, 100]
(100, + 无穷]

(a5) 值不存在的等值查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

---- 主键索引上的值不存在的等值查问
-- 在 a = 100 的索引记录上增加排他间隙锁,区间为 (90, 100)(X,GAP)select * from tbl where a = 95 for update;
-- 在 a 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where a = 105 for update;

---- 惟一索引上的值不存在的等值查问
-- 在 b = 100 的索引记录上增加间隙锁,区间为 (90, 100)(X,GAP)select * from tbl where b = 95 for update;
-- 在 b 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where b = 105 for update;

---- 非惟一索引上的值不存在的等值查问
-- 在 c = 100 的索引记录上增加间隙锁,区间为 (90, 100)
select * from tbl where c = 95 for update;
-- 在 c 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where c = 105 for update;

(b1) 主键索引上的范畴查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)-- 在 a 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where a >= 90 for update;

-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where a >= 100 for update;

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他间隙锁,区间为 (90, 100)(X,GAP)-- 附注:与主键上的等值查问 `a = 90` 的加锁范畴的区别是额定加了区间为 (90, 100) 间隙锁
select * from tbl where a >= 90 and a < 91 for update;

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他间隙锁,区间为 (90, 100)(X,GAP)-- 附注:与雷同查问条件的 `select for update`,加锁范畴雷同
update tbl set d = 42 where a >= 90 and a < 91;

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他间隙锁,区间为 (90, 100)(X,GAP)-- 附注:与雷同查问条件的 `select for update` 的 SQL,加锁范畴雷同
delete from tbl where a >= 90 and a < 91;

(b2) 惟一索引上的范畴查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where b >= 90 for update;

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)select * from tbl where b >= 90 and b < 91 for update;

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)(不必要的记录锁)update tbl set d = 42 where b >= 90 and b < 91;

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)(不必要的记录锁)delete from tbl where b >= 90 and b < 91;

加锁与锁抵触 SQL 演示:

事务 1 事务 2
mysql> begin; mysql> begin;
— 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90]
— 在 a = 90 的索引记录上增加排他记录锁
— 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100]
mysql> select * from tbl where b >= 90 and b < 91 for update;
— 阻塞,因为 b = 90 上存在排他 next-key 锁
mysql> select from tbl where b = 90 for update;
— 阻塞,因为 b = 100 上存在排他 next-key 锁(不必要的记录锁)
mysql> select
from tbl where b = 100 for update;
— 阻塞,因为 a = 90 上存在排他记录锁
mysql> select * from tbl where a = 90 for update;
mysql> rollback; mysql> rollback;

(b3) 非惟一索引上的范畴查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b 的索引记录上增加排他 next-key 锁,区间为 (100, + 无穷](X)select * from tbl where c >= 90 for update;

-- 在 c = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 c = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)select * from tbl where c >= 90 and c < 91 for update;

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)(不必要的记录锁)update tbl set d = 42 where c >= 90 and c < 91;

-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)(不必要的记录锁)delete from tbl where c >= 90 and c < 91;

比照,惟一索引上的范畴查问的加锁状况,容易得出结论,惟一索引和一般索引上的范畴查问的加锁规定雷同

RC 隔离级别

把事务隔离级别批改为已提交读(Read Committed):

-- 事务隔离级别,批改为已提交读(Read Committed)mysql> set @@transaction_isolation = 'READ-COMMITTED';

(a1) 主键索引上的等值查问

SQL 语句的加锁状况(通过查 data_locks 表确认):

-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where a = 10 for update;

-- 在 a = 10 的索引记录上增加共享记录锁(S,REC_NOT_GAP)select * from tbl where a = 10 for share;

-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)update tbl set b = 42 where a = 10;

-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)delete from tbl where a = 10;

论断:因为主键索引上的等值查问不波及间隙锁,所以 RR 和 RC 隔离级别下的加锁规定雷同。

(a2) 惟一索引上的等值查问

同样的,因为惟一索引上的等值查问不波及间隙锁,所以 RR 和 RC 隔离级别下的加锁规定雷同。

(a3) 非惟一索引上的等值查问

-- 在 c = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where c = 10 for update;

-- 在 c = 10 的索引记录上增加排他记录锁(S,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(S,REC_NOT_GAP)select * from tbl where c = 10 for share;

-- 在 c = 10 的索引记录上增加排他记录锁(S,REC_NOT_GAP)-- 笼罩索引,所以只在字段 b 上加锁
select a from tbl where c = 10 for share;

-- 在 c = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)update tbl set c = 42 where c = 10;

-- 在 c = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)delete from tbl where c = 10;

(a4) 无索引的等值查问

-- 在 a = 10 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where d = 10 for update;

(a5) 值不存在的等值查问

---- 主键索引上的值不存在的等值查问
-- 无锁
select * from tbl where a = 95 for update;
-- 无锁
select * from tbl where a = 105 for update;

---- 惟一索引上的值不存在的等值查问
-- 无锁
select * from tbl where b = 95 for update;
-- 无锁
select * from tbl where b = 105 for update;

---- 非惟一索引上的值不存在的等值查问
-- 无锁
select * from tbl where c = 95 for update;
-- 无锁
select * from tbl where c = 105 for update;

(b1) 主键索引上的范畴查问

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where a >= 90 for update;

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where a >= 90 and a < 91 for update;

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)update tbl set d = 42 where a >= 90 and a < 91;

-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)delete from tbl where a >= 90 and a < 91;

(b2) 惟一索引上的范畴查问

-- 在 b = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where b >= 90 for update;

-- 在 b = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)select * from tbl where b >= 90 and b < 91 for update;

-- 在 b = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)update tbl set d = 42 where b >= 90 and b < 91;

-- 在 b = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)delete from tbl where b >= 90 and b < 91;

(b3) 非惟一索引上的范畴查问

加锁状况,和 RC 隔离级别的惟一索引上的范畴查问完全相同。

行锁加锁规定总结

RC 隔离级别时的加锁规定:

  • 间隙锁被禁用,只有记录锁,没有间隙锁和 next-key 锁。
  • 对全副满足查问条件的索引记录加记录锁。如果查问条件满足笼罩索引,就只对辅助索引加记录锁。如果须要回表,对辅助索引记录和聚簇索引记录引同时加锁。
  • 如果不存在满足查问条件的索引记录,就不加锁。

RR 隔离级别时的加锁规定:

  • 加锁的根本单位是 next-key 锁。
  • 对全副满足查问条件的索引记录加 next-key 锁。如果查问条件满足笼罩索引,就只对辅助索引加记录锁。如果须要回表,对辅助索引记录和聚簇索引记录引同时加锁。
  • 范畴查问时,或值不存在的等值查问时,在从右扫描到的最初的不满足查问条件的记录上加 间隙锁。如果索引的最大记录值,满足查问条件,则在上界伪记录(supremum pseudo-record)上加 next-key 锁(相当于间隙锁)。
  • 等值查问时,在主键索引和惟一索引上加锁,next-key 锁进化为记录锁。

范畴查问时的不必要加锁 bug

留神,RR 隔离级别时,在主键索引上的范畴查问时,的确是按上文的规定加 间隙锁。但理论验证发现,在辅助索引(包含惟一索引和一般索引)上的范畴查问时,在最初的不满足查问条件的记录上理论加的是 next-key 锁。这样加锁的问题是,会在不满足查问条件的记录上记录锁,这个记录锁其实是不必要的,是一个 bug。

其实,这个不必要的记录锁 bug,在 MySQL 8.0.18 之前,主键索引的场景下也存在,MySQL 8.0.18 修复了,但只修复了主键索引的场景,辅助索引的场景未修复。修复对应 bug 为“Bug #29508068 UNNECESSARY NEXT-KEY LOCK TAKEN”,修复提交记录见 github。

在 MySQL 8.0.19 版本上,有人再次提了 bug,“Bug #98639 Redundant row-level locking for secondary index”。不过 MySQL 官网认为“Not a Bug”。而后,提 bug 的人,也只好斗争认为这个是“performance issue”。

比照上面这 3 个 SQL 的加锁状况,能够发现后 2 个 SQL 存在不必要的加锁问题。

-- 主键索引上的范畴查问
-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 a = 100 的索引记录上增加排他间隙锁,区间为 (90, 100)(X,GAP)select * from tbl where a >= 90 and a < 91 for update;

-- 惟一索引上的范畴查问
-- 在 b = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 b = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)select * from tbl where b >= 90 and b < 91 for update;

-- 非惟一索引上的范畴查问
-- 在 c = 90 的索引记录上增加排他 next-key 锁,区间为 (80, 90](X)-- 在 a = 90 的索引记录上增加排他记录锁(X,REC_NOT_GAP)-- 在 c = 100 的索引记录上增加排他 next-key 锁,区间为 (90, 100](X)(不必要的记录锁)select * from tbl where c >= 90 and c < 91 for update;

隔离级别的实现

上文提到,PostgreSQL 的并发控制技术是以 MVCC 技术为主,封闭技术为辅。先看下 PostgreSQL 对隔离级别的实现 [doc]:

  • PostgreSQL 反对 SQL 规范的 4 种隔离级别,默认的隔离级别是 RC。但 PostgreSQL 外部只实现 3 种隔离级别 RC、RR 和 SER。若抉择 RU 隔离,实际上是 RC。
  • PostgreSQL 的 RR 隔离级别,底层是基于 MVCC 技术实现的快照隔离(SI,Snapshot Isolation)。快照隔离下,能防止 SQL-92 定义的三种异样,脏读、不可反复读和幻读异样,然而可能会呈现写偏序(Write Skew)异样。
  • PostgreSQL 的 SER 隔离,底层是可串行化的快照隔离(SSI,Serializable Snapshot Isolation)。

InnoDB 的并发管制以封闭技术为主,MVCC 技术辅助,各个隔离级别的具体实现是:

  • RC 隔离级别:快照读 + 写长锁

    • 快照读,能防止脏读
  • RR 隔离级别:快照读 + 写长锁 + 间隙锁(没有实现真正的快照隔离 SI)

    • 快照读,能肯定水平防止不可反复读和幻读异样,但因为 InnoDB 的刷新快照的非凡实现,不能完全避免
    • 间隙锁,能防止幻读异样,只有锁定读时才会申请获取间隙锁
  • 可串行化隔离级别:读长锁 + 写长锁 + 间隙锁

    • 齐全基于锁实现串行化,并发度很低,性能不好

InnoDB 实现的 MVCC 技术,能让事务以 快照读 的形式执行查问。快照读 (snapshot read),或者叫一致性非锁定读(consistent nonlocking read),或者一致性读(consistent read),即应用多版本技术实现的读取数据在某个工夫点的快照的查问。在 RR 和 RC 隔离级别下,一致性读是一般的 select 语句的默认模式。快照读 防止加锁,从而进步并发度。在 RR 和 RC 隔离级别下快照读的区别:

  • RR 隔离级别时,事务中的所有一致性读都会读取该事务中第一次此类读取建设的快照。
  • RC 隔离级别时,事务中的每个一致性读都会设置并读取其本人的最新快照,快照是最新已提交的数据。

如果事务在查问数据后,要对该数据做批改操作,快照读无奈提供足够的爱护,因为其余事务能够对这些数据做批改操作。为了提供额定的爱护,InnoDB 提供 锁定读(locking read),即同时执行锁定操作的 select 语句,锁持有直到事务完结。锁定读分两种:

  • select ... for share 是加共享锁的查问数据
  • select ... for update 是加排他锁的查问数据

RR 隔离级别下的不可反复读和幻读异样

上文提到,“快照读,能肯定水平防止不可反复读和幻读异样,但因为 InnoDB 的刷新快照的非凡实现,不能完全避免”。当初来看下 RR 隔离级别下的不可反复读异样的示例:

事务 1 事务 2
mysql> begin; mysql> begin;
— 返回值为 10,快照读
mysql> select b from tbl where a = 10;
— 把 b 值批改为 0
mysql> update tbl set b = 0 where a = 10;
mysql> commit;
— 返回值为 10,没有呈现不可反复读异样
mysql> select b from tbl where a = 10;
— update 会读取 a = 10 的已提交的最新值
— 同时 a = 10 记录的快照会被刷新
mysql> update tbl set b = b + 1 where a = 10;
— 返回值为 1,呈现不可反复读异样
mysql> select b from tbl where a = 10;

这个问题在 MySQL 的 Bug 零碎中能够找到,参见:Bug #57973、Bug #63870 等。官网认为,这不是 Bug,InnoDB 就是按这种形式设计。Bug #57973 下 MySQL 工程师 Kevin Lewis 对这个问题的解答 [ref]:

[16 Aug 2013 19:23] Kevin Lewis
Rejecting this bug because InnoDB is working as designed for the following reason;

But when InnoDB Repeatable Read transactions modify the database, it is possible to get phantom reads added into the static view of the database, just as the ANSI description allows. Moreover, InnoDB relaxes the ANSI description for Repeatable Read isolation in that it will also allow non-repeatable reads during an UPDATE or DELETE. Specifically, it will write to newly committed records within its read view. And because of gap locking, it will actually wait on other transactions that have pending records that may become committed within its read view. So not only is an UPDATE or DELETE affected by pending or newly committed records that satisfy the predicate, but also ‘SELECT … LOCK IN SHARE MODE’ and ‘SELECT … FOR UPDATE’.
This WRITE COMMITTED implementation of REPEATABLE READ is not typical of any other database that I am aware of. But it has some real advantages over a standard ‘Snapshot’ isolation. When an update conflict would occur in other database engines that implement a snapshot isolation for Repeatable Read, an error message would typically say that you need to restart your transaction in order to see the current data. So the normal activity would be to restart the entire transaction and do the same changes over again. But InnoDB allows you to just keep going with the current transaction by waiting on other records which might join your view of the data and including them on the fly when the UPDATE or DELETE is done. This WRITE COMMITTED implementation combined with implicit record and gap locking actually adds a serializable component to Repeatable Read isolation.

就是说,InnoDB 实现的 RR 隔离级别,放松了 SQL 规范对 RR 隔离级别的要求。事务 T1 在快照读后,如果其余事务 T2 批改了快照对应的记录并提交,之后事务 T1 执行波及快照的 DML 语句(update、delete、insert)或锁定读,会触发快照刷新,事务 T2 最新提交的批改会刷新进快照。最终导致事务 T1 再次执行雷同条件的快照读,读取后果不同,呈现不可反复读或幻读异样。简略概括就是,在快照生效后,又刷新快照,导致两次读到的快照不同。另外,如果实现上抉择不刷新快照,并且事务 T1 失常执行,会呈现 P4 失落更新异样。

不可反复读异样的防止(肯定水平上防止,但没有完全避免):

  • 如果事务反复的两次读都是快照读(一般 select 语句),并且两头没有执行波及快照的 DML 或锁定读,这样两次读到的是雷同的快照读,所以不会呈现不可反复读异样。
  • 如果事务反复的两次读都是以后读(select for update/share),因为第一次加锁,其余事务无奈更新该记录,所以也不会呈现不可反复读异样。
  • 如果事务反复的两次读都是快照读,然而两头执行波及快照的 DML 或锁定读,触发了快照刷新,如果快照被更新,就会呈现不可反复读异样。

幻读异样的防止(肯定水平上防止,但没有完全避免):

  • 如果事务反复的两次读都是快照读(一般 select 语句),并且两头没有执行波及快照的 DML 或锁定读,这样两次读到的是雷同的快照读,所以不会呈现幻读异样。
  • 如果事务反复的两次读都是以后读(select for update/share),因为第一次以后读加间隙锁,其余事务无奈插入,被阻塞,所以也不会呈现幻读异样。
  • 如果事务反复的两次读都是快照读,然而两头执行波及快照的 DML 或锁定读,触发了快照刷新,如果快照被更新,就会呈现幻读异样。

上述的 快照生效 的场景,PostgreSQL 的解决形式是,事务会被回滚并报错提醒,应用程序收到这个报错,能够尝试重试,重试的事务读到的快照是最新的,这样即防止失落更新异样,也防止了幻读和不可反复读异样(参见官网文档 doc)。

参考资料

MySQL 8.0 Reference Manual

  • 15.7 InnoDB Locking and Transaction Model https://dev.mysql.com/doc/refman/8.0/en/innodb-locking-transaction-model.html

    • 15.7.1 InnoDB Locking https://dev.mysql.com/doc/refman/8.0/en/innodb-locking.html
    • 15.7.2 InnoDB Transaction Model https://dev.mysql.com/doc/refman/8.0/en/innodb-transaction-model.html
    • 15.7.3 Locks Set by Different SQL Statements in InnoDB https://dev.mysql.com/doc/refman/5.7/en/innodb-locks-set.html
    • 15.7.4 Phantom Rows https://dev.mysql.com/doc/refman/5.7/en/innodb-next-key-locking.html
  • 15.15 InnoDB INFORMATION_SCHEMA Tables

    • 15.15.2 InnoDB INFORMATION_SCHEMA Transaction and Locking Information https://dev.mysql.com/doc/refman/8.0/en/innodb-information-schema-transactions.html
  • 15.17 InnoDB Monitors https://dev.mysql.com/doc/refman/8.0/en/innodb-monitors.html

其余参考资料:

  • Hal Berenson, Philip A. Bernstein, Jim Gray, Jim Melton, Elizabeth J. O’Neil, Patrick E. O’Neil: A Critique of ANSI SQL Isolation Levels. SIGMOD Conference 1995: 1-10(隔离级别的经典论文,其中作者 Jim Gray 因“对数据库和事务处理钻研的开创性奉献以及零碎实现方面的技术领导力”而于 1998 年取得图灵奖)
  • 数据库事务处理的艺术,腾讯李海翔 2017
  • MySQL 技术底细:InnoDB 存储引擎,姜承尧 第 2 版 2013:第 6 章 锁
  • 2013-12 何登成:MySQL 加锁解决剖析 https://web.archive.org/web/0/http://hedengcheng.com/?p=771 https://bit.ly/44rsCH7
  • 2019-04 阿里王德浩 / 孟勃荣:开发者都应该理解的数据库隔离级别 https://mp.weixin.qq.com/s/bFg8XFYd9HLvEoYyzAD3jg
  • 2021-07 MySQL Data Locks: Mapping 8.0 to 5.7 https://hackmysql.com/post/mysql-data-locks-mapping-80-to-57/
  • 2019-07 Bug #29508068 UNNECESSARY NEXT-KEY LOCK TAKEN (MySQL 8.0.18 公布) https://github.com/mysql/mysql-server/commit/d1b0afd75ee669f54b70794eb6dab6c121f1f179
  • 2020-02 Bug #98639 Redundant row-level locking for secondary index (8.0.19) https://bugs.mysql.com/bug.php?id=98639
  • 2010-11 Bug #57973 UPDATE tries to lock rows not visible to read view https://bugs.mysql.com/bug.php?id=57973#c403965
  • 2011-12 Bug #63870 Repeatable-read isolation violated in UPDATE (5.1.42, 5.5.20) https://bugs.mysql.com/bug.php?id=63870
  • PostgreSQL Documentation: 13.2. Transaction Isolation https://www.postgresql.org/docs/15/transaction-iso.html
正文完
 0