分布式事务-2PC-3PC

48次阅读

共计 2341 个字符,预计需要花费 6 分钟才能阅读完成。

目前的数据库仅支持单库事务,并不支持跨库事务。而随着微服务架构的普及,一个大型业务系统往往由若干个子系统构成,这些子系统又拥有各自独立的数据库。往往一个业务流程需要由多个子系统共同完成,而且这些操作可能需要在一个事务中完成。在微服务系统中,这些业务场景是普遍存在的。此时,我们就需要在数据库之上通过某种手段,实现支持跨数据库的事务支持,这也就是常说的分布式事务。

两阶段提交协议 2 Phase Commit

该分布式系统中,存在一个节点作为协调者(Coordinator),其他节点作为参与者(Cohorts)。且节点之间可以进行网络通信。

所有节点都采用预写式日志,且日志被写入后即被保持在可靠的存储设备上,即使节点损坏不会导致日志数据的消失。所有节点不会永久性损坏,即使损坏后仍然可以恢复。

第一阶段(投票阶段)

协调者节点向所有参与者节点询问是否可以执行提交操作(vote),并开始等待各参与者节点的响应。

参与者节点执行询问发起为止的所有事务操作,并将 Undo 信息和 Redo 信息写入日志。(注意:若成功这里其实每个参与者已经执行了事务操作)

各参与者节点响应协调者节点发起的询问。如果参与者节点的事务操作实际执行成功,则它返回一个”同意”消息;如果参与者节点的事务操作实际执行失败,则它返回一个”中止”消息。

##### 第二阶段(提交执行阶段)

当协调者节点从所有参与者节点获得的相应消息都为”同意”时

协调者节点向所有参与者节点发出”正式提交 (commit)”的请求。

参与者节点正式完成操作,并释放在整个事务期间内占用的资源。

参与者节点向协调者节点发送”完成”消息。

协调者节点受到所有参与者节点反馈的”完成”消息后,完成事务。

如果任一参与者节点在第一阶段返回的响应消息为”中止”,或协调者节点在第一阶段的询问超时之前无法获取所有参与者节点的响应消息时

协调者节点向所有参与者节点发出”回滚操作 (rollback)”的请求。

参与者节点利用之前写入的 Undo 信息执行回滚,并释放在整个事务期间内占用的资源。

参与者节点向协调者节点发送”回滚完成”消息。

协调者节点受到所有参与者节点反馈的”回滚完成”消息后,取消事务。

不管最后结果如何,第二阶段都会结束当前事务。
二阶段提交看起来确实能够提供原子性的操作,但二阶段提交还是有几个缺点

执行过程中,所有参与节点都是事务阻塞型的。当参与者占有公共资源时,其他第三方节点访问公共资源不得不处于阻塞状态。

参与者发生故障。协调者需要给每个参与者额外指定超时机制,超时后整个事务失败。(没有多少容错机制)

协调者发生故障。参与者会一直阻塞下去。需要额外的备机进行容错。(这个可以依赖后面要讲的 Paxos 协议实现 HA)

二阶段无法解决的问题
协调者发出 commit 消息之后宕机,而唯一接收到这条消息的参与者同时也宕机了。那么即使协调者通过选举协议产生了新的协调者,这条事务的状态也是不确定的,没人知道事务是否被已经提交。

三阶段提交协议 3PC

三阶段提交有两个改动点

引入超时机制。同时在协调者和参与者中都引入超时机制。

在第一阶段和第二阶段中插入一个准备阶段。保证了在最后提交阶段之前各参与节点的状态是一致的。这样就有 CanCommit、PreCommit、DoCommit 三个阶段。

##### CanCommit

3PC 的 CanCommit 阶段其实和 2PC 的准备阶段很像。协调者向参与者发送 commit 请求,参与者如果可以提交就返回 Yes 响应,否则返回 No 响应。

事务询问,协调者向参与者发送 CanCommit 请求。询问是否可以执行事务提交操作。然后开始等待参与者的响应。

响应反馈,参与者接到 CanCommit 请求之后,正常情况下,如果其自身认为可以顺利执行事务,则返回 Yes 响应,并进入预备状态。否则反馈 No

##### PreCommit

协调者根据参与者的反应情况来决定是否可以记性事务的 PreCommit 操作。根据响应情况,有以下两种可能。

假如协调者从所有的参与者获得的反馈都是 Yes 响应,那么就会执行事务的预执行。

发送预提交请求

协调者向参与者发送 PreCommit 请求,并进入 Prepared 阶段。

事务预提交

参与者接收到 PreCommit 请求后,会执行事务操作,并将 undo 和 redo 信息记录到事务日志中。

响应反馈

如果参与者成功的执行了事务操作,则返回 ACK 响应,同时开始等待最终指令。

假如有任何一个参与者向协调者发送了 No 响应,或者等待超时之后,协调者都没有接到参与者的响应,那么就执行事务的中断。

发送中断请求

协调者向所有参与者发送 abort 请求。

中断事务

参与者收到来自协调者的 abort 请求之后(或超时之后,仍未收到协调者的请求),执行事务的中断。

##### DoCommit

该阶段进行真正的事务提交,也可以分为以下两种情况。

执行提交

发送提交请求

协调接收到参与者发送的 ACK 响应,那么他将从预提交状态进入到提交状态。并向所有参与者发送 doCommit 请求。

事务提交

参与者接收到 doCommit 请求之后,执行正式的事务提交。并在完成事务提交之后释放所有事务资源。

响应反馈

事务提交完之后,向协调者发送 ACK 响应。

完成事务

协调者接收到所有参与者的 ACK 响应之后,完成事务。

中断事务

协调者没有接收到参与者发送的 ACK 响应(可能是接受者发送的不是 ACK 响应,也可能响应超时),那么就会执行中断事务。

发送中断请求

协调者向所有参与者发送 abort 请求

事务回滚

参与者接收到 abort 请求之后,利用其在阶段二记录的 undo 信息来执行事务的回滚操作,并在完成回滚之后释放所有的事务资源。

反馈结果

参与者完成事务回滚之后,向协调者发送 ACK 消息

中断事务

协调者接收到参与者反馈的 ACK 消息之后,执行事务的中断。

正文完
 0