什么是分布式事务?银行跨行转账业务是一个典型分布式事务场景,假如A须要跨行转账给B,那么就波及两个银行的数据,无奈通过一个数据库的本地事务保障转账的ACID,只可能通过分布式事务来解决。

分布式事务就是指事务的发起者、资源及资源管理器和事务协调者别离位于分布式系统的不同节点之上。在上述转账的业务中,用户A-100操作和用户B+100操作不是位于同一个节点上。实质上来说,分布式事务就是为了保障在分布式场景下,数据操作的正确执行。

什么是TCC分布式事务,TCC是Try、Confirm、Cancel三个词语的缩写,最早是由 Pat Helland 于 2007 年发表的一篇名为《Life beyond Distributed Transactions:an Apostate’s Opinion》的论文提出。

TCC组成

TCC分为3个阶段

  • Try 阶段:尝试执行,实现所有业务查看(一致性), 预留必须业务资源(准隔离性)
  • Confirm 阶段:如果所有分支的Try都胜利了,则走到Confirm阶段。Confirm真正执行业务,不作任何业务查看,只应用 Try 阶段预留的业务资源
  • Cancel 阶段:如果所有分支的Try有一个失败了,则走到Cancel阶段。Cancel开释 Try 阶段预留的业务资源。

TCC分布式事务里,有3个角色,与经典的XA分布式事务一样:

  • AP/应用程序,发动全局事务,定义全局事务蕴含哪些事务分支
  • RM/资源管理器,负责分支事务各项资源的治理
  • TM/事务管理器,负责协调全局事务的正确执行,包含Confirm,Cancel的执行,并解决网络异样

如果咱们要进行一个相似于银行跨行转账的业务,转出(TransOut)和转入(TransIn)别离在不同的微服务里,一个胜利实现的TCC事务典型的时序图如下:

TCC实际

上面咱们进行一个TCC事务的具体开发

目前可用于TCC的开源框架,次要为Java语言,其中以seata为代表。咱们的例子采纳python,应用的分布式事务框架为dtm,它对分布式事务的反对十分优雅。上面来具体解说TCC的组成

上面咱们来编写具体的Try/Confirm/Cancel的处理函数

@app.post("/api/TransOutTry")def trans_out_try():    return {"dtm_result": "SUCCESS"}@app.post("/api/TransOutConfirm")def trans_out_confirm():    return {"dtm_result": "SUCCESS"}@app.post("/api/TransOutCancel")def trans_out_cancel():    return {"dtm_result": "SUCCESS"}@app.post("/api/TransInTry")def trans_in_try():    return {"dtm_result": "SUCCESS"}@app.post("/api/TransInConfirm")def trans_in_confirm():    return {"dtm_result": "SUCCESS"}@app.post("/api/TransInCancel")def trans_in_cancel():    return {"dtm_result": "SUCCESS"}

到此各个子事务的处理函数曾经OK了,而后是开启TCC事务,进行分支调用

# 这是dtm服务地址dtm = "http://localhost:8080/api/dtmsvr"# 这是业务微服务地址svc = "http://localhost:5000/api"@app.get("/api/fireTcc")def fire_tcc():    # 发动tcc事务,其中tcc_trans进行具体的业务解决    gid = tcc.tcc_global_transaction(dtm, tcc_trans)    return {"gid": gid}# tcc事务的具体解决def tcc_trans(t):    req = {"amount": 30} # 业务申请的负荷    # 调用转出服务的Try|Confirm|Cancel    t.call_branch(req, svc + "/TransOutTry", svc + "/TransOutConfirm", svc + "/TransOutCancel")    # 调用转入服务的Try|Confirm|Cancel    t.call_branch(req, svc + "/TransInTry", svc + "/TransInConfirm", svc + "/TransInCancel")

至此,一个残缺的TCC分布式事务编写实现。

如果您想要残缺运行一个胜利的示例,那么参考这个例子yedf/dtmcli-py-sample,将它运行起来非常简单

# 部署启动dtm# 须要docker版本18以上git clone https://github.com/yedf/dtmcd dtmdocker-compose up# 另起一个命令行git clone https://github.com/yedf/dtmcli-py-samplecd dtmcli-py-samplepip3 install flask dtmcli requestsflask run# 另起一个命令行curl localhost:5000/api/fireTcc

TCC的回滚

如果银行将金额筹备转入用户2时,发现用户2的账户异样,返回失败,会怎么样?

咱们将后面的TransIn处理函数,改成返回失败,整个事务最初就会失败回滚

@app.post("/api/TransInTry")def trans_in_try():    return {"dtm_result": "FAILURE"}

咱们给出事务失败交互的时序图


这个跟胜利的TCC差异就在于,当某个子事务返回失败后,后续就回滚全局事务,调用各个子事务的Cancel操作,保障全局事务全副回滚。

TCC网络异样

TCC在整个全局事务的过程中,可能产生各类网络异常情况,典型的是空回滚、幂等、悬挂,因为TCC的异常情况,和SAGA、可靠消息等事务模式有相近的中央,因而咱们把所有异样的解决方案通通放在这篇文章《子事务屏障,一个函数调用搞定分布式事务乱序》进行解说

小结

在这篇文章里,咱们介绍了TCC的理论知识,也通过一个例子,残缺给出了编写一个TCC事务的过程,涵盖了失常胜利实现,以及胜利回滚的状况。置信读者通过这边文章,对TCC曾经有了深刻的了解。

浏览完此篇干货,欢送大家拜访yedf/dtm我的项目,给颗星星反对!

dtm反对多种语言,包含GO、python、php、node,您能够点击各语言客户端及示例拜访