什么是 TCC,TCC 是 Try、Confirm、Cancel 三个词语的缩写,最早是由 Pat Helland 于 2007 年发表的一篇名为《Life beyond Distributed Transactions:an Apostate’s Opinion》的论文提出。
TCC 组成
TCC 分为 3 个阶段
- Try 阶段:尝试执行,实现所有业务查看(一致性), 预留必须业务资源(准隔离性)
- Confirm 阶段:如果所有分支的 Try 都胜利了,则走到 Confirm 阶段。Confirm 真正执行业务,不作任何业务查看,只应用 Try 阶段预留的业务资源
- Cancel 阶段:如果所有分支的 Try 有一个失败了,则走到 Cancel 阶段。Cancel 开释 Try 阶段预留的业务资源。
TCC 分布式事务里,有 3 个角色,与经典的 XA 分布式事务一样:
- AP/ 应用程序,发动全局事务,定义全局事务蕴含哪些事务分支
- RM/ 资源管理器,负责分支事务各项资源的治理
- TM/ 事务管理器,负责协调全局事务的正确执行,包含 Confirm,Cancel 的执行,并解决网络异样
如果咱们要进行一个相似于银行跨行转账的业务,转出(TransOut)和转入(TransIn)别离在不同的微服务里,一个胜利实现的 TCC 事务典型的时序图如下:
TCC 网络异样
TCC 在整个全局事务的过程中,可能产生各类网络异常情况,典型的是空回滚、幂等、悬挂,因为 TCC 的异常情况,和 SAGA、可靠消息等事务模式有相近的中央,因而咱们把所有异样的解决方案通通放在这篇文章《还被分布式事务的网络异样困扰吗?一个函数调用帮你搞定它》进行解说
TCC 实际
对于后面的跨行转账操作,最简略的做法是,在 Try 阶段调整余额,在 Cancel 阶段反向调整余额,Confirm 阶段则空操作。这么做带来的问题是,如果 A 扣款胜利,金额转入 B 失败,最初回滚,把 A 的余额调整为初始值。在这个过程中如果 A 发现自己的余额被扣减了,然而收款方 B 迟迟没有收到余额,那么会对 A 造成困扰。
更好的做法是,Try 阶段解冻 A 转账的金额,Confirm 进行理论的扣款,Cancel 进行资金冻结,这样用户在任何一个阶段,看到的数据都是清晰明了的。
上面咱们进行一个 TCC 事务的具体开发
目前可用于 TCC 的开源框架,次要为 Java 语言,其中以 seata 为代表。咱们的例子采纳 go 语言,应用的分布式事务框架为 dtm,它对分布式事务的反对十分优雅。上面来具体解说 TCC 的组成
咱们首先创立两张表,一张是用户余额表,一张是冻结资金表,建表语句如下:
CREATE TABLE dtm_busi.`user_account` (`id` int(11) AUTO_INCREMENT PRIMARY KEY,
`user_id` int(11) not NULL UNIQUE ,
`balance` decimal(10,2) NOT NULL DEFAULT '0.00',
`create_time` datetime DEFAULT now(),
`update_time` datetime DEFAULT now());
CREATE TABLE dtm_busi.`user_account_trading` (`id` int(11) AUTO_INCREMENT PRIMARY KEY,
`user_id` int(11) not NULL UNIQUE ,
`trading_balance` decimal(10,2) NOT NULL DEFAULT '0.00',
`create_time` datetime DEFAULT now(),
`update_time` datetime DEFAULT now());
trading 表中,trading_balance 记录正在交易的金额。
咱们先编写外围代码,解冻 / 冻结资金操作,会查看束缚 balance+trading_balance >= 0,如果束缚不成立,执行失败
func adjustTrading(uid int, amount int) (interface{}, error) {
幂等、悬挂解决
dbr := sdb.Exec("update dtm_busi.user_account_trading t join dtm_busi.user_account a on t.user_id=a.user_id and t.user_id=? set t.trading_balance=t.trading_balance + ? where a.balance + t.trading_balance + ? >= 0", uid, amount, amount)
if dbr.Error == nil && dbr.RowsAffected == 0 { // 如果余额有余,返回谬误
return nil, fmt.Errorf("update error, balance not enough")
}
其余状况查看及解决
}
而后是调整余额
func adjustBalance(uid int, amount int) (ret interface{}, rerr error) {
幂等、悬挂解决
这里略去进行相干的事务处理,包含开启事务,以及在 defer 中解决提交或回滚
// 将原先解冻的资金记录冻结
dbr := db.Exec("update dtm_busi.user_account_trading t join dtm_busi.user_account a on t.user_id=a.user_id and t.user_id=? set t.trading_balance=t.trading_balance + ?", uid, -amount)
if dbr.Error == nil && dbr.RowsAffected == 1 { // 冻结胜利
// 调整金额
dbr = db.Exec("update dtm_busi.user_account set balance=balance+? where user_id=?", amount, uid)
}
其余状况查看及解决
}
上面咱们来编写具体的 Try/Confirm/Cancel 的处理函数
RegisterPost(app, "/api/TransInTry", func (c *gin.Context) (interface{}, error) {return adjustTrading(1, reqFrom(c).Amount)
})
RegisterPost(app, "/api/TransInConfirm", func TransInConfirm(c *gin.Context) (interface{}, error) {return adjustBalance(1, reqFrom(c).Amount)
})
RegisterPost(app, "/api/TransInCancel", func TransInCancel(c *gin.Context) (interface{}, error) {return adjustTrading(1, -reqFrom(c).Amount)
})
RegisterPost(app, "/api/TransOutTry", func TransOutTry(c *gin.Context) (interface{}, error) {return adjustTrading(2, -reqFrom(c).Amount)
})
RegisterPost(app, "/api/TransOutConfirm", func TransInConfirm(c *gin.Context) (interface{}, error) {return adjustBalance(2, -reqFrom(c).Amount)
})
RegisterPost(app, "/api/TransOutCancel", func TransInCancel(c *gin.Context) (interface{}, error) {return adjustTrading(2, reqFrom(c).Amount)
})
到此各个子事务的处理函数曾经 OK 了,而后是开启 TCC 事务,进行分支调用
// TccGlobalTransaction 会开启一个全局事务
_, err := dtmcli.TccGlobalTransaction(DtmServer, func(tcc *dtmcli.Tcc) (rerr error) {
// CallBranch 会将事务分支的 Confirm/Cancel 注册到全局事务上,而后间接调用 Try
res1, rerr := tcc.CallBranch(&TransReq{Amount: 30}, host+"/api/TransOutTry", host+"/api/TransOutConfirm", host+"/api/TransOutRevert"
进行谬误查看,以及其余逻辑
res2, rerr := tcc.CallBranch(&TransReq{Amount: 30}, host+"/api/TransInTry", host+"/api/TransInConfirm", host+"/api/TransInRevert")
进行谬误查看,有任何谬误,返回谬误,回滚交易
// 如果没有谬误,函数失常返回后,全局事务会提交,TM 会调用各个事务分支的 Confirm,实现整个事务
})
至此,一个残缺的 TCC 分布式事务编写实现。
如果您想要残缺运行一个胜利的示例,那么依照 dtm 我的项目的阐明搭建好环境之后,运行上面命令运行 tcc 的例子即可
go run app/main.go tcc_barrier
TCC 的回滚
如果银行将金额筹备转入用户 2 时,发现用户 2 的账户异样,返回失败,会怎么样?咱们给出事务失败交互的时序图
这个跟胜利的 TCC 差异就在于,当某个子事务返回失败后,后续就回滚全局事务,调用各个子事务的 Cancel 操作,保障全局事务全副回滚。
小结
在这篇文章里,咱们介绍了 TCC 的理论知识,也通过一个例子,残缺给出了编写一个 TCC 事务的过程,涵盖了失常胜利实现,以及胜利回滚的状况。置信读者通过这边文章,对 TCC 曾经有了深刻的了解。
浏览完此篇干货,欢送大家拜访 dtm 我的项目,给颗星星反对!