bed51828d613c52d8bf3f85c7a9e0255.png

图片拍摄于2021年12月04日 山东青岛 我爱这座城市


开篇

上一篇那些用Go实现的分布式事务框架我们主要介绍的是seata-golang。一个对标seata的go语言实现,当然版本还是落后Java版很多的。

这次我们来介绍一下另一个go实现的分布式事务:dtm。

首先来看下dtm整体架构图(来源官网)。

cc8f15925ec6b5f5c87f488a83b73832.png

再来看之前的seata架构图。

4528aa749b9e300e7edf3fa3603500f4.png

从架构上来看,大差不差。

seata中的TC对标dam的TM。

RM两边意思一致。

seata中的TM对标dtm事务SDK。作用都是一样:第一阶段开启一个全局事务,执行各RM分支事务,第二阶段根据RM第一阶段执行结果,决定调用TC(seata)|TM(dtm) commit或者rollback。

架构上,个人感觉只是因为模块名称以及图画不一样的差别,当然在实现细节上还是有很大差别的。

我们先简单介绍下DTM各个模块。


TM

TM 层在代码中是没有具体的主体结构的,开始都是函数之前的调用。

启动TM实际上开启了两个服务,http以及grpc这两个服务。

7a63feb71d5d202e988fa91a94136a87.png

http路由,

a446a232dbe81922d166a3aa2ec362c5.png

gRPC接口,

9d3e8be98ab193db006debc583c37a74.png

即然提供了两个服务入口,那理所当然有公共处理核心业务的部分。

a26992a7c52506fe64646ac4892f71d4.png

TM对数据的存储管理并不是依赖于接口,而是依赖于common.DB 结构。根据配置文件中DB.driver 的值决定底层数据库是mysql还是postgres两种。

2351de47e308c8b716464e277b3ed8f7.png

再看这个DB结构,所以本质上无论底层是哪种数据库,都是直接依赖gorm来对数据进行操作的。

62ea4190694a1b94b0e318c70c42ab49.png

接着,看下TM是如何通知各个RM进行commit或者rollback的?

举一个TCC模式的例子。

TCC的两个阶段。

  • 阶段一: try。尝试执行,调用各RM自定义的try行为,预留必要的业务资源。

  • 阶段二:Confirm(阶段一所有参与本次事务的try行为都成功)。调用各分支事务的Confirm方法,真正执行业务,并且只使用try阶段预留的资源。

  • 阶段二:Cancel(阶段一任一参与本次事务的try行为失败)。调用各分支事务的Cancel方法,释放一阶段try所预留的资源。

从上面我们可以得知,TCC模式下,TM在第二阶段要么通知各分支事务Confirm要么Cancel。

在注册各RM事务分支到TM的时候,最终TM会为每一个分布式事务的参与者(RM)生成两条分支信息。

就像这样,

f108bb4453c33bf441bbd0d6f6a0b412.png

对,就是把对应的RM资源操作地址直接存入。

当TM接收到commit或者rollback命令,在处理完自身逻辑(一般就是修改Gloable状态),就需要开始处理每一个注册进来的分支事务了,说白了就是需要调用各个分支事务对应操作的接口。

69772d92f291bd29127e8c8ca40320f2.png

这里的t.getProcessor() 是需要根据当前事务的类型(TCC、SAGA、XA)获取到对应的处理器来进行逻辑的处理。

29d20ebf0a1f3f3d6c9efcd1ee4536d5.png

当然,每个事务处理器只需要实现接口,

ca0ca97e9a4dba4367f60b403bed810b.png

真正调用RM资源服务地址的时候,分为http和grpc,这是由开发者决定的。

a8f541c562a6dab1aeb04b740a52ad32.png

在v1.6之前的版本,grpc的请求是很简单粗暴解析地址方法然后连接的。

a53e425da55ff8ef924f8149bd1cd571.png

现在为了支持那些采用gRPC Resolver 机制之上的一些微服务框架接入,做了一块抽象。感兴趣[1]可以看下,这里就不介绍了。

SDK

至于SDK,每一个事务模式都是独立的,本质上是没有关联的。比如下面我们启动一个TCC分布式事务。这个分布式事务是由两个服务组成,简称+30和-30的服务。

98518d3f94c4ab1e7c040cbb782dc252.png

从上面的调用中我们还是能还原出整体流程。

  • 调用TM,得到一个分布式id

  • 调用TccGlobalTransaction函数开启分布式事务。

  • 调用TM prepare(这步只是为了查看第一步产生的那个分布式事务状态是否处于prepare。这里没看明白,此时还未注册执行分支,全局状态不是应该只会存在初始化状态吗)

  • 上一步没问题,执行传入的闭包函数,即CallBranch 函数里向TM注册参与事务的TM分支。注册完成后,开始第一阶段调用各分支的try服务。

  • 各分支try服务调用结束,根据第一阶段结果决定通知TM是submit还是abort。

另外提一点,分布式事务常见的一些问题:比如空补偿、重挂等问题。

一般情况下,业务需要自行去处理这种场景,以免造成不可描述的错误。

dtm里面提供了对应子事务屏障方案。核心就在,

4131c3eeac6ea7e837c75abc1b1eb600.png

其实就是利用数据库的唯一索引机制,当然每个RM资源你都得新增一张表。

上面提到,dtm的TM角色本质上就是对应 seata 中的 TC,但是他们的处理模式是不同的。

dtm中的TM会根据注册时的各分支保存的地址,决定通过http还是rpc调用各RM操作,是由TM直接发起对RM的请求。

seata-go的实现中,TC是不参与直接调用RM的。

还记得上篇提到一个双向流RPC接口(BranchCommunicate)。TC通过这个接口把对应分支处理信息传递给RM管理器。

e53b519f7ace4a1cdb938ec802a65538.png

然后由RM管理器根据事务类型选择对应的事务管理器进行处理,最终调用的是对应事务类型管理器的BranchCommit方法。

39ebac888a3dd5011dbc2807743c421b.png

下面是一个TCC事务类型管理器的处理。

d3ef5f8a51a700267d5798e46ca9d9b2.png

对应的事务RM管理器是如何通知、处理各个RM资源的。

原理就是我上篇提到的作者实现的一个全局事务代理模式,本质上是利用go的反射实现的,感兴趣的可以自己去扒下源码,也可以看看作者对实现全局事务代理的介绍[2]。

总结

这篇文章主要介绍了dtm实现的一些细节,从这两篇文章大体能看出实现上的部分区别,更多的细节还得靠自己去挖掘。

最后再问几个问题,

  • 日常开发中你们哪些场景是用到了分布式事务?用的是哪个框架还是自研的?

  • 或者说在分布式环境下,一致性的问题你们是如何解决的?

相关

  • https://zhuanlan.zhihu.com/p/351391359

  • https://dtm.pub/protocol/support.html

- END -

扫码关注公众号「网管叨bi叨」

给网管个星标,第一时间吸我的知识 👆

网管为大家整理了一本超实用的《Go 开发参考书》收集了70多条开发实践。去公众号回复【gocookbook】即刻领取!

觉得有用就点个在看  👇👇👇