假如没有分布式事务

在一系列微服务系统当中,假如不存在分布式事务,会发生什么呢?让我们以互联网中常用的交易业务为例子:

java xa分布式事务 java 分布式事物_回滚


上图中包含了库存和订单两个独立的微服务,每个微服务维护了自己的数据库。在交易系统的业务逻辑中,一个商品在下单之前需要先调用库存服务,进行扣除库存,再调用订单服务,创建订单记录。

正常情况下,两个数据库各自更新成功,两边数据维持着一致性。

java xa分布式事务 java 分布式事物_分布式事务_02


但是,在非正常情况下,有可能库存的扣减完成了,随后的订单记录却因为某些原因插入失败。这个时候,两边数据就失去了应有的一致性。

java xa分布式事务 java 分布式事物_回滚_03

什么是分布式事务

布式事务用于在分布式系统中保证不同节点之间的数据一致性。分布式事务的实现有很多种,最具有代表性的是由 Oracle Tuxedo 系统提出的 XA 分布式事务协议

XA 协议包含两阶段提交(2PC)和三阶段提交(3PC)两种实现,这里我们重点介绍两阶段提交的具体过程。

在XA协议中包含着两个角色:事务协调者事务参与者。让我们来看一看他们之间的交互流程:

第一阶段:

java xa分布式事务 java 分布式事物_协调者_04

XA 分布式事务的第一阶段,作为事务协调者的节点会首先向所有的参与者节点发送 Prepare 请求;在接到 Prepare 请求之后,每一个参与者节点会各自执行与事务有关的数据更新,写入 Undo LogRedo Log 。如果参与者执行成功,暂时不提交事务,而是向事务协调节点返回 “完成” 消息。

当事务协调者接到了所有参与者的返回消息,整个分布式事务将会进入第二阶段。

第二阶段:

java xa分布式事务 java 分布式事物_协调者_05


XA 分布式事务的第二阶段,如果事务协调节点在之前所收到都是正向返回,那么它将会向所有事务参与者发出 Commit 请求。

接到 Commit 请求之后,事务参与者节点会各自进行本地的事务提交,并释放锁资源。当本地事务完成提交后,将会向事务协调者返回 “完成” 消息。

当事务协调者接收到所有事务参与者的 “完成” 反馈,整个分布式事务完成。

以上所描述的是XA两阶段提交的正向流程,接下来我们看一看失败情况的处理流程:

第一阶段:

java xa分布式事务 java 分布式事物_java xa分布式事务_06

第二阶段:

java xa分布式事务 java 分布式事物_分布式事务_07


XA 的第一阶段,如果某个事务参与者反馈失败消息,说明该节点的本地事务执行不成功,必须回滚。

于是在第二阶段,事务协调节点向所有的事务参与者发送 Abort 请求。接收到 Abort 请求之后,各个事务参与者节点需要在本地进行事务的回滚操作,回滚操作依照 Undo Log 来进行。

XA 两阶段提交的不足

1、性能问题
XA 协议遵循强一致性。在事务执行过程中,各个节点占用着数据库资源,只有当所有节点准备完毕,事务协调者才会通知提交,参与者提交后释放资源。这样的过程有着非常明显的性能问题。
2、协调者单点故障问题
事务协调者是整个 XA 模型的核心,一旦事务协调者节点挂掉,参与者收不到提交或是回滚通知,参与者会一直处于中间状态无法完成事务。
3、丢失消息导致的不一致问题。
XA 协议的第二个阶段,如果发生局部网络问题,一部分事务参与者收到了提交消息,另一部分事务参与者没收到提交消息,那么就导致了节点之间数据的不一致。

如何避免 XA 两阶段提交的种种问题呢?有许多其他的分布式事务方案可供选择:

1、XA 三阶段提交
XA 三阶段提交在两阶段提交的基础上增加了 CanCommit 阶段,并且引入了超时机制。一旦事物参与者迟迟没有接到协调者的 commit 请求,会自动进行本地 commit。这样有效解决了协调者单点故障的问题。但是性能问题和不一致的问题仍然没有根本解决。
2、MQ 事务
利用消息中间件来异步完成事务的后一半更新,实现系统的最终一致性。这个方式避免了像 XA 协议那样的性能问题。
3、TCC 事务
TCC 事务是 TryCommitCancel 三种指令的缩写,其逻辑模式类似于 XA 两阶段提交,但是实现方式是在代码层面来人为实现。