分布式服务消息一致性方案

日期：2021-05-28 栏目：程序人生浏览：次

分布式部署服务的情况下，由于网络状况不可预期，消息有可能发送成功，但是消费端消费失败；也有可能消息根本没有发出去，如何保证消息是否发送成功是经常遇到的问题。最近有时间研究了一下，具体方法如下图：

分布式服务消息一致性方案

表结构设计如下：

分布式服务消息一致性方案

具体思路：

正常流程（网络都正常）

1.消息生产方，将消息信息与业务数据在同一个事务中存入数据库。

2.消息发送发，发送消息，消息发送表‘状态’为‘已发送’

3.消息消费方，接收消息，存入消息接收表，并调用生产方接口，更新生产方消息发送表‘状态’为‘已完成’。

正常流程结束。

异常流程

1.消息生产方，将消息信息与业务数据在同一个事务中存入数据库。

2.消息发送发，发送消息，消息发送表‘状态’为‘已发送’

3.消息消费方未收到消息；或，接收到消息，存入消息接收表，但调用生产方接口失败。

4.消息生产方job1，查询消息发送表‘状态’为‘已发送’，并当前时间超过回调截止时间（或过期时间）的记录，然后调用消息消费方查询状态接口

5.消息生产方job1若查到结果，则更新消息发送表‘状态’为‘已完成’，流程结束；若为查到结果，则更新消息发送表‘状态’为‘未发送’

6.消息生产方job2，查询消息发送表‘状态’为‘未发送’的记录，重新生产消息，并更新状态为“已发送”。之后会自动跳转到流程3，直到状态变更为“已完成”。

注意，消息接收表的sourcemsg_id字段需唯一，保证幂等性。

针对这个设计，完成了net core3.1 的demo，用了rabbitmq作为消息队列，mysql作为数据库，ef core orm，redis分布式锁。

demo地址为https://github.com/cysnet/mq-trans.git