故障自动切换信息系统架构故障转移机制

转载

云端小仙童 2024-06-21 13:15:50

文章标签 故障自动切换信息系统架构数据库重启自启动 文章分类 架构后端开发

数据库集群故障转移的目的是在主机节点意外宕机后，自动提升一个备机节点作为主机，以达到继续对外提供服务的目的。

故障自动切换信息系统架构故障转移机制_自启动

1、主机节点故障

常见的主机故障场景包括：

电源失效（掉电）
意外关机
系统意外重启
系统崩溃（kernel panic）
网络中断
服务进程故障

tips:

为了避免集群服务异常，主机需要考虑如何处理自身的故障，在遇到掉电、关机、重启、系统崩溃故障时，故障恢复后，一般不会自启动数据库服务，避免此时因备机升主导致集群出现脑裂；

主机节点遇到网络中断时，需要考虑网络中断时间，备机节点在指定时间内检测不到主机心跳，便会提升自己，作为新主机继续提供服务，若此时原主机网络恢复，则会出现双主（脑裂），因此，主机节点需要在备机节点升主前主动停掉数据库服务，在实现上，可通过配置信任网关，在信任网关检测超时后自动停止数据库服务，超时时间小于备机心跳超时时间实现；

2、备机节点升主

备机节点升主一般会经过如下步骤