SQLServer集群故障DISCONNECTED
- 1. 问题描述
- 2. 解决方案
- 3. 类似问题解决思路
- 4. 参考资料
一次SQLSserver+AlwaysOn+WSFC辅助备份节点问题排查解决过程,希望对读者有所帮助,文中不免疏漏之处,望读者不吝指教,感激之至!
1. 问题描述
(1)问题出现
已搭建的SQLServer+AlwaysOn+wsfc集群,正常情况下可正常运行,在一次内部服务断电重启服务后,集群主节点可正常使用,其中一个辅助节点显示异常,数据库无法同步;从高可用组移除后重新加入,一直无法正常加入,数据库数据也无法进行同步;
(2)集群提示异常信息
Availability Groups下 BAT-test 右键进入Show Dashboard提示:
The connected state is DISCONNECTED
提示详情
This secondary replica is not connected to the primary replica
辅助副本节点无法连接到主节点
2. 解决方案
(1)异常提示
异常提示信息比较明确:连接状态是断连状态,
详情提示也比较明确:辅助备份节点无法连接到主节点;
(2)分析
提示比较明确,大致问题也能定位: 辅助节点无法连接到主节点
可思考:
1)辅助节点与主节点SQLServer服务是否运行正常
2)辅助节点与主节点之间网络是否互通
3)相关的端口号1433、5022等(实际端口使用可查看集群节点属性详情)是否被防火墙拦截
3
(3)问题逐个排查解决
定位问题:辅助节点处于网络异常状态,与域控之间的网络连接存在问题;排查辅助节点网络属性设置,注意到DNS server Address设置有误;
(4)问题解决
参考主节点的DNS Server Address设置,调整辅助节点DNS server address;
刷新SQLServer高可用组连接,辅组节点已回复正常,
查看辅助节点数据库同步情况,也已经处于 已同步状态;
Sqlserver集群连接可正常使用;
问题解决。
3. 类似问题解决思路
SqlServer+AlwaysOn+WSFC集群高可用:
(1)使用工具Microsoft SQL Server Management Studio连接到集群节点;
(2)查看Always On High Availability模块下的 Availability Replicas各个节点是否正常,各节点是否正常处于Primary或者Secondary状态;
(3)查看Databases下各个数据库是否处于Synchronized状态;
(4)出现问题,进入Availability Groups下具体高可用性组的Dashboard界面,查看具体问题;
(5)问题比较明确,可直接排查相关问题;不明确可在线查看官网或搜索相关解决方案。
4. 参考资料