SQLServer 2014 主数据中心HA+灾备机房DR解决方案
SQLServer 2008 的时候使用 local WSFC+DR Mirror方式,对象是单数据库
两个单独的 WSFC 上使用两个 FCI
每个WSFC有两个以上的节点
数据库镜像允许单独 WSFC 上的多个 FCI 使用相同的实例名称
SQLServer 2012/2014 的时候使用 local WSFC+DR AG方式,对象是可用性组(一般为整个实例)
单个 WSFC 上使用两个 FCI
单个 WSFC 含有四个以上节点,每个FCI(failover cluster instance)有两个以上的节点
在同一个 WSFC 内,两个 FCI 必须使用不同的实例名称,例如,使用“INST_A”作为主 FCI 的实例名称,使用“INST_B”作为 DR FCI 的实例名称
核心业务dr使用集群
非核心业务dr使用单实例
(*)由于跨机房的WSFC,共享存储的注意事项
每个 FCI 都有自己的共享存储(其他数据中心内的节点无法访问),称作非对称存储
两个 FCI 中的数据库文件和事务日志文件也应该使用完全相同的文件路径,磁盘应使用完全相同的驱动器号(避免搭建ag,还原辅助副本的时候使用restore with move/创建文件组或者日志操作的失败)
每个FCI中,SQL Server 实例的 FCI 故障转移是自动执行的;AG的故障转移模式必须是手动,AG同步模式建议异步提交
(*)由于跨机房的WSFC,仲裁投票、仲裁模型 的注意事项
默认情况下,故障转移群集中的每个节点都具有投票( 节点的 NodeWeight 属性),引入一个修补程序 (http://support.microsoft.com/kb/2494036(用于将 1 个投票分配给 WSFC 中的特定节点,将 0 个投票分配给其他一些节点),拓扑中的每个节点上都必须安装此修补程序
投票方案:
- 主数据中心的每个节点有 1 个投票
- DR数据中心的每个节点有 0 个投票
作为最佳做法,WSFC 的投票总数应为奇数。如果投票节点数目为偶数(上图示例拓扑),应在各自FCI中备机节点(避免使用文件仲裁,管理成本高)
(*)发生dr切换时
如果主数据中心发生停机,正常切换到DR数据中心时,需要对DR重新设置仲裁配置。必须向DR数据中心的每个节点都分配一个投票,而将主数据中心每个节点上的投票都设置为“0”
当主数据中心恢复活动后,还要再次对投票进行调整
--查看仲裁设置
SELECT cluster_name, quorum_type_desc, quorum_state_desc
FROM sys.dm_hadr_cluster;
--查看是否有投票权
SELECT member_name, number_of_quorum_votes
FROM sys.dm_hadr_cluster_members
order by number_of_quorum_votes desc
--完全设置
PowerShell
查看所有节点的当前投票设置
Get-ClusterNode | fl NodeName, NodeWeight
将某一节点的投票设置为“0”
(Get-ClusterNode "DRNode1").NodeWeight=0
--注意:
windows故障转移集群+ag环境时,不能再将ag的自动故障转移打开,但可以打开同步模式
由于只能使用windows故障转移,所以避免主机房节点失败,没有正常切换到主机房的备机,需要拉掉dr机房的投票权(避免故障转移到dr,实际上搭ag之前需要拉掉overlap的节点,不允许集群不同实例间出现节点交叉)
The FCI already has automatic failover configured between the nodes.
The current implementation of AG doe not allow a failover outside of the FCI nodes.