1、前提是建立群集,并启用vsphere ha

2、当主机加入HA群集时,为给加入的主机上传安装代理,并配置该代理来与其他主机代理通讯。

3、HA将选择一台(仅一台)主机作为首选主机(一般情况下是挂在最多数据存储的主机)。

       如果首选主机脱离群集(故障停机、关机或待机),则会重新从群集中选择首选主机。

      首选主机的主要工作职能:

      (1)监控从属主机的状况;

      (2)监控所有受保护虚拟机的电源状况(群集中的虚拟机由关闭电源变为打开电源,则该虚拟机会受到首选主机的保护);

      (3)管理群集主机和受保护虚拟机列表(列表保存在群集的存储中,以便新首选主机管理);

      (4)充当群集的vCenter Server管理界面并报告群集的健康状况。

群集内的主机有三种类型的检测故障:

(1)故障。主机停止运行

(2)隔离。主机与网络隔离(主机从管理网络中断开,并且ping不同隔离地址,但数据存储检测信号还存在,即主机还与存储存在通信)

(3)分区。部分主机无法通过管理网络与其他主机通信(多台主机隔离成一个区)

1、首选主机通过每秒交换一次网络检测信号来监控群集内从属主机的活跃度。活跃度检查是要确定从属主机是否与数据存储之一通讯(交换检测信号)。

2、首选主机检查 从属主机是否有响应 发送到其(该从属主机)管理IP地址的ICMP ping信号。

    如果首选主机和从属主机的代理无法通讯(从属主机无法对首选主机的ICMP ping信息进行响应,从属主机的代理也无法发出已出现故障的监测信号),则首选主机会在备用主机上重新启动主机的虚拟机。

    如果检测到从属主机还在与数据存储交换检测信号,则首选主机会假定它处于某个网络分区或隔离网络中,因此会继续监控该主机及其虚拟机。(隔离或分区后首选主机会先(通过数据存储检测信号)关闭(可以有直接关闭虚拟机电源或者是正常关机两种方式)故障主机上的虚拟机,再在其他活动主机上启动该虚拟机)

    对于一台主机而言,其仍在运行,但是无法监测到来自管理网络的代理检测信号(vSphere HA代理流量),则会尝试ping 群集的隔离地址。如果仍然无法ping通,则该主机将声明自己已与网络隔离。

首选主机(通过数据存储检测信号)监控独立主机(仍在运行,但已隔离或分区)上的虚拟机,如果发现虚拟机已关闭,而且该首选主机负责这些虚拟机,则会重启这些虚拟机。