第一部分 vSphere高可用性
第一章 介绍vSphere高可用性
当提供服务时,可用性是传统数据中心需要考虑的重要的方面之一,当在VMware vSphere共享平台上提供服务时,为了面对停机时间的成倍增长,VMware设计了一个VMware vSphere HA(高可用性)的功能,VMware vSphere HA(高可用性)以下简称HA,它提供了一个简单且性价比高的解决方案,从而提高虚拟机上应用的高可用性且无关虚拟机的操作系统。vCenter Server的简单几步即可完成HA配置,同时提供统一的和简便的接口,在ESXi或者ESX服务器建立群集时,你可以开启HA功能,我们将在这本书中用ESXi服务器作为参照,也就是说以ESXi服务器为标准.功能的启用可以保护你们的虚拟机,当群集中一台主机出现故障,受影响的虚拟机会自动在同一个群集中其它的ESXi主机上重新启动。
图1:HA的活动流程
另外,当虚拟机的操作系统发生故障时,HA能够重新启动虚拟机上的操作系统,这个功能被称之为虚拟机监测,但有时候也称之为VM的HA,这听起来相当的复杂但也可以通过鼠标点击实现。
图2:点击HA的监测级别
不像其它的群集解决方案,HA是一个相当简单的解决方案,只需要依次点击5次鼠标,另外,HA被广泛应用在所有的环境中,但是,HA和微软的MSCS(群集服务)不一样,它不是一个1:1的备份解决方案,MSCS和HA的主要不同点是,MSCS是设计成保护群集应用的状态,而HA被设计成保护虚拟机,无论虚拟机上是什么类型的应用,但也可以通过虚拟机和应用程序的监控扩展到应用层。
在有HA的情况下,故障转移发生的停机时间就是虚拟机在群集中另一节点上虚拟机重新启动的时间,而MSCS故障转移发生的停机时间为服务切换到群集中另一节点的时间,与很多人认为的观点形成对比的是,MSCS不保证在群集故障转移时是零停机时间,另外,为了更有效的利用这一机制,你们的应用需要开启群集状态监测。
可能有这样一个问题,当虚拟机重新启动,应用服务临时真空的情况下,为什么要用到HA,这个问题很简单,不是所有的虚拟机或者应用服务需要99.999%时间开机提供服务,HA能够满足足够多服务的需求,另外,许多应用不支持MSCS群集故障转移功能,这意味着如果群集中的应用没有被MSCS检测到时,不能保证应用的高可用性和数据一致性。
另外,MSCS群集配置比较复杂,需要专业的技术和背景,打个比方,补丁管理服务器和更新服务器在一个MSCS环境中,如果配置不正确会导致更多的故障停机时间及更复杂的程序配置方式。但HA可以减少复杂度,开销时间,资源消耗和停机时间,这些可以体现HA的重要性,相反的是MSCS,不需要任何改变的guest,HA仍可以在虚拟化层提供服务,而且,虚拟机监测除了安装VMware Tools不需要其它的附加软件或者系统模块,无论如何,安装VMware Tools是一个非常好的方法。如果需要更高基本的高可用性,VMware还可以通过应用程序监控提供,和赛门铁克一样被利用来弹性定义应用级别,还可以在内部团队进行开发时,增加应用的弹性。
HA已经一次又一次的证明自己,它已经广泛的应用于各个领域,如果你到今天为止还没有使用它,看完这部书希望你能相信。
vSphere 5.1
当我们深入HA的主体架构中,并描述怎样配置使用HA时,我们首先简单的介绍下vSphere 5.0和5.1的变化,描述启用HA的基本要求和步骤,聚焦这边书,可以增强虚拟架构中的稳定性,我们还认识到,你们有可能还不熟悉vSphere 5.0,我们同样会强调vSphere5.0的变化,我们在适当的情况下,仍然会讨论功能和概念,包括自从vCenter2.0之后出现组件,以确保您在各个方面更全面的理解HA。
5.X的变化
在vSphere 5.0之前,HA的功能没有得到大的增强,也许你在vSphere5.0和vSphere5.1之间看不到变化,但他们有些地方还是很突出。
在vSphere 5.0的HA完全从底层被重新设计和开发,这也是HA从之前故障转移需要分钟为单位代替为秒为单位的原因
vSphere 5.0中重新设计的HA,许多非常受欢迎的改变可以拿来介绍HA的扩展性,一些HA的关键组件完全被更改,同时添加了新的功能,为了便利,我们把改变列了下面的清单,那样我们可以更详细的讨论这个章节,vSphere 5.0的所有改变如下表所示:
新的HA的代理——FDM是新的HA代理,HA已经从最底层重新设计,也就是说FDM替换了AAM代理
不依赖DNS——为了避免依赖DNS,HA只需要写入IP即可。
主节点的概念——主/备节点的数量限制被取消(vSphere4.1版本以前最多支持5个主节点)
支持管理网络分区——当存在多个网络分区时,允许有多个主节点
增强隔离验证——当管理网络出现故障时,避免误报
数据存储心跳检测——在通过存储层验证主机状态时,这种额外的信号检测可以减少误报的机会,
增强管理控制规则
1台主机故障允许4台主机接管(最大支持31台)
以百分比为控制粒度,可以允许你单独规定CPU或者内存的使用率
以单个故障主机为控制粒度,允许多台主机发生故障
vSphere5.1则增加了一些功能,虽然与vSphere5.0相比,这些似乎是次要的,他们是非常重要的了解,以便创建一个高度灵活的环境。
通过vSphere Web Client设置主机故障接纳值
能够检索跨越多个插槽的虚拟机的列表
增强了设备永久丢失的处理情况(vSphere 5.0.1有介绍)
支持虚拟机系统的休眠模式
Guest SDK中包括应用监测SDK
vSphere HA(FDM) VIB自动被添加到自动部署步骤中
通过”das.config.fdm.iso-lationPolicyDelaySec”设置延迟响应
HA工作需要哪些条件
每个产品功能都需要相关的前提条件支持,HA也不例外,了解HA的前提条件也是学习的基础部分,我们必须抛开之前我们提到的复杂的概念,来迎接全新的HA,我还要像您展示怎样配置HA。
先决条件
在配置HA前,强烈要求在环境中验证它的先决条件,为增加弹性,我们还建议在基础环境中也验证先决条件。
需求:
最少2台ESXi主机
安装ESXi的主机至少3GB内存
VMware vCenter Server
虚拟机能访问的共享存储
可靠的网关或者其它IP地址
建议:
管理网络冗余(不是必须的,但强烈建议)
多路径共享存储
防火墙需求
在下表中是HA需要用于通信的端口,如果主机的内网环境运行着防火墙设备,为保证HA功能正常这些端口必须打开,在ESX或者ESXi防火墙上也同样需要打开以下端口,需要注意的地方是vSphere5.0之前需要多个端口来进行HA通信,而vSphere只需要用到一个端口。
表一:高可用端口设置
配置vSphere的高可用性
HA只需要点击几次即可完成配置,接下来的步骤将会展示怎样建立群集和开启HA,包括虚拟机监控,使用vSphere Web Client,这些设置和设计在接下来的章节内容中详细描述。
1. 登录连接vCenter Server
2. 数据中心右键建立新的群集
3. 给新的群集命名,建议名称中至少包含位置信息,然后按序号排列,如ie.ams-hadrs-001
4. 选择开启HA
5. 启用主机监控和策略
6. 在接入控制策略下选择作为故障切换空间容量保留的群集资源的百分比
7. 开启”虚拟机和应用程序监控“
8. 点击“OK”完成配置
图3:群集即将完成配置信息
当HA群集建立完成,右键点击ESXi主机可以迁移它到群集中,如果加入了vCenter,在群集上右键添加ESXi主机即可
当一台ESXi主机首次添加到新建的群集中,HA的代理会被加载和配置,一旦代理配置完成,HA将会为运行中的ESXi主机提供保护。
正如我们所阐述的,HA是一个简单的群集解决方案,它可以在主机或者操作系统出现故障的几分钟内保证虚拟机继续工作,了解了HA的架构,当涉及到可用性时,我们能更容易解决问题,在接下来的章节,我们将讨论HA的架构和基本概念,我们还将讨论在客户的环境中我们如何根据需求来决策配置HA的方式。
转自:http://virtualbox.blog.51cto.com/531002/1168293