美国国家档案和记录管理处(National Archives and Records Administration)的数据显示,如果企业数据中心因为灾难而停止工作超过10天,93%的企业都会在灾难后一年左右申请破产。
容灾是一项挑战
尽管越来越多的企业认识到容灾的重要性,但是如何打造高效的容灾系统仍然是一个极大的挑战。
  • 难以满足恢复时间和可用性的要求 很多业务连续性方案都没法满足企业业务的需求,特别是停机时间的目标。大家往往专注保护几个专有的系统,对其他大量的系统,特别是x86服务器系统都不能进行有效保护。
  • 昂贵的成本 许多方案都需要用户投入大量资金购买附加硬件、软件和服务,造成了高昂的成本需求。灾难恢复计划往往需要复制数据中心的基础架构,这将导致容灾成本急剧增加,同时使得利用率很低的服务器急剧扩展,从而进一步增加了容灾的成本。
  • 急剧增加的复杂性 传统的业务连续性方案都相当复杂,实施、管理和维护都很麻烦。管理容灾架构、维护实时更新的复杂文档、人工的恢复流程和高效的测试计划都导致了复杂性的增加。
  • 可靠性不高 测试复杂的业务连续性方案是一项颇具挑战性的工作。测试的过程往往需要巨大的设备投入和人员投入。传统的解决方案都难于维护。另外,专业人员的培训以及执行这些恢复计划都有难度。
VMware的虚拟化技术为x86系统提供了低成本、高可靠、简单方便的业务连续性方案。最近一次的VMware客户调查表明,超过50%的VMware用户已经通过VMware的软件方案来部署业务连续性方案。
通过虚拟化确保可用性
VMware Virtual Infrastructure 3(VI3)可以帮助用户降低计划停机和非计划停机时间,同时没有传统业务连续性方案的复杂性,成本也不高。通过VMware VMotion和VMware DRS技术,用户可以轻松实现在线维护服务器硬件,从而大幅度降低计划停机时间。VMware软件还可以保护用户系统的可用性,降低非计划性停机的影响,并可预防如下故障。
  • 网络和存储接口故障:VI3支持冗余的网络和存储接口,提高了系统的可用性。冗余的网络和存储访问接口可以被多个虚拟机共享,降低了成本。同时,VI3也让用户方便创建冗余的服务器,且不需要购买额外的硬件,只要在发生服务器故障时,将其上的虚拟机重新部署到其他已有的低利用率服务器上即可。
  • 服务器故障:VMware HA可以保护服务器,一旦发生服务器硬件故障,其上的虚拟机可以通过VMware HA自动转移到其他的可用服务器上,从而确保了虚拟化的高可用性。
  • 超载服务器: VMware VMotion和DRS结合,可以动态分布所有的虚拟机负载,从而避免某些服务器超载带来的问题,让虚拟机负载平均分布到所有的计算节点上,最大限度调动所有的计算资源。
通过虚拟化确保高效的灾难恢复
建立业务连续性系统最重要的是在发生灾难后进行业务恢复。但是,传统的灾难恢复方案都需要完全一样的生产和灾备节点硬件配置,以确保硬件故障后的快速恢复,这大大增加了灾难恢复系统的成本。传统的灾难恢复计划通常也需要复杂的、耗时费力的流程,其中往往隐藏着很多容易导致错误的步骤。因此,很多用户只好选择极少的几个系统进行灾难备份,其他系统只好忽略。
通过部署VMware的虚拟化架构,用户可以轻松应对这些挑战。VMware的虚拟化容灾可以高效应对物理服务器和虚拟机的灾难备份需求。物理服务器甚至可以通过虚拟机来进行备份和恢复。当然,最常见的灾备方式是生产节点和灾备节点全部实现虚拟化,通过虚拟到虚拟的方式来保护用户的系统。通过部署VMware,用户可以轻松满足灾难恢复系统的核心需求。
  • 快速恢复: VMware软件可以消除很多传统容灾系统中缓慢的人工过程。虚拟化提供了真正的硬件无关性,消除了裸金属恢复过程中重新安装系统的过程。VMware Site Recovery Manager(SRM)更允许用户自动执行整个恢复流程,从而加速了灾难后的恢复过程。
  • 可靠的恢复:VMware消除了传统灾难恢复中许多容易犯错的过程,包括和硬件兼容性相关的故障。将VMware VI3和SRM结合,可确保容灾恢复按预先设计的流程自动执行。
  • 成本可以接受的容灾:VMware软件避免了在灾备中心部署和生产中心完全一样的硬件,降低了灾备中心的投入。虚拟机可以在任何硬件上进行恢复。
深入认识VMware SRM
大家对VMware VI3已经相当熟悉。在此,只着重介绍一下SRM。
SRM可以使灾难恢复变得快捷、可靠又便于管理,让企业达到其恢复目标。SRM可以让用户集中管理恢复计划,还可以自动执行恢复过程。它将传统灾难恢复中使用的复杂的纸质操作手册,转换成虚拟基础架构管理软件中的集成元素,并显著改善恢复计划的测试效果。
SRM是为VI3提供的一款领先的灾难恢复管理和自动化解决方案。SRM通过自动执行恢复过程来加快恢复的速度,并将灾难恢复作为VMware虚拟基础架构管理的集成要素,从而简化灾难恢复计划的管理工作。该解决方案省去复杂的手动恢复步骤,支持无中断的恢复计划测试,确保恢复过程的安全可靠。
SRM紧密集成VMware VI3、VMware VirtualCenter及其他领先存储供应商提供的存储复制软件,使故障切换和恢复变得快捷、可靠和经济,而且便于管理。因此,企业不仅无需担心灾难恢复的风险,还可将所有重要的系统和应用程序纳入保护范围。
1.SRM应用场景
SRM可以帮助企业应对传统灾难恢复方法的各种挑战,满足恢复时间目标(RTO)和恢复点目标(RPO)以及法规遵从的要求。利用SRM,企业可以管理从生产数据中心到灾难恢复站点的故障切换,同时还可以管理两个互为恢复站点且具有活动工作负载的站点之间的故障切换。SRM还可以自动执行及简化故障切换至新数据中心的过程。企业利用SRM可以实现以下诸多功能。
  • 管理灾难恢复计划 SRM支持企业将创建、更新和记录恢复计划作为VMware虚拟环境管理的集成部分。传统的灾难恢复解决方案往往需要将故障切换的所有步骤和所需资源记录到操作手册中,而这很难保证准确无误和及时更新。采用SRM,可直接在VMware VirtualCenter中管理故障切换过程。
  • 对故障切换和恢复执行无中断测试 使用SRM,企业可以执行恢复计划的自动测试,而不会对环境造成任何中断。SRM可以利用实际故障切换的恢复计划,轻松创建一个隔离的测试环境。
  • 自动执行故障切换和恢复 SRM可以自动执行恢复计划,排除传统灾难恢复中常见的缓慢且不可靠的手动处理。同时,SRM可以确保按照预期执行恢复计划。
2.SRM工作原理
SRM可以为用户提供创建、管理和执行灾难恢复计划的主要环节。该解决方案已经集成到VMware VirtualCenter管理界面中,可以统一管理虚拟基础架构及该架构的灾难恢复计划。SRM可以简化并自动执行设置、测试和执行恢复计划的主要环节。
  • 设置恢复基础架构 SRM可指导用户完成远程站点的连接,并连接使用的存储复制软件,还可让用户轻松地将生产资源映射到恢复站点上。
  • 创建恢复计划 SRM具有直观的界面,可以协助用户创建适用于不同故障切换情况和基础架构的恢复计划。用户可以指定一些虚拟机暂停或关闭,从而释放可用资源以供恢复使用,还可以指定虚拟机启动的顺序、设置用户定义的脚本自动执行。
  • 测试恢复计划 SRM可以利用存储阵列的快照功能,在恢复站点上自动创建无中断的、隔离的测试环境,然后将虚拟机连接到用户的隔离测试网络中。它将自动执行在实际故障切换中使用的恢复计划,并在测试结束后清除测试环境。测试结果会被保存,以便随时查看和导出。
  • 自动执行故障切换 管理员从VMware VirtualCenter 启动恢复计划后,SRM会自动执行恢复计划中的所有步骤,保证恢复完全按照预期执行。管理员通过VirtualCenter可以看到恢复计划的执行情况,并可以随时暂停或停止执行。随着环境的变化,用户也可以通过VirtualCenter随时更新和修改恢复计划。
3.SRM的主要功能
  • 灾难恢复管理 利用存储供应商认证的集成功能,查找并显示受存储备份保护的虚拟机;直接在 VirtualCenter中创建及管理恢复计划;利用定制脚本扩展恢复计划;监视远程站点的可用性,并提示用户可能会发生的站点故障;存储、查看和导出测试结果,并在 VirtualCenter中执行故障切换;利用基于角色的访问控制方法来控制对恢复计划的访问。
  • 无中断测试 利用存储快照功能执行恢复测试,而不会丢失备份数据;将虚拟机连接至现有的隔离网络,以便进行测试;自动执行恢复计划;定制针对不同测试情况的恢复计划;完成故障切换测试之后,自动清除测试环境。
  • 自动执行故障切换 只要按一下按钮,用户即可从VirtualCenter中执行恢复计划;利用领先的存储供应商为其备份平台创建的适配器,自动提升备份的数据存储区,以便在恢复情况下使用;执行用户定义的脚本,并可在恢复过程中暂停;重新配置虚拟机的IP地址,使其与故障切换站点的网络配置相符;在VirtualCenter中管理和监视恢复计划的执行情况。
虚拟化的益处
通过部署基于VMware虚拟化的业务连续性方案,用户可以享受到以下好处。
缩短停机时间 VMware可以帮助客户减少非计划停机时间,同时减少计划内停机时间,最大限度降低总的停机时间。
  • 降低容灾系统成本 VMware让用户以低成本打造高可用、高可靠的容灾系统,不需要额外购买专有硬件或软件,最大限度地降低总体成本。
  • 简化操作流程 基于VMware虚拟化的容灾系统,不需要维护主/备中心完全一样的物理硬件,降低了硬件维护的复杂性。
  • 扩展容灾系统的保护范围 由于虚拟化降低了业务连续性的成本,用户可以将业务连续性保护扩展到更广的的范围。