如何更好地制定灾难恢复计划?
从定义上来说,灾难在到来时往往没有或极少有任何的预警。无论是长时间的停电、毁灭性的风暴,还是其它未预见的干扰,对于经济企业来说,最令人神经紧张的恐怕就是未知的事物。但好消息是:我们可以有效地为最险恶的风暴做好准备。如果有了完善的灾难恢复DR)计划,我们的业务将可能在灾难过后重新崛起,反之则可能永远关门歇业。
过去,我们一直在强调灾难恢复计划的重要性,并引述研究数据指出,由于IT服务中断而导致的数据丢失会对小型企业带来致命的后果,而且其严重程度远远超出人们的想象。例如,美国国家档案和记录署的研究发现,有25%遭遇过IT服务中断2至6天的企业很快倒闭,而在此后较长时期内还会有更多此类企业被迫关门。
对于每家企业来说,我们的问题是:如果这种事情发生在您身上,您会是生存者还是受害者?
多数灾难恢复计划的核心都是某种形式的数据复制——将至关重要的数据复制并存储在安全、保密的地点,这样即使主地点被某种灾难摧毁或破坏,您仍然可以拿到自己的数据。数据复制战略基本上可以分为两类:基于主机的数据复制和基于控制器的数据复制。
如果您的企业没有选择这两种中的任意一种,请一定记住,要想从基于主机的解决方案切换到基于控制器的解决方案是极为困难的,因为两者互不兼容。两者的处理方式不同并使用不同的组件(从硬件到软件,反之亦然)。如果您无法确定哪种类型适合自己的业务,您在寻找指导时一定要找可信的顾问。
基于主机的数据复制
对于小型企业,我们推荐使用基于主机的解决方案,因为这类解决方案成本效益比较高,而且是最"容易"采用的系统。在这类实施中,企业的运营层面上会将两台独立的服务器组对使用,每台服务器都保存数据,确保实现数据冗余。在基于主机的系统中,服务器可以按一对一的级别进行组对,也可以按同一地点多台服务器的方式进行组合,具体方式要依企业的需求和能力而定。
基于主机的解决方案之所有有效,是因为备份服务器可以远程部署,从而基本上不必在发生事件时重新启动服务器。此外,这种方式极为高效,而且在办公室空间和能源消耗方面的足迹都非常有限。然而,需要注意的是,基于主机的解决方案会用到多种软件系统,很可能每一种软件都需要授权。
基于控制器的复制
比较来说,基于控制器的数据复制的用户通常都是规模较大的企业,而且需要在字节一级将数据复制到一个存储区域网络(SAN)。该网络会将远程存储设备连接至服务器,但从表面上来看似乎只是连接了一些本地存储器。基于控制器的复制通常比基于主机的解决方案要昂贵许多,但它有两种实施方式,且各有自己的优点和缺点。
同步复制:同步复制通常被称为镜像,通常在最初了解到信息后便可以自动方式即时将数据存储在两个不同的地点。如果一个存储驱动器发生故障,系统便可切换至第二个驱动器,在此过程中不会损失任何数据或服务。第二个驱动器可能位于同一数据中心内,也有可能身处国家的另一端。虽然这种即时能力与其它选择相比具有巨大的优势,但还需要考虑其它的一些问题。例如,同步复制通常会用到两个地理距离较远的地点,这就需要在两个地点之间建立一条高速链路。如果不具备这一能力,系统中就会出现一些数据延迟。
异步复制:另一种基于控制器的方法是异步复制。其最大的区别是,存储在异步系统上的数据会在用户预定的间隔内被复制到第二个地点。这种数据延迟会带来较高水平的商业风险,因为如果发生故障,那些正等待被复制的数据肯定会丢失。
在确定哪种数据复制解决方案最适合您的企业时,首要的目标是确定恢复点目标(RPO)和恢复时间目标(RTO)。恢复点目标是企业能够承受的数据丢失量,而恢复时间目标是企业能够承受的关键业务应用中断时间长短 - 能够容忍的最长服务中断。
如果灾难发生,企业能够承受得起丢失多少时间?一个小时?一周?与那些可以承受一天或一周服务中断的企业相比,需要即时恢复的企业必然要支出更大的资金预算。
同样,恢复点目标越严格,则其成本就越高昂,但中小型企业必须在支出与重大数据丢失造成的潜在附带成本之间做出权衡。确定自己的恢复点目标和恢复时间目标可以帮助您生理地分配资源,并据此采取进一步的行动。
现在就开始做功课并对最适合自己的系统进行评估,对于不同的案例而言,数据复制的解决方案千差万别。在对最糟糕的场景进行规划时,您应当考虑自己最关键的数据需求,以及数据如何能够使您免受紧急事件后果的影响。