灾难备份对于企业来说是一项非常重要的技术应用,对企业的数据安全起到很大作用。灾难备份,即灾备,是指利用科学的技术手段和方法,提前建立系统化的数据应急方式,以应对灾难的发生。其内容包括数据备份和系统备份,业务连续规划、人员架构、通信保障、危机公关,灾难恢复规划、灾难恢复预案、业务恢复预案、紧急事件响应、第三方合作机构和供应链危机管理等等。
而容灾,是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务的所进行的一系列系统计划及建设和管理行为。换言之,灾备是容灾的技术基础。
一、业务级容灾是最高级别的容灾
一般来说,容灾的级别可以分为数据级、应用级和业务级三个级别:
1、数据级:主要关注的就是数据,就是在灾难发生之后,可以确保数据不受到损坏。比如早期的通过备份到磁带转移到异地或者基于网络实现灾备中心与生产中心的异步\同步的数据传输。
2、应用级:建立在数据级灾备的基础上,对应用系统进行复制,也就是在异地灾备中心再构建一套应用支撑系统,可提供应用接管能力。支撑系统包括数据备份系统、备用应用系统、以及备用网络等。
3、业务级:也是最高级别的容灾,包括超过IT系统的部分,比如业务用户的办公场所以及业务工作人员备份等。
业务级容灾的终极目标是保障业务的连续性。
二、不同行业的期望RTO都很严苛
当灾难发生时,首先关注作为恢复单位的业务流程。对于每一个业务流程,在灾难发生后对其重要性进行优先排序。我们可以用“黄金”、“白银”和“青铜”对每个类别进行排序,并为每个类别指定一个期望的RTO。
RTO,即Recovery Time Objective,它是指灾难发生后,从IT系统宕机导致业务停顿之时开始,到IT系统恢复至可以支持各部门运作、恢复运营之时,此两点之间的时间段称为RTO。
例如,我们可以期望“黄金”业务流程需要在4小时内运行,“白银”在48小时内运行,“青铜”在两周内运行。不同行业对于不同类别业务的期望RTO不同。
金融行业:
证监会、银监会联合下发的《证券公司客户交易结算资金商业银行第三方存管技术指引》,酒对第三方存管系统的技术指标、数据交换、故障应急处理等进行了规范:
相关的应用系统应实现系统的热备份,支持自动切换;
应建立灾难备份系统,主用系统和灾难备份系统的设计恢复时间目标应少于60分钟,恢复点目标应少于10分钟,系统运行性能降低预期应少于50%,主用系统和灾难备份系统的通信线路应保持畅通。有条件时建议采用主用系统和灾难备份系统处理能力相同、轮换交替使用的双系统模式;
医疗行业:
医疗行业的RTO与患者的病情息息相关。不久前,武汉一医院医疗系统于上午8:30意外瘫痪,导致患者无法读取电子就诊卡,医生电脑也收不到任何患者信息,也无法开检查单或处方,不能做治疗。候诊的患者和家属只能在大厅里等着,医生们也不知如何应对。
在医疗信息化的时代,业务系统瘫痪停摆有时候会涉及到人命关天,RTO此刻是在与死神赛跑。
不同行业,对于核心业务的RTO要求都是极为严苛的。业务瘫痪时间越长,对于业务的损失以及企业的声誉都会有极大的影响。国际正常运行时间协会(Uptime Institute)在2021年全球数据中心调查中发现,有五分之一的企业将业务系统瘫痪列为特大事故。
三、全链路业务级云容灾工具,让期望RTO成为可能
业务恢复是自下而上的,但业务级容灾在实际操作上是自上而下的。当灾难发生时,首先要选择需要恢复的核心“黄金”业务,再进行技术层面的操作,自下而上进行业务恢复。
在技术层面,HyperBDR云容灾®从启动容灾机制到业务在云端恢复可用,可以做到1-5分钟级别。考虑到业务的高连续性要求,HyperBDR云容灾®采用块级全量增量复制技术:
1、 一次全量备份后,只复制有数据变化的增量块,数据备份效率更高,节省资源。
2、 自定义恢复策略:支持持续复制和定时复制2种模式,灾难发生时,可按业务需求制定恢复策略。
HyperBDR云容灾®搭载的Boot in Cloud™独家专利技术,可在接管/恢复业务时按需启动云主机,内嵌云端编排能力,实现云端一键拉起主机,接管业务到可用状态;跨架构、跨云智能驱动适配,无需人为介入的高度自动化大大提高业务恢复的成功率,从另一维度有效缩短RTO。
在人员操作层面,HyperBDR云容灾®颠覆传统容灾繁杂的使用方式:
1、向导式操作:按业务流向导式操作设计的软件,让只拥有基础IT知识的人,也能立刻上手。
2、三步极简操作:极大简化传统灾备容灾软件的繁杂操作,所见即所得,节省了业务恢复操作过程中所需的时间。
3、资源组容灾:支持按组设置容灾策略,可将不同业务分组归纳管理,提前部署业务级容灾策略,关键时刻提升效能。