容灾~

异地容灾三不原则 什么是异地容灾_数据

一、容灾的概述:

1、什么是容灾:

容灾系统是指,在相隔较远的异地,建立两套或者多套功能相同的IT系统,相互之间可以进行健康状态的监控和功能切换,当一处系统因为意外(如,火灾、地震、服务器人为破坏等)停止工作后,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。
容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。

2、对于容灾异地的要求:

本地容灾,本地容灾一般指主机集群,当某台主机出现故障,不能正常工作时,其他的主机可以替代该主机,继续正常对外提供服务。通常可通过共享存储或双机双柜的方式实现本地容灾,其中多以共享存储为主。

异地容灾要求数据中心间距离须保证在三百公里以上,同时还必须做到“三不”, 即不在同一地震带,不在同一电网,不在同一江河流域。灾备中心的选址直接影响到容灾方案的效果和保护等级。当生产中心和灾备中心的距离大于100km、小于 300km 时,此种方案只能为生产中心提供应用级容灾保护,提升生产中心抵御物理破坏的能力,但是不能有效避免地震、洪水等级别灾难带来的损失。从下图可以明确,最为稳固的、保护等级最高,也是成本最高的容灾方案,即“两地三中心”:本地的生产中心和容灾中心相距 100km 以上,进行应用级 /业务级容灾保护,且在 300km 以外的异地建立容灾中心,进行数据级 /应用级容灾保护。

异地容灾三不原则 什么是异地容灾_数据中心_02


图示为本地容灾。

异地容灾三不原则 什么是异地容灾_异地容灾三不原则_03


图示为异地容灾。

3、容灾和备份有什么连系 ?

容灾备份实际上是两个概念,容灾是为了在遭遇灾害时能保证信息系统能正常运行,帮助企业实现业务连续性的目标,备份是为了应对灾难来临时造成的数据丢失问题。在容灾备份一体化产品出现之前,容灾系统与备份系统是独立的。容灾备份产品的最终目标是帮助企业应对人为误操作、软件错误、病毒入侵等"软"性灾害以及硬件故障、自然灾害等“硬”性灾害。

4、容灾和备份的区别:

一般意义上,备份指的是数据备份或系统备份,容灾指的是不在同一机房的数据备份或应用系统备份。备份采用备份软件技术实现,而容灾通过复制或镜像软件实现,两者的根本区别在于:

  • 容灾主要针对火灾、地震等重大自然灾害,因此备份中心与主中心间必须保证一定的安全距离;数据备份在同一数据中心进行。
  • 容灾系统不仅保护数据,更重要的目的在于保证业务的连续性;而数据备份系统只保护数据的安全性。
  • 容灾保证数据的完整性;备份则只能恢复出备份时间点以前的数据。
  • 容灾是在线过程;备份是离线过程。
  • 容灾系统中,两地的数据是实时一致的;备份的数据则具有一定的时效性。
  • 故障情况下,容灾系统的切换时间是几秒钟至几分钟;而备份系统的恢复时间可能几小时到几十小时。

二、容灾的分类:

从其对系统的保护程度来分,可以将容灾系统分为:数据容灾和应用容灾,
数据容灾就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。
应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份),在灾难情况下,远程系统迅速接管业务运行,数据容灾是抗御灾难的保障,而应用容灾则是容灾系统建设的目标。

1、数据级

数据级容灾是最基础的手段,指通过建立异地容灾中心,做数据的远程备份,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏,但在数据级容灾这个级别,发生灾难时应用是会中断的。可以简单的把这种容灾方式理解成一个远程的数据备份中心,就是建立一个数据的备份系统或者一个容灾系统,比如数据库、文件等等。

  • 优点:费用比较低,构建实施相对简单
  • 缺点:数据级容灾的恢复时间比较长

2、应用级

应用级容灾是在数据级容灾的基础之上,在备份站点同样构建一套相同的应用系统,通过同步或异步复制技术,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生。应用级容灾就是建立一个应用的备份系统,比如一套OA系统正在运行,在另一个地方建立一套同样的OA系统。

  • 优点:提供的服务是完整、可靠、安全的,确保业务的连续性
  • 缺点:费用较高,需要更多软件的实现

3、业务级

业务级容灾是全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。

  • 优点:保障业务的连续性
  • 缺点:费用很高,还需要场所费用的投入,实施难度大。

异地容灾三不原则 什么是异地容灾_数据_04

三、备份等级:

容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。

当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。

在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行,设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等,根据这些因素和不同的应用场合,通常可将容灾备份分为几个等级。
第0级:没有备援中心**

这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。

第1级:本地磁带备份,异地保存

在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。

第2级:热备份站点备份

在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。

第3级:活动备援中心

在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:

  • 1、两个数据中心之间只限于关键数据的相互备份;
  • 2、两个数据中心之间互为镜像,即零数据丢失等。

零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是。

异地容灾三不原则 什么是异地容灾_数据中心_05

四、规划企业安全保障体系考虑的因素:

对于企业而言到底应该如何建设自己的灾备系统,是只建设备份系统、还是只建设容灾系统、还是需要二者同时建设、或者是分步骤的建设,谁先谁后等问题,主要根据业务的需求而定:
(1)需要防范的灾难类型:

企业信息系统可能遇到的灾难类型及其发生的比例如下:

对于“人为错误”、“软件损坏和程序错误”加上“病毒”等这些都称为逻辑错误,占总故障的 56%,这些错误只能通过备份系统才能防范;

对于“硬件和系统故障”以及“自然灾难”等故障可以通过在容灾系统(或者异地备份)来防范,占总故障率的44%。

(2)允许的RTO和RPO指标

从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。

一般而言:容灾系统能够提供较好的RTO和RPO指标。

异地容灾三不原则 什么是异地容灾_数据_06


异地容灾三不原则 什么是异地容灾_数据中心_07


(3)系统投资

总的说来,建设备份系统的投资远比建设标准意义的容灾系统的投资小得多:

备份系统的投资规模一般在几百万;而最节省的一套容灾系统投资都将上千万;灾难恢复与投资关系:

异地容灾三不原则 什么是异地容灾_数据备份_08

五、常见的灾备组合方式:

基于以上原因,业界在灾备系统的建设上一般按照以下几种方式:

  • 建设机房内的本地备份系统
  • 建设异地的备份系统

该方式可以备份系统的价格满足备份和异地容灾功能,能够避免主生产中心由于地震、火灾或其他灾害造成的数据丢失。

  • 备份系统+异地容灾系统

灾难恢复层次

异地容灾三不原则 什么是异地容灾_数据_09


建设流程

异地容灾三不原则 什么是异地容灾_数据备份_10


恢复流程

六、典型的容灾应用–两地三中心:

两地三中心=同城双中心+异地灾备中心

同城双中心 是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,同城双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点。

异地灾备中心 是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

两地三中心 : 是指 同城双中心 加 异地灾备 一种商用容灾备份解决方案;

两地 是指同城、异地;

三中心 是指生产中心、同城容灾中心、异地容灾中心。( 生产中心、同城灾备中心、异地 灾备 中心 )

当主机房挂了,启用同城备机房,同城备机房也挂了,就启用异地备机房。仔细品,其实每次都只有一个机房对外提供服务,两外两个机房都被用来容灾,也就是说备用机房利用率不高,因为主机房不可能老出问题,这样就导致主机房“累死”,备机房“闲死”。所以,我们可以尝试把一些对数据实时性要求不高的请求或不太重要的业务请求交给同城备用机房去做,而异地备机房还是只做容灾,因为异地数据同步延迟高,不能保证异地备机房处理业务时,数据是一致的

两地三中心的缺点:

  1. 灾备中心利用率不高
  2. 生产数据中心停止运行后,灾备中心中不一定有100%一模一样的数据
  3. 成本高,但又无法真正实现期望的高可用能力

异地容灾三不原则 什么是异地容灾_异地容灾三不原则_11


解决:

让灾备中心不再仅仅只能用来做灾备,还能和生产数据中心一样正常的对外提供服务

异地容灾三不原则 什么是异地容灾_数据中心_12

  1. 不再区分生产数据中心和灾备数据中心,只有数据中心,而且数据中心之间相互备份数据,保证每个数据中心都是全量数据。
  2. 用户可以在任意一个数据中心上进行读写操作。

优势:

  1. 每个数据中心一直在对外提供服务(不是一个新手),所以当一个数据中心停电后,直接把用户流量切到另外一个数据中心也是问题不大的。
  2. 用户可以就近访问数据中心,这样用户的体验更好,并且整个架构的流量也比较平均。