• 应用上云之后,如何进行数据可靠性以及业务连续性的保障是非常关键的,通过华为云云上两地三中心方案了解相关方案
  • 当前内容为灾备常见理论以及华为云SDRS以及CBR介绍
  • 理解不足小伙伴帮忙指正

不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树


灾备概述

灾备的定义:灾备是指利用科学的技术手段和方法,提前建立系统化的数据应急方式,以应对突发事件的发生。

【华为云】容灾方案两地三中心实践理论_数据库

备份

备份:为了防止数据丢失、损坏等意外,将存储的数据,复制到其他存储设备上,备份的本质,就是存储数据的“复制”;目的是意外发生后的数据恢复

备份类型分为:全量备份,增量备份,差量备份

全量备份:

每天对整个系统包括系统文件和应用数据进行的完全备份

  • 优点:能够基于上一次的完全备份快速恢复数据,恢复窗口小
  • 缺点:所占用的存储空间大,每次备份耗时长,备份窗口大。

差量备份:

每周一天完全备份本周其余每天备份和全量备份的差异部分

  • 优点:相对全量备份来说每次备份可以节约一个完全备份的存储空间,备份窗口较小,恢复窗口较小
  • 缺点:恢复时必须依赖上一次全量备份和本次的累积增量式备份才能完整恢复数据,恢复时间较差异增量式备份较短。

增量备份:

每周一天全量备份本周其余每天备份和上次备份的差异部分

  • 优点:能够最大限度地节省存储空间,备份窗口小
  • 缺点:数据恢复时必须依赖上一次全量备份和每一次的差异增量式备份才能对数据进行完整恢复,恢复时数据重构较慢,恢复时间较长

容灾

容灾:是指在相隔较远的异地建设两套或多套系统,互相之间可以进行健康状态检查和功能切换,当一处系统因意外4(如火灾、地震等)停止工作时,整个应用系统可以切换到另处,使得该系统功能可以继续正常工作。

容灾指标 RTO

RTO(RecoveryTimeObjective,恢复时间目标)是可容许服务中断的时间长度,RTO是反映业务恢复的及时性指标,表示业务从中断到恢复正常所需的时间RTO数值越小,代表容灾系统的数据恢复能力越强,可以部署很多容灾系统,来获取最小的RTO,但这意味着投入大量资金,比如说服务发生中断后半天内便需要恢复,RTO数值就是十二小时

容灾指标 RPO

RPO(RecoveryPointObjective,恢复点目标)是指能容忍的最大数据丢失量,是指当业务恢复后,恢复得来的数据所对应时间点。是反映恢复数据完整性的指标

【华为云】容灾方案两地三中心实践理论_云服务_02

  • 本地高可用
  • 同城容灾方案(双活数据中心,主备容灾解决方案)
  • 异地容灾方案(两地三中心容灾解决方案,主备容灾解决方案)

云上两地三中心实践技术原理介绍

【华为云】容灾方案两地三中心实践理论_华为云_03

存储容灾服务SDRS

存储容灾服务(StorageDisaster Recovery Service,SDRS)是一种为弹性云服务器ECS、云硬盘EVS和专属分布式存储 DSS 等服务提供容灾的服务。通过存储复制、数据冗余和缓存加速等多项技术,提供给用户高级别的数据可靠性以及业务连续性,简称存储容灾。

SDRS 用于位于同一个区域不同可用区的容灾,即一地两中心的情况

区域和可用区

区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。如:华北-北京四、华东-上海一等。

Region分为通用Region专属Region:

  • 通用Region指面向公共租户提供通用云服务的Region;
  • 专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。

可用区 (AZ,Availability Zone):一个AZ是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。如:随机分配可用区1、可用区2等

一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求

【华为云】容灾方案两地三中心实践理论_云服务_04

生产站点:正常情况下承载业务的数据中心机房,可以独立运行,对业务的正常运作起到直接支持作用。对于SDRS,生产站点在创建保护组时指定,即租户的服务器所在的位置

容灾站点:正常情况下不直接承载业务机房,主要用于数据实时备份,产站点发生故障(计划性和非计划性)时可以通过执行容灾切换来接管业务,地理上不一定与业务管理中心接近,可以在同一个城市,也可以在不同的城市,当前仅支持选择与生产站点在同一个地区的不同可用区 (相同region,不同AZ)

保护组:用于管理一组需要复制的服务器(承载具体业务),一个保护组可以管理一个虚拟私有云下的服务器,租户拥有多个虚拟私有云时则需要创建多个保
护组。

保护实例: 一对拥有复制关系的服务器。保护实例仅属于一个特定的保护组,因此这对服务器所在位置与保护组的生产站点或容灾站点相同

复制对:一对拥有复制关系的云硬盘,复制对仅属于一个特定的保护组,且可以挂载给同一个保护组下的保护实例

SDRS功能原理

用户于华为云某区域的AZ1上部署了业务,包含N台ECS和M块EVS,作为生产站点。使用SDRS可根据业务需要创建保护组,比如保护组1,用来承载业务1

为保护组创建对应的保护实例和复制对完成容灾站点的部署,根据业务需要将保护组开启保护。当生产站点中与业务1相关的云服务器发生故障时,可在保护组1中一键执行故障切换将业务1迁移至容灾站点,并手动开启容灾站点的云服务器,从而提高业务连续性,RPO为0,保证数据可靠性。

【华为云】容灾方案两地三中心实践理论_云服务_04

云备份 CBR 介绍

云备份 (Cloud Backup and Recovery)为云内的弹性云服务器 (Elastic Cloud Server,ECS)、和裸金属服务器(Bare Metal Server, BMS)、云硬盘 (Elastic VolumeService,EVS)、SFS Turbo文件系统、云下VMware虚拟化环境,提供简单易用的备份服务,针对病毒入侵、人为误删除、软硬件故障等场景,可将数据恢复到任意备份点。云备份保障用户数据的安全性和正确性,确保业务安全

CBR 用于不同区域的容灾方法,即两地两中心的情况

【华为云】容灾方案两地三中心实践理论_数据_06

存储库: 云备份使用存储库来存放备份,存储库分为备份存储库复制存储库两种

  • 备份存储库是存放服务器和磁盘产生的备份副本的容器
  • 复制存储库只能存放复制操作产生的备份,且由复制操作产生的备份不允许再次复制

复制:复制是指将一个区域已经生成的备份数据复制到另一个区域。后续可在另一个区域使用复制的备份数据创建镜像,并发放新的云服务器.

即时恢复: 即时恢复特性支持备份快速恢复云服务器数据和备份快速创建镜像,恢复云服务器数据和备份创建镜像的时间相较于特性启用之前将大大缩短。系统默认创建的备份均为“增量备份

备份策略: 备份策略指的是对备份对象执行备份操作时,预先设置的策略。包括备份策略的名称、开关、备份任务执行的时间、周期以及备份数据的保留规则。其中备份数据的保留规则包括保存时间或保存数量,通过将备份存储库绑定到备份策略,可以为存储库执行自动备份。

【华为云】容灾方案两地三中心实践理论_云服务_07

云备份备份方式:云备份提供两种配置方式:一次性备份和周期性备份

  • 一次性备份是指用户手动创建的一次性备份任务.
  • 周期性备份是指用户通过创建备份策略并绑定存库的方式创建的周期性备份任务。 (本实验采用周期性备份)

CBR 功能原理

CBR可实现华为云上多区域 (如region1、region2、region3等)之间的数据灾备。通过购买存储库、绑定资源、创建备份等操作实现数据同步,从而在异地(其他region)恢复对应云服务器,RTO为分钟级

本实验中,生产站点为北京四,异地站点为上海一。通过备份存储库以及复制存储库,将生产站点的云服务器数据恢复到异地站点。

【华为云】容灾方案两地三中心实践理论_数据库_08

云上两地三中心实践内容介绍

博文部分内容参考

© 文中涉及参考链接内容版权归原作者所有,如有侵权请告知,这是一个开源项目,如果你认可它,不要吝啬星星哦 😃