目录1. RTO恢复时间目标2. RPO恢复点目标3. RTO和RPO的权衡1. RTO恢复时间目标当业务发生中断后,从业务发生中断时开始,到将业务恢复到正常所需要的时间,此两点之间的时间段称为RTO。如我们的业务在下午14点的时候发生故障,如果定义的RTO是2小时,灾难恢复的进程要在下午16点前将业务恢复到可接受的服务级别。RTO是反映业务恢复的及时性指标,表示业务从中断到恢复正常所需的时间,R
转载
2024-04-30 20:06:32
96阅读
目录冷备、热备、rman增备全备RTO和RPO容灾方案种类RAC与ADG/OGG方案比较ADG主要解决了DG时代读写不能并行的问题OGGADG&OGG两种不同存储架构的差异基于ASM冗余设计架构实现的数据库双活方案,如何规划ASM冷备、热备、rman增备全备 RTO和RPO所谓 RTO,Recovery Time Objective,它是指灾难发生后,从 IT
转载
2024-04-15 13:45:23
147阅读
1.概述阿里云负载均衡SLB的主备可用区提供了多个层级的高可用,可阅读《负载均衡SLB高可用的四个层次》。但很多用户常常在下单选购时,对可用区的选择感到困惑。到底如何选择SLB的主备可用区,如何搭配不同可用区的ECS,来构建高可靠应用系统呢?客官请听下文分解。首先,我们要搞清楚一个事实,负载均衡SLB的可用区设计的初衷,是用来抵御可用区(机房)级别的重大灾情的,比如机房整体掉电,机房出口光缆中断等
Oracle 容灾方案选择 最近公司在搞数据库容灾这方面的东西,实施的项目会比较多,而我们实施的项目中大多数据是标准模板搭建的,基本上都是Oracle rac 2、3节点asm磁盘管理。 在考虑Oracle数据库的容灾方案选择上,首先调研一下,我们的需求 要实现秒级数据丢失即RPO要求~0,小时级别的切换时间,即业务要在一小时之内恢复 实现从深圳到长沙的数据容灾。这里我们调研了一下方案选择
转载
2024-03-21 10:15:28
56阅读
验证剧本ceph环境搭建,需要搭建14版本的ceph集群,提供三种数据接口,1.对象存储 2.块设备 3.文件系统数据导入,将原来的ceph数据(对象存储)导入到新的ceph集群中osd节点灾备恢复,分别对三种数据接口,进行osd节点摘除,按照三副本进行: 情形一:按照一个文件的分布,按照摘除1个osd 结论:摘除一个节点后,可以继续进行文件的读写;三个副本恢复后,仍然可以进行读写 情形二:摘除2
转载
2024-04-07 09:49:44
169阅读
灾难恢复计划: 什么是灾难恢复? 灾难恢复(容灾,Disaster Recovery)-->灾难恢复是在灾难发生之前所做的预防和在灾难发生之后进行系统还原和数据恢复的过程 其目标和实质是确保业务系统的持续正常运行 灾难是任何导致系统结构损坏和数据丢失的事件-->物理设备的损坏 误操作导致的数据丢失 自然和外界因素导致的系统损坏 备份不是全部-不打无准备的战役--&a
今天我将详细的为大家介绍 MySQL 数据库的机房架构与跨城容灾相关知识,希望大家能够从中收获多多!如有帮助,请点在看、转发支持一波!!!我们在实际生产环境中,要求不允许丢失任何数据。也就是说,当 MySQL 数据库由于各种原因而无法使用时(发生宕机、网络异常等),不仅需要快速恢复业务,还需要确保数据一致性。本文主要讲解数据库机房架构与跨城容灾,包括主从复制的强一致性、同城多活、两地三中心、三地五
转载
2023-09-25 23:07:02
465阅读
容灾恢复是绝大多数企业级应用的基本要求在没有Kubernetes也没有容器的时候,备份和恢复解决方案通常在虚拟机(VM)级别上实现。当应用程序在单个VM上运行时,容灾系统适用于这样的传统应用程序。但是,当使用Kubernetes对应用程序进行容器化管理时,这样的容灾系统就无法使用了。有效的Kubernetes容灾恢复方案必须针对容器化架构进行重新设计,并按Kubernetes的原生方式来运行。传统
转载
2024-04-05 11:21:36
136阅读
常见的五种复制技术随着数据持久化能力的提高,单套集群面对服务器宕机等常见硬件故障基本不会造成数据丢失和业务中断,但是单套集群仍然不能保证地震等自然灾害下的数据可靠性和业务连续性,数据复制技术由此而生。按照企业数据中心的组网架构,目前常见的数据复制技术大概可分为5类,分别是:基于应用的复制、基于数据库的复制、基于主机的复制、基于网关的复制、基于存储系统的复制,如下图所示。每种复制技术的实现原理不尽相
转载
2024-03-01 15:03:28
152阅读
Postgres容灾库恢复做vacuum full时因归档产生速度过快,备库应用不及时,导致缺失归档,备库损坏1.主库做pg_rman全备#!/bin/bash
source ~/.bash_profile
###############################################
echo 'Start time ----------->' `date`
pg_rman
转载
2024-04-07 07:31:07
103阅读
介绍两种HBase的数据备份或者容灾方案:Snapshot,Replication;一、Snapshot 开启快照功能,在hbase-site.xml文件中添加如下配置项:<property>
<name>hbase.snapshot.enabled</name>
<value>true&
转载
2024-07-05 21:03:49
62阅读
容灾是企业数据管理中的一个重要环节。近年来,国内频频发生的自然灾害事件给企业CIO提出了一个问题,灾难备份到底要做成什么程度才能满足企业的业务连续性要求? 一个适合客户使用的容灾备份系统要保证灾难发生时系统能够做到最快恢复和最小损失。RPO和RTO是衡量容灾系统的两个重要指标。RPO(Recovery Point Objective) 是指灾难发生后,容灾系统能把数据恢复到灾
转载
2024-05-25 14:04:51
10阅读
rsync同步操作 一、rsync简介rsync是Linux系统下的数据镜像备份工具,通过rsync可以将本地系统数据通过网络备份到任何远程主机上。 二、rsync的安装我们假定有A、B两个Linux系统,A系统运行业务,B系统作为A的一个远程容灾备份机,那么A系统就是rsync的服务端,B系统就是rsync的客户端。需要在A、B两个系统上都安装rsync软件,这样,在A系统上
转载
2024-05-11 09:51:53
0阅读
保存在另一地方,甚至另一个国家,这样数据就会更安全。试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商-- IBM的几种异地容灾方案。 针对不同的用户需求,IBM公
一、热备Redis集群搭建1、升级备机房redis集群版本,清除数据 2、创建主->备复制(同步所有流量到备集群) 3、切换nginx,停止一半服务流量B,修改配置,B连接到备机房redis集群 4、切换nginx,将流量切换到备redis服务B 5、修改主机房redis版本并启动,并将备机房数据同步到主机房redis ; 6、切换nginx,将流量切回到主机房redis, 7、停止连接备机
转载
2023-07-21 20:53:22
381阅读
数据备份系统只能保证数据被安全地复制了一份,但是一旦生产系统发生故障,比如服务器磁盘损坏致使数据无法读写、主板损坏造成直接无法开机或者机房火灾等意外事件,我们必须将备份的数据尽快地恢复到生产系统中继续生产,这个动作就叫做容灾。容灾可以分为四个级别:数据级容灾:也就是只考虑将生产站点的数据如何同步 到远程站点即可。与应用结合的数据级容灾:也就是可以保证对应应用程序数据一致性的数据同步,以及可感知应用
转载
2023-08-12 22:39:22
207阅读
Redis 的容灾备份基本上就是对数据进行备份, 并将这些备份传送到多个不同的外部数据中心。容灾备份可以在 Redis 运行并产生快照的主数据中心发生严重的问题时, 仍然让数据处于安全状态。下面介绍的都是一些实用又便宜的容灾备份方法:RDB与AOF。Amazon S3 ,以及其他类似 S3 的服务,是一个构建灾难备份系统的好地方。 最简单的方法就是将你的每小时或者每日 RDB 备份加密并传送到 S
转载
2023-07-13 16:02:12
130阅读
在7月初举行的「可观测,才可靠——云上自动化运维CloudOps系列沙龙第一弹」,阿里云弹性计算技术专家邓青琳分享了《云上跨可用区容灾和异地多活》,本文根据其演讲内容整理而成。系统容灾提到容灾,必然会关联到故障。常见的故障类型有变更、硬件故障、断电断网以及自然灾害,发生的频率依次降低。但发生频率低并不意味着不重要,断电断网或自然灾害产生的故障往往是致命的。2021 年 3 月 10 日,欧洲最大的
转载
2024-05-22 08:54:35
138阅读
Data Guard是Oracle推出的一种高可用性数据库方案,从Oracle 9i开始正式更名为Oracle Data Guard。Data Guard在11g中引入Active Data Guard,12c又赋予了新的功能,如: Far Sync Instance等。本文将分为系列文章,介绍12cR2中Data Guard与我们最为息息相关的新特性。|  
转载
2024-08-14 13:37:52
96阅读
1台Primary,1台Secondary,1台Arbiter
当Arbiter挂了
Primary和Secondary的主从不会切换外部应用服务不受影响在Primary上重新配置拓扑,去掉原有Aribter引入新的Arbiter, 命令如下。这个操作对Primary,Secondary以及外部应用都没有影响。rs.reconfig({"_id" : "rs1","members"
转载
2024-08-05 10:55:15
112阅读