作者:范军 (Frank Fan)Stretched Cluster是一把双刃剑,会用的如行云流水,用不好反而受其限制。传统的vSphere Cluster是指一个Cluster内的所有ESXi主机都在一个物理机房内。Stretched Cluster顾名思义是把Cluster的概念扩展到了不受物理位置的限制。主机可以是在同一个数据中心的不同物理机房,甚至可以分布在不同城市的数据中心。听上去很酷吧
背景
在单集群部署环境下,OpenMLDB 具备集群内节点级别的高可用能力。但若受到机房断电或者自然灾害等不可抗拒因素,则将造成的机房或大部分节点无法正常运转的情况,从而引发该集群状态异常,导致在线服务中断。为此,OpenMLDB 提供了一个跨机房容灾方案来解决该问题。在该方案中,用户可以在多个异地机房,分别部署独立的 OpenMLDB 集群,并且将这多套 OpenMLDB 集群设置成为主从复制模
2017运维/DevOps在线技术峰会上,阿里云应用运维专家夸父带来题为“同城容灾架构剖析”的演讲。本文主要从部署目标和要求开始谈起,接着着重对架构进行分析,然后又重点对任务分解进行说明,并对单双机房的部署进行了对比,最后分享了容灾演练方式。一起来了解下吧。近几个月,运维事件频发。从“炉石数据被删”到“MongoDB遭黑客勒索”,从“Gitlab数据库被误删”到某家公司漏洞被组合攻击。这些事件,无
前言2023年4月11日,阿里云发布高性价比的存储产品——对象存储预留空间(Reserved Capacity),实现对象存储成本更低价。对象存储预留空间从500 GB到1 PB容量范围,有7个档位可以选择。实际费用上,客户购买500G/年、1PB/年的预留空间,相比按量付费分别下降35%和 50%。如果客户对数据存储地域无要求,且可以接受仅通过外网进行数据读取,那么也可选择无地域属性预留空间,无
服务器架构设计中,你经常会听到容错、灾备、高可用这三个词,但是这三个词常常会被用错,即使是专业人员也会如此。容错 Fault Tolerance,能容忍一定的失败,部分组件失败,不会中断系统的运行,仍然能对外提供服务。比如早期的大型飞机有4个引擎,坏了一个飞机仍然还能飞行,不会坠毁。高可用我们通常听到某个系统可用性 99.9%、99.99% , 系统可用性计算方式: 系统可用性
在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。本文主要介绍数据备份的方式,以及如何保证多个数据副本的一致性,在系统出现机器或网络故障时,如何保持系统的高可用性。数据备份数据备份是指存储数据的多个副
公司需求: 本地数据中心备份系统目前已经有了,现在根据公司要求需要过三级等堡,需要建立数据灾备中心,防止本地数
容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。 数据容灾是指建立一个异地的数据系统,该系统是对本地系统应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性,云备份服务则天生具有异地容灾的特性。 应用容灾
转载
2023-09-24 17:07:14
128阅读
从前面的分析来看,同步数据容灾一般只能在较短距离内部署(10KM-100KM),大于这个距离,就没有实际应用价值了。因为即使在1000KM 距离上,4.5MB 的速率即使将数据复制到异地,每个I/O 的响应时间也会超过10ms,这种响应速度太慢。
异步数据容灾是在“线路带宽和距离能保证完成数据复制过程,同时,异地数据复制不影响生产系统的性能”这样的要求下提出
目前所接触的Oracle 的灾备以及同步手段主要有ADG,OGG,DSG,高级复制,流复制以及自主开发的基于logmnr的数据同步软件,各有优劣。各自评价如下:1. ADG,最常用的同城,异地灾备解决方案,物理级备份,备机不可写,传输数据为所有redo日志的更改,数据量稍大,不过从以往的使用经验来看,也不太会影响网络,除非应用对网络有很苛刻的要求,即使有,也可以通过vlan或者路由或者多网卡的方法
美国国家档案和记录管理处(National Archives and Records Administration)的数据显示,如果企业数据中心因为灾难而停止工作超过10天,93%的企业都会在灾难后一年左右申请破产。
容灾是一项挑战
尽管越来越多的企业认识到容灾的重要性,但是如何打造高效的容灾系统仍然是一个极大的挑战。
难以满足恢复
文章目录背景一、RTO是什么?二、RPO是什么?三、容灾设计四、举个例子五、参考文档 背景当灾难发生时,基础设施或业务服务等处于不可用状态,我们需要关注的两个关键技术指标,也是很多企业或用户的核心KPI,RTO和RPO。一、RTO是什么?一个是RTO,恢复时间目标(Recovery Time Objective),即灾难发生后,软件信息系统从停顿到必须恢复的时间要求,也就是企业或者用户可以接受多
一、阿里云产品容灾-高可用介绍1、 SLB 容灾-高可用介绍阿里云SLB产品使用开源软件LVS+keeplived实现4层的负载均衡。采用淘宝的Tengine实现7层的负载均衡。所有负载均衡均采用集群部署,集群之间实时会话同步,以消除服务器单点,提升冗余,保证服务稳定。在各个地域采用多物理机房部署,实现同城容灾。SLB在整体设计上让其可用性高达99.99%。且能够根据应用负载进行弹性扩容,在任意一
容灾建设的目的是确保用户的业务永续运行,在建设过程中,科学严谨的方法论是确保容灾项目能够正常运转的前提。我们将容灾建设规划分为三部分:业务连续性规划、方案设计、方案实施。 1.业务连续性规划 容灾建设通常会根据业务连续性规划来确定方案,其目的是为了保护业务的连续性运行。因此,业务连续性规划是
在灾难恢复方面,目前业界公认有三个目标值得努力。一是恢复时间,企业能忍受多长时间没有 IT,处于停业状态;二是网络多长时间能够恢复;三是业务层面的恢复。整个恢复过程中,最关键的衡量指标有两个:一个是 RTO,另一个是 RPO。所谓 RTO,Recovery Time Objective,它是指灾难发生后,从 IT 系统当机导致业务停顿之时开始,到 IT 系统恢复至可以支持各部门运作、恢复运
灾备重要吗?当然,如今灾备的重要性毋庸置疑,天灾人祸的出现让人们意识到灾备已经是数据中心必不可少的一环。如今企业的IT应用环境几乎都运行在数据中心中,数据中心越来越复杂,业务数据也越来越重要,这个时候灾备也就也来越重要。而天灾和人祸是不可避免的,所以需要建立数据中心的灾难恢复系统,来保证数据中心业务的安全性。建立灾难恢复系统的目的,是为了在灾难发生后能够以最快速的恢复数据,保证企业业务的持续稳定运
DNS容灾这里介绍如果通过dns来实现容灾,饿了么有非常多的应用,应用的用户量非常大,遍布各地。这些应用都是需要域名的,所以为了提神服务质量,构建自己的DNS体系,为饿了么的应用提供域名解析服务。DNS简单介绍DNS提供了根据域名查IP地址的服务,和常见的http协议一样,dns也是一个工作在7层的应用成协议,他使用的端口是53域名和ip之间的对应关系,称为记录(record)。根据使用场景的不同
如今,数据安全的重要对于企业单位来说已不言而喻,说到数据安全,必然绕不过容灾备份,而提到容灾备份,其中有两个关键指标必须有所了解:RTO和RPO。RTO和RPO是灾难恢复方面的重要参考指标。现在企业对业务的连续性有苛刻要求,但故障不可避免,一旦发生了故障就需要启动备份机制,确保业务的连续性,所以现在较为完善的容灾机制,RTO和RPO可以很好地反映出容灾性能如何。这两个参数是在运维过程中,一定要重点
一、灾备保护的什么?对于各行各业而言,用户数据、系统数据均是企业最核心、最重要的财富,但以下种种原因,都可能给数据带来不可逆转的损坏。只有完善的灾备方案,才能最终保障数据安全、业务连续性。 二、什么是灾备?灾备是容灾和备份的简称。灾备方案=容灾方案+备份方案。 容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换。当一
存储在线专栏文章:容灾的介绍到了最关键的一个产品,就是EMC Symmetrix。Symmetrix采用的容灾复制软件叫SRDF(Symmetrix Remote Data Facility),它是世界上第一个远程容灾软件,推出时间为1994年10月,距离今天已经19个年头了,据说已经销售了几万套license,应该不算夸张。SRDF刚开始肯定是只支持大机环境的,但今天我们只谈在开放系统下的方案。