信息系统和业务的持续性很容易受到自然和人为的攻击,因此,组织必须经常对潜在的业务破坏做出规划并经常对自动系统的恢复规划进行检测。在系统的备份与恢复方面,一项主要的工作就是对数据库的备份和恢复,而这些知识已经在 2.4.2节中进行了详细介绍,在本节中就不再重复。
持续规划
对于恢复规划人员来说,需要进行下列工作
(1)建立一个恢复规划的实施所需要的工程组以及相应的支撑基础设施。
(2)实施对攻击行为以及风险的管理评估,从而识别其是否是恢复规划所需解决的问题。
(3)实施业务影响分析,用来判定业务的时间急迫性以及确定最大可忍受停工期
(4)恢复规划的保存和实施。
(5建立并采取一种可实施的测试和维护策略
在现代组织中,由于组织的重构、人员的变动、竞争环境的改变等,导致持续性规划各部分之间的相互依赖性发生变化。每次组织的结构发生变化,持续性规划必须进行相应的改变,这种相互依赖性也需要进行重新评估。
持续性规划本身也应该看作是一个流程,而组织范围内的持续性规划流程主体框架主要由4部分组成。
(1)灾难恢复规划(Disaster Recovery Planning,DRP)。详细描述发生人为破坏或自然灾害时对各种潜在危害组织的事件所采取的特殊步骤,其中内容包括认识与发现、风险评估、缓解、准备、测试、响应和恢复。
(2)业务恢复规划(Business Resumption Planning,BRP)。主要包括紧急事件处理资源需求、规划开发、规划实施、质量保障和变化管理。
(3)危机管理规划(Crisis Management Planning,CMP)。帮助组织发展一种有效而且高效的紧急事件以及灾难响应能力。
(4)持续可用性(Continuous Availability,CA)。将组织的支撑基础设施的正常工作时间维持在99%甚至更高。
对于持续性规划来说,需要有一个有效的衡量手段作为其流程的完善和补充,这些手段通常有:
(1)在组织中的热点领域投入了多少资金?
(2)有多少人员致力于持续性规划活动?
(3)对热点领域的测试是否取得了成功?
而现在焦点问题应放在测量持续性规划流程对组织的整体目标所作的贡献上,这样做的好处主要有如下几方面。
(1)识别持续性规划发展中的重大事件
(2)为任务的实施建立一个基础标准。
(3)增强持续性规划的实施。
(4)为管理者成功地管理预期事件建立一个有力基础。
为了衡量持续性规划流程,可以使用持续性规划平衡记分卡,包括价值综述、价值计划、持续性规划风险度量标准、执行协议和有效方法。在平衡记分卡中,组织需要确定持续性规划流程的远景目标。远景目标的确定需要同组织的高级管理以及持续性规划流程基础设施的发展相协调。一旦确定了远景目标,持续性规划流程发展人员就可以勾画出持续性规划流程改进中的关键成功因素,其中包括增长及改革、顾客满意度、员工情况、流程质量和财政情况。在持续性规划流程改进中可以进行评测的持续性规划流程组件包括流程方法论、DRP 文献、BRP 文献、风险管理计划文献、紧急情况响应计划文献、网络恢复计划文献、组织普查的持续性员工意识培养情况、恢复变更的费用、持续有效性的基础设施和正在进行的测试计划。
灾难恢复规划
灾难恢复是将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。灾难恢复规划的执行速度主要依赖于系统的重要性,系统越重要,所需的时间越短。一旦灾难发生,业务组的首要任务就是尽快恢复关键系统并尽可能小地减少对关键系统的影响,同时灾难恢复规划开始实施。灾难恢复规划的第 1个目标就是阻止进一步的破坏,即首先是保证人员的安全。然后恢复规划可分为三个部分,分别是清扫被破坏的区域(抢救或修复)实施变更的业务运行、返回到正常的流程。其最终的目标是业务运行能够恢复到正常的未破坏之前的状态。为了提高有效性,灾难恢复规划必须进行存档记录。
信息系统的危机处理及灾难恢复主要可以分为下列几种
(1)与日常生产及运行息息相关的关键性系统。未经预先计划的停顿可能引致灾难性后果的系统,例如证券交易系统、航空控制系统等。这种系统一般应拥有高度自动恢复的能力,使系统出现故障时可以迅速继续运行,并且通常会在另一个区域内有全面的而数据会不停地更新,确保出现问题时能迅速地转由后备系统继续保持不间后备系统,断的运行。
(2)部分机构的重心系统,也会采用类似的架构,但限于同时保持两套系统同步运行不但技术难度高,系统昂贵,而且通信也是大难题。折中方法是容许常规和后备系统有时间上的差异,数据不一定完全同步,后备系统需要若干时间才能上线运行,但一般
情况下是足够应用的。(3)在另一地区设立规模较小但架构相同的系统,使用离线的方法,例如使用磁带复制常规系统后再注入后备系统中。这种方法类似于离线备份,好处是不需要在紧急时刻再寻找后备服务器和为设定系统费心,特别是较复杂的专用服务器的系统设置需要耗费很长的时间,能够进行预先准备可以减少很多麻烦(4)最基本的灾难恢复当然是利用备份工具。包括磁带、磁盘和光盘等,根据所需备份的数据量来进行策划。