一提到高可用性,你最先想到的是什么?一般的技术人员肯定会首先想到双机热备这种方式。但是,双机热备只能解决服务器或存储设备本身的可用性问题,而不能完全解决IT基础设施整体的高可用性问题。万国数据副总裁、专业服务部总经理张权表示:“如今,企业对IT的依赖程度越来越高。为了保证企业IT基础设施的高可用性,企业需要一套完备的IT高可用性管理方法论。”
  经过三年的研究,万国数据终于在2012年7月推出了首套IT高可用性管理体系。“IT高可用性管理体系不是一个具体的产品或工具,而是一套成熟的方法论。企业的CIO可以借助这套方法论,对自己的IT基础设施进行评估,从而找出管理上的漏洞,然后再通过一系列的调整和优化,最终提高整个IT系统的可用性,并保证业务的连续性。”张权表示。
  需要一套方法论
  张权给出了IT高可用性管理的定义:以企业业务要求的IT系统的可靠性与稳定性为管理目标,通过对可用性关键要素,如基础设施、IT系统架构、灾难恢复、安全、运维管理、人员等进行综合管理,同时依照指标体系持续地改进技术与管理,满足企业业务的发展需求。在这个定义中,有几个关键要素值得关注:第一,IT高可用性管理必须以满足企业业务的需求为宗旨;第二,IT高可用性管理不是仅仅针对数据中心基础设施或IT系统,还要管理和协调许多方面的内容,比如运维管理、人员等;第三,IT高可用性管理需要一套指标体系作为支撑,只有这样才能对IT基础设施的可用性进行定量的分析,从而为进一步的调优打下基础。
  “万国数据首次提出了适用性的概念,强调可用性的建设应该围绕业务发展展开,同时还明确了可用性建设的H3A理念,即高品质、高效益和高安全。”张权表示,“我们在制定IT高可用性管理的指标体系时,参照了国内外许多相关的行业标准,比如ISO20000、ISO27001、BS25999等。在实践中,我们提出了一套可操作的评估方法,并将IT高可用性管理这套方法论用于万国数据自己运营的15个数据中心,取得了非常好的效果。”
  高可用性是关键
  上海某基金公司虽然拥有一个规模庞大的数据中心,但是管理人员只有3个,这使得其数据中心的管理捉襟见肘,IT设备经常出现故障。一家IT服务商曾经建议该基金公司更换一套价格高昂的监控系统。张权介绍说:“万国数据的服务团队按照IT高可用性管理的方法论,帮助该基金公司对IT基础设施进行了重新评估,设定了高可用性管理目标,并参照相关指标体系对IT基础设施的建设、运维和管理进行调整和优化,从而减轻了该基金公司的IT管理负担。”
  有些人可能会将IT高可用性管理与业务持续性管理(BCM)、IT基础架构库(ITIL)混淆。BCM是从灾难恢复的概念引伸而来,主要解决的是在灾难发生后如何尽快实现业务恢复的问题,应急管理是其中很重要的一个环节。IT高可用性管理与BCM在某些内容上虽然有交叉,比如都有灾难恢复管理的内容,但是IT高可用性管理强调的是对整个IT基础设施进行综合管理,而不仅仅局限于灾难恢复。ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。张权表示:“ITIL解决的是企业IT运维流程管理的问题,不能从根本上解决IT高可用性的问题。”
3 上一篇  
高可用性管理:企业IT的“试金石”_万国数据 放大