原文出处:嘉为蓝鲸服务号  资料下载:​​点击这里​

参加过赵海兵老师往期直播的朋友应该已经知道,我们在上次分享了一份《运维体系指南》,建议构建智能化敏捷运维体系。如果还不了解为什么要建设这套体系的朋友,​​可以查阅​​。

智能化敏捷运维体系这个概念,它主要分为两个层面:敏捷、智能化。嘉为是在国内最早一批提出智能化敏捷运维的公司,相信大家在之前也听过很多运维相关的方法论,比如说自动化运维、智能化运维、AIOps、数据化运维、SRE、ITIL4等等。而智能化敏捷运维体系是我们在这些通用的运维方法论基础之上,做了相应的融合、抽象、提炼,并结合国内运维现状及未来趋势所提出的概念。

由于现在业务和IT架构变化越来越快,运维也需要越来越敏捷,而智能化是我们能看到的未来最高阶的阶段,即AIOps。不过个人认为,其实智能化并不一定是敏捷的尽头,只是就当下来说,智能化是我们能看到的最远尽头。

本期直播,我们讲述如何循序渐进的构建智能化敏捷运维体系4.0,将围绕四个部分进行展开:什么是大家认可的好运维体系、什么是智能化敏捷运维体系、构建智能化敏捷运维体系4.0、案例分享《某万亿中型银行规划示例》。

点击查看直播精彩回放:​​如何循序渐进,构建智能化敏捷运维体系4.0​


一、国内外权威机构认可的运维体系都有哪些?

1、ITSS数据中心服务能力成熟度模型

ITSS《数据中心服务能力成熟度模型:服务能力框架(2016)》是国内的权威通用标准,从下图得知,该标准对运营保障的管理和场景很重视,对组织治理也列出了相应的要求规范,但是没有提及工具。

它的成熟度模型分为不存在(0级)、起始级(1级)、经验级(2级)、规范级(3级)、量化级(4级)和优化级(5级)。基本上有一定规模的企业,都已经处在规范级这个级别,即有了一套规范、拥有不少工具、存在一些沟通机制,也构建了具体的管理制度和流程,整体的各个要素日常都能发挥基本的作用。简而言之,就是该有的都有了,但各个部分和要素能够进步和优化的空间还很大。

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_人肉运维

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_运维_02

ITSS成熟度模型分级描述,​​点击下载完整版资料​

2、Gartner:I&O成熟度模型

Gartner IT Infrastructure and Operations Maturity Model(以下简称I&O成熟度模型)是Gartner早在2010年左右提出的,虽然提出的时间较早,但理念并不落后。从下图可以看出,I&O成熟度模型所分级别跟国内ITSS的成熟度模型有些类似,分别是:无认知型(级别0)、有认知型(级别1)、被动回应型(级别2)、积极主动型(级别3)、管理型(级别4)、高效型(级别5)。

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_自动化运维_03

而且,尤其是I&O成熟度模型的后三个阶段与ITSS成熟度模型的后三个阶段描述很相似,只是国内的ITSS标准是从要素等一些较为抽象的元素进行定义,而I&O成熟度模型的阶段描述更为具体化。


3、Gartner对于ITSM的分级

在近几年,Gartner对于ITSM也进行了分级。在国内的ITSM分级是按ITIL1、ITIL2等版本进行分级,自身流程是属于哪个ITIL版本进行规划建设的,就属于哪个级别。但其实ITIL2、ITIL3、ITIL4其实不适合作为评判一个流程优劣的标准,因为用ITIL4去做的不一定比ITIL3等更好,这当中需要考察的因素很多。

Gartner是依据ITSM落地所能达到的成果来进行分级,分为基本ITSM、中级ITSM和高级ITSM。

基本ITSM:具有核心ITSM功能,例如事件、请求和变更管理;实现与ITOM解决方案的有限集成。

中级ITSM:具有广泛的ITSM功能,例如配置、问题和服务级别管理,并提供一些基本的ITOM功能或与中级第三方ITOM解决方案集成。

高级ITSM:具有全面的ITSM功能,提供高级工作流支持,以及越来越多的AITSM和协作功能。它们还原生提供广泛的ITOM功能或与先进的第三方ITOM解决方案集成。


现在的ITSM,更多的还只是作为一个审批功能,在很多企业都尚未实现结构化,仍处于文本或描述性质的层面。这样的ITSM,在运维工作的流转效能和自动化衔接等方面其实还是有较大弊端的。

因此,有些企业提出把一些字段进行结构化,把数据和告警功能接进ITSM里,这样确实能解决基本层面的数据流转、数据融合和结构化的问题。能做到这样的企业,已经很有想法了,不过还不太够。因为对于运维来讲,应该是把流程作为一个核心枢纽进行展开的。比如一个应用系统的版本发布,到底是应该围绕工具展开,还是围绕版本的管理过程展开呢?答案显而易见,应该围绕版本的管理过程展开,但也需要跟工具有所连接。


4、ServiceNow:IT自动化成熟度模型

ServiceNow是一家IT巨头,也是国际知名的运维SaaS公司。在2021年,它发布了IT自动化成熟度模型,这个模型分为四个阶段:被动的、主动的、前瞻的、动态的(详见下图)。很多人可能会有疑问:为什么在前瞻阶段,面向服务的管理就比主动阶段要高级了呢?明明主动阶段就已经囊括了运维管理和基础设施监控等一系列主要的工作,并且还有较多的自动化实践了呀?

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_自动化运维_04

▲ ServiceNow IT自动化成熟度模型

面向服务的管理,指的是将IT作为一种服务整体提供给业务单元,服务的目标是确保业务单元的稳定性和可靠性,至于为了达到这个目的的到底用的什么工具,可以灵活调整。因此,在这个阶段的企业意味着开始真正的贴近客户了,开始清楚客户的服务需求,不再是以内部运维的视角去决定采用什么工具。尤其是站在业务单元的视角,建设的那一堆工具很难看到直接的价值,在他们眼里都是成本和花销,而真正能让业务方感受到价值的是所提供服务的及时性和可靠性。


于是,我们参考上述这些国内外权威的标准,并结合自身多年服务客户的实践和沉淀,总结了“关于什么是好的运维服务管理体系“的核心观点:

  • 好的运维体系一定从业务和客户出发,并回到业务与客户,这是价值源头。
  • IT服务管理是运维体系的主轴与核心,是对外价值窗口和对内能力汇聚点。
  • 运维技术与工具的未来是智能化,但将在自动化阶段停留很长时间,直到完成运维数据和全链条、全场景自动化能力的积累。
  • IT服务管理的下一个阶段是高速ITSM,是实现与运维工具充分融合,包括:流程、数据与、执行与度量;再往后是AITSM,智能化流程。
  • 运维体系建设过程中,需要统筹考量四大能力要素:平台工具、敏捷流程、数据驱动、数字度量。

大家如果能够把这五个点考虑进去并落地,相信建设一套比较好的运维体系不成问题。


二、什么是智能化敏捷运维体系?

这部分在上次的直播回顾中讲述得更为详细,​​可点击查看​​。

先简要说明下,我们把智能化敏捷运维体系分为四个阶段:规范化运维、自动化运维、敏捷化运维、智能化运维。参考ITIL4里的定义,企业运维体系有四个要素:组织与人员、信息与技术、价值流与过程、伙伴与供应商。通常来说,关注较多的是前三个(PPT)。

围绕PPT建设企业敏捷运维管理体系,拆分下来最上层为价值流与流程,关注以业务运维价值为核心的敏捷运维管理实践;其次是信息与技术,关注以智能化为方向、平台化为支撑的运维技术体系;最底层是组织与人员,关注以用户和业务支撑为中心的敏捷运维组织。

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_人肉运维_05

▲ 围绕PPT建设企业敏捷运维管理体系

三、循序渐进地构建智能化敏捷运维体系4.0

让我们再回头看一下一开始说到的ITSS数据中心成熟度模型,智能化敏捷运维体系的1.0阶段规范化处在的是该成熟度模型的3级规范级,自动化和敏捷化处在成熟度模型的4级量化级,智能化处在5级优化级(见下图)。从自动化到敏捷化非一蹴而就,是需要时间和经验沉淀的。

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_自动化运维_06

ITSS成熟度模型对照,​​点击下载完整版资料​

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_人肉运维_07

Gartner I&O成熟度模型对照

我们在实现自动化向敏捷化过程中,不仅仅只是需要工具和流程层面,还需要考虑数据层面和度量层面,这样才能够建立一个由价值驱动的IT服务管理体系。在敏捷阶段,我们希望看到体系为客户提供的各种各样的服务,而不再时常感知到工具,工具只需要在背后默默工作即可。

最后,老师分享了一个中型银行从规范级(1.0)到自动化(2.0)的案例,我们帮助客户解决他们在运维工具建设、运维流程管理、业务支撑与风险管理各方面的问题和痛点,拉通并提升运维能力到运维价值的过程,十分具有借鉴意义,可关注我们的公主号--活动中心--如何循序渐进地构建智能化敏捷运维体系4.0--申请观看

嘉为参考国内外各大标准体系,提出了智能化敏捷运维体系4.0这个概念,因此它跟这些标准是吻合的,且也符合国内企业的实际情况。这个体系分为四个阶段:规范化、自动化、敏捷化和智能化,每个阶段都有相应任务以及具体成果考核的关键点。我们认为,目前国内还是以自动化和敏捷化为目标落地较为贴合实际,智能化尚需要等待一定的时间。

企业该如何构建智能化敏捷运维体系4.0呢?要点都在这了_人肉运维_08