文章目录

  • 概述
  • 监控
  • 监控系统的3个阶段(Gartner)
  • 分析
  • 利用数字体验监控和服务模型,通过客户参与展示对业务的影响
  • 名词解释



文章目录

  • 概述
  • 监控
  • 监控系统的3个阶段(Gartner)
  • 分析
  • 利用数字体验监控和服务模型,通过客户参与展示对业务的影响
  • 名词解释


概述

监控

1.到 2023 年,由于在越来越多的云原生 IT 环境中与客户脱离接触,依赖“正常运行时间”指标的监控实践将抑制 90% 的转型计划。
2.监控实践的转型:

  • 变化:企业使用云资源来进行数字化转型,IT监控仍然沉浸在传统实践中
  • 单体的IT架构时代,通过IT资源监控就可以表现业务价值;
  • 企业使用越来越多的Serverless,MicroService,事件驱动架构等
  • 除了监控之外的其他能力都已经领先了
  • I&O更开始关注性能,而不是资源利用率和可用性。

监控系统的3个阶段(Gartner)

可用性 --> 性能 --> 效率
目前处在第二阶段

可用性

性能

效率

聚焦

资源

服务

交易

能力/关键

依赖指标

端到端的用户

分析

交流重点

IT

应用

数字化业务

结果

改进更新,孤立的行动

提升用户体验

商业赋能

分析

大多数企业的IT运营报告都以CPU或内存利用率的粒度展示IT资源消耗,作为性能度量。使用指标来证明IT设备的可用性作为生产率的度量很容易,但不一定有用。

上述方法的挑战是,根据不断发展的IT体系结构、业务实践、流程和文化变化,可用性不能很好地度量IT对业务的持续影响。在以实体为中心的级别上使用资源消耗可以提供IT设备在那个精确时刻是如何运行的指示,但是它失去了对客户和业务的影响的关注,特别是在定义的时间段内。遗留实践未能解决诸如IT是否交付了其设计目的,是否帮助实现了所需的敏捷性,以及是否有改进的机会(例如,发展和转换业务)等问题。

简而言之,在数字化时代,可用性的衡量并不能很好地反映IT的有效性。跨业务和IT的动态发展需要不同的目标。

监控性能指标 监控的性能_客户体验


客户视角——测量和报告以客户为中心的度量,以增强客户参与为目标。例如,用户在某个应用程序和/或购物车上花费的平均时间转换或放弃(参见“如何构建理想的性能监视仪表板”)。

业务视角——开始构建IT和应用程序构件的逻辑组的服务映射,其目标是对以工作负载为中心的监控进行优先级排序,从而更容易地映射对业务的影响(参见“2018年IT服务管理战略路线图”)。例如,在线银行门户涉及一组应用程序和系统,这些应用程序和系统被绑定在为最终用户提供的简化界面下。图3概述了构建服务映射所涉及的步骤。

IT 视角 — 继续在实体级别捕获指标,目的是保留诊断和故障排除的能力,而不是在 IT 外部共享。 I&O 领导者必须将服务级别模型和以实体为中心的指标保留为内部 IT 工件。

监控性能指标 监控的性能_IT_02

利用数字体验监控和服务模型,通过客户参与展示对业务的影响

与转向基于性能的监控实践相一致的下一阶段是将运营指标与业务影响联系起来。服务模型提供了 IT 和该服务的消费者之间的映射。服务中的任何降级都会影响客户体验。
I&O 领导者应该使用基于服务模型的结果,在更接近业务功能的级别上通过 IT 的各个层来传达影响的传播。这可能是一个好的开始。例如,在线银行门户被客户视为单一界面。然而,架构很复杂,性能异常的传播也是如此。它是多种应用程序和基础设施元素的混合体,包括核心银行系统、数据库、中间件、存储系统、验证系统和欺诈管理。一开始就将其建模为单一指标相当复杂;但是,它可以逐步开始,一次针对一个应用程序架构。在整个过程中,与相关业务领导者合作,并在逐渐提高的抽象级别上分享关键绩效指标 (KPI) 的演变。
为了衡量客户体验,I&O 领导者必须利用数字体验监控 (DEM)。该指标可以与客户视角相关联,以确定绩效对客户参与度的影响——例如,客户花费的平均时间,或使用网络分析进行使用跟踪。 (请参阅“客户体验的投资回报率始于客户成果,止于业务成果。”)

创建服务模型后,I&O 领导者应采用这种三阶段方法来提供有关 IT 如何影响业务的关联,在业务和 IT 之间建立重要的桥梁:

通过 DEM 监控客户体验。

捕获客户参与度指标,例如参与量、财务结果和生命周期价值。

将客户体验和客户参与度与一致的 IT 服务的性能相关联,以深入了解 IT 性能对客户的影响。

数字化以客户为中心。最终用户指标、以应用程序为中心的指标及其与架构中其他元素的关系的组合使 I&O 团队能够将服务分类为各种业务功能。他们还可以将从所有系统获得的低级指标分组为与业务相关的高级指标(参见图 4)。通过这种方法获得的指标使 I&O 领导者能够报告业务 KPI(请参阅“如何建立对业务领导很重要的 I&O 指标”)。

监控性能指标 监控的性能_IT_03

名词解释

以应用为中心
从应用程序角度查看资源需求(例如 CPU、内存、存储、带宽)。以应用程序为中心的指标旨在衡量应用程序无错误运行的资源需求。
可用性
用于传达 IT 资源或服务功能的二进制指标。该指标很少说明相关资源或服务的不良运作(请参阅性能)。
以顾客为中心
在监控的上下文中,这是关于旨在衡量通过性能对 IT 服务的最终用户的影响的指标,如真实用户资源和/或使用相关 IT 服务的结果的用户体验所感知的.
数字化
数字化是使用数字技术来改变商业模式并提供新的收入和价值创造机会。这是转向数字业务的过程。
最终用户
关键绩效指标MTTR
IT 服务的用户。这可能包括代表用户使用服务的公司或代理的客户或员工。
关键绩效指标:测量用于识别和量化业务绩效。
平均修复时间:故障发生后进行修复所需的时间。也就是说,它是在给定过程中进行干预所花费的时间。
以实体为中心
这里的重点是单个 IT 实体,例如 CPU、内存、存储和带宽。在监控环境中,指标旨在衡量可单独识别的实体的资源利用率。

表现
在预定义的阈值内测量系统,该阈值的级别被理解为正确使用所讨论的 IT 系统是可以接受的。任何低于此阈值的系统都被称为“不可用”。
服务地图
IT 和应用程序工件的逻辑分组,其中该组可以与可识别的服务相关联,以使用户能够执行预定义的活动。根据 IT 服务,代表服务的模型可以是单个应用程序或一组捆绑的应用程序。
服务水平协议
服务级别协议:服务提供商与其内部或外部客户之间的合同,其中记录了提供商将提供的服务并定义提供商有义务满足的服务标准。
临界点
阈值是与统计数据(轮询数据)相关联的值。为该统计收集数据时,会将其与关联的阈值进行比较。如果采集到的数据值不符合阈值,则表明此类数据可能导致设备或网络性能不佳。
以工作负载为中心
工作负载是消耗基础设施资源的动态系统,包括 CPU、内存、存储和带宽。 所讨论的动态系统的感知方式因上下文而异,可以包括在多个 IT 系统、操作系统、数据库、应用程序或其组合上运行的作业。 在这种情况下,指标旨在衡量基础设施资源需求(例如 CPU、内存、存储和带宽),包括工作负载(例如操作系统、数据库、应用程序或组合)的无错误运行的趋势。