AIOps(Artificial Intelligence for IT Operations):智能运维
前言
AIOps也就是Artificial Intelligence for IT Operations,智能化运维;这是一种运营趋势,可以很大的提高运营的能力,实现更高的价值;朝着把平凡的项目实现智能运维的目标出发吧
业务运维发展趋势
- 提升IT基础架构运营能力
基于大数据分析的思路,在IT领域运用大数据技术,更加科学高效的对基础架构进行监控,问题发现,告警与处置。 - 优化用户体验及业务运营能力
基于大数据技术,对用户体验进行全面分析,不断优化用户端到端的用户体验及业务运营能力。 - 实现智能化运营能力
通过大数据和人工智能最新技术,实现更加智慧与高效的企业运营,为社会与企业创造更多的价值。
阶段性能力要求
- 大数据运维
- 部署大数据核心平台
- IT,网络,私有云等数据接入
- IT基础设施监控及大屏
- 网络监控及大屏
- 私有云平台可视化大屏
- 统一告警平台
- 落地大数据运维基础分析
- 业务运维
- 采集用户端以及后端性能数据
- 应用拓扑实时大屏
- 真实用户体验监控及大屏
- 浏览器用户体验及大屏
- 端到端应用性能深入分析
- 企业业务管理驾驶舱
- 业务到应用到IT系统关联分析
- 智能运维
- 部署机器学习平台
- 部署深度学习平台
- IT资源规划预测
- 用户体验与用户留存预测
- 应用健康对业务影响预测
实现目标
- 跨系统
能够将多系统的数据进行统一的汇总,在相应模型的梳理下,将原本孤立的数据孤岛进行连接。 - 高效率
不再割裂的看到故障现象,能够快速的在多个表象中,理清因果关系,并将根因快速的挖掘出来。 - 高精准
最大程度的避免人为判断时引入的干扰因素,使得分析结果的可行度大大提升。也随着故障处理次数的积累,可以给出相应的处理意见。 - 面向业务
从最终也是最重要的业务角度入手,自影响业务的结果入手,不断拓展需要考虑的影响因素。在此基础上,才能真正发现业务与运维数据之间的关联性。
个例目标
- 更加主动
- 实时感知真实用户性能体验
- 借助机器学习能够进行故障预测
- 更加丰富多样的告警通知方式
- 关联性分析
- 更高效的找到问题根因
- 通过时序或逻辑,找到多个现象互相影响的关系
- 将告警进行关联后, 减少人为筛选无用或重复信息的成本
- 更加紧密连接业务
- 从业务视角切入,更直接的支持业务提升
- 通过大数据技术,打通多个业务之间的数据孤岛
- 更好体现IT部门在公司中的价值
- 高效呈现
- 大屏、报表、报告、 API多种呈现方式,灵活多样
- 大数据技术,使得实时数据呈现成为可能
- 在同面积视野中,呈 现更多维度的信息
总结
看完大家是不是对AIOPS了解更深刻了呢,即使是微不足道的项目,我们也可以从大数据运维出发,不断沉淀数据,做好业务的运维,再向智能运维出发,实现高价值的运维能力。