本次博客会介绍智能运维的相关技术。
服务器运维,已经从人工运维走向自动化、智能化,因此,了解并掌握智能运维技术,是未来运维工作的重要基础。

服务器运维体系的演变趋势

随着ICT系统的规模不断扩大,设备的分散部署,业务承载量的不断上升,导致设备故障率不断变高,企业在ICT运维管理方面的投入,从人力、时间、资金上呈明显上升趋势,华为硬件的运维开发新特性,全力围绕自动化、智能化运行,如下图所示是服务器运维体系的演变趋势,

zabbix 智能运维 智能运维关键技术_zabbix 智能运维


下表是各个阶段的特点

运维体系演变的阶段

特点

人工和脚本阶段

单机脚本、批量操作脚本、手工配置

工具化阶段

固化的部分操作,面临挑战:成功率、稳定性、性能问题、标准化、运维工作碎片化

自动化阶段

从工具中人参与多个环节演进到无人值守、流程化与标准化、需要架构层面的支撑;面临挑战:成功率、架构支撑能力

智能化阶段

根据系统的行为反馈自动的进行处理、大量的数据收集、大量的经验收集;面临挑战:数据准确性,经验格式化收集和基于机器学习的特征提取。

智能计算管理软件分类

如下图所示,

zabbix 智能运维 智能运维关键技术_运维_02


最底层是单机管理系统和工具,为上层管理软件提供管理能力,再上一层是基础设施的管理系统,面向基础设施层,实现服务器,存储、网络的基础措施以及虚拟化的控制和管理,最上一层是综合化管理系统,面向基础设施层和平台层的管理软件,范围更广。

板载管理

什么是BMC

单机管理工具BMC是一个独立的系统,由处理器、微型操作系统,管理软件组成可以独立工作,主要功能由远程控制、故障诊断、运行记录和电源控制,如下图所示。

zabbix 智能运维 智能运维关键技术_Ansible_03

集中管理

集中管理平台主要指eSight Server,eSight Server是专为企业设计的新一代的ICT运维管理系统,并且可用于管理不同的领域和不同供应商的设备,华为eSight实现了IT设备、网络设备和终端的统一管理,并支持与主流第三方管理系统的集成。eSight管理系统是一个专业的ICT全生命周期管理系统,建立在ICT安装、日常维护、优化和升级之上。

zabbix 智能运维 智能运维关键技术_zabbix 智能运维_04


eSight提供多种功能组件。用户可以购买所需的部件,这有助于降低建设成本并保护初始投资。

FusionDirector定位为服务器的全生命周期智能运维管理软件,提供对华为智能服务器的五大管理功能,包括智能版本管理、智能部署管理、智能资产管理、智能故障管理、智能能效管理,同时提供了同时提供Redfish标准接口,便于用户集成对接,如下图所示,

zabbix 智能运维 智能运维关键技术_运维_05

运维工具

开源自动化管理工具Ansible,Ansible是一个自动化运维工具,具备配置系统,部署软件、编排负责IT任务的能力,Ansible基于SSH,不需要在被管理节点上安装自己的客户端或者组件,只需在管理工作站上安装ansible程序并配置被管控的主机IP或域名信息即可对主机进行管理,与现存的其他解决方案相比异常简洁。

Ansible的主要组成有,

Ansible:核心模块。

Connection plugins:ansible基于连接插件连接到各个主机上,ansible默认使用ssh连接到各个主机,但是也支持其它连接方式。

Host inventory:定义可管控的主机列表。

Playbooks:按照所设定编排的顺序执行完成安排任务。

Core Modules:自带模块。

Custom Modules:自定义模块。

Plugins:完成模块功能的补充。

zabbix 智能运维 智能运维关键技术_Ansible_06