本次博客会介绍智能运维的相关技术。
服务器运维,已经从人工运维走向自动化、智能化,因此,了解并掌握智能运维技术,是未来运维工作的重要基础。
服务器运维体系的演变趋势
随着ICT系统的规模不断扩大,设备的分散部署,业务承载量的不断上升,导致设备故障率不断变高,企业在ICT运维管理方面的投入,从人力、时间、资金上呈明显上升趋势,华为硬件的运维开发新特性,全力围绕自动化、智能化运行,如下图所示是服务器运维体系的演变趋势,
下表是各个阶段的特点
运维体系演变的阶段 | 特点 |
人工和脚本阶段 | 单机脚本、批量操作脚本、手工配置 |
工具化阶段 | 固化的部分操作,面临挑战:成功率、稳定性、性能问题、标准化、运维工作碎片化 |
自动化阶段 | 从工具中人参与多个环节演进到无人值守、流程化与标准化、需要架构层面的支撑;面临挑战:成功率、架构支撑能力 |
智能化阶段 | 根据系统的行为反馈自动的进行处理、大量的数据收集、大量的经验收集;面临挑战:数据准确性,经验格式化收集和基于机器学习的特征提取。 |
智能计算管理软件分类
如下图所示,
最底层是单机管理系统和工具,为上层管理软件提供管理能力,再上一层是基础设施的管理系统,面向基础设施层,实现服务器,存储、网络的基础措施以及虚拟化的控制和管理,最上一层是综合化管理系统,面向基础设施层和平台层的管理软件,范围更广。
板载管理
什么是BMC
单机管理工具BMC是一个独立的系统,由处理器、微型操作系统,管理软件组成可以独立工作,主要功能由远程控制、故障诊断、运行记录和电源控制,如下图所示。
集中管理
集中管理平台主要指eSight Server,eSight Server是专为企业设计的新一代的ICT运维管理系统,并且可用于管理不同的领域和不同供应商的设备,华为eSight实现了IT设备、网络设备和终端的统一管理,并支持与主流第三方管理系统的集成。eSight管理系统是一个专业的ICT全生命周期管理系统,建立在ICT安装、日常维护、优化和升级之上。
eSight提供多种功能组件。用户可以购买所需的部件,这有助于降低建设成本并保护初始投资。
FusionDirector定位为服务器的全生命周期智能运维管理软件,提供对华为智能服务器的五大管理功能,包括智能版本管理、智能部署管理、智能资产管理、智能故障管理、智能能效管理,同时提供了同时提供Redfish标准接口,便于用户集成对接,如下图所示,
运维工具
开源自动化管理工具Ansible,Ansible是一个自动化运维工具,具备配置系统,部署软件、编排负责IT任务的能力,Ansible基于SSH,不需要在被管理节点上安装自己的客户端或者组件,只需在管理工作站上安装ansible程序并配置被管控的主机IP或域名信息即可对主机进行管理,与现存的其他解决方案相比异常简洁。
Ansible的主要组成有,
Ansible:核心模块。
Connection plugins:ansible基于连接插件连接到各个主机上,ansible默认使用ssh连接到各个主机,但是也支持其它连接方式。
Host inventory:定义可管控的主机列表。
Playbooks:按照所设定编排的顺序执行完成安排任务。
Core Modules:自带模块。
Custom Modules:自定义模块。
Plugins:完成模块功能的补充。