我来答答题:

数据中心运维可以分为两大类,其一是基础设施运维,其二是基础环境运维(IaaS类)

下文逐步分解:

一、基础设施运维:

1.1机房管理方面:

1.1.1机房人员出入管理(管理工具如:出入人员管理流程含出入申请审批等)

1.1.2机房设备出入管理(管理工具如:设备出入申请,设备双电要求最重要的是机房设备台账)

1.1.3机房承重(通过控制入室设备重量可以降低承重风险)

1.1.4机房环境温、湿管理(通过巡检记录加以管理)

1.1.5机房电力管理(通过巡检记录加以管理)

1.1.6机房的监控管理(通过进出机房人员的数量与1.1.1章节内的人员出入做比对)

1.1.7机房线缆管理即网线(含存储线等)、光纤和电源线管理(其内容主要围绕着横平竖直,捆扎带松紧,电源线长度预留等)

执行以上内容的人员素质不需要很高,但是,注意,管理以上执行者的领导(领队、带头人)在选择时至关重要。

在关于机房基础设施的内容中往往会出现对基础设施的变更的操作,如,因业务需求在机房内放置了超过机房设计时规定的功率的设备,这个时候就需要协调机房方面对机房相关区域进行基础环境改造的工作,在改造完毕后设备进入运行过程中,一定要时时关注设备的运行状态,特别是注意设备运行的温度,我在工作中就出现过因为“认为环境变更完毕后”就可以放心使用的情况,结果出现设备温度高导致的一系列的联动反应。

在工作执行中,本着不需要执行者“动脑”作为工作原则,即,制作完美的SOP,完整的交接班制度和可落地的工作流程及问题处理流程即可驱动,在此需要明示的是,注意执行者本人的工作素质,在项目中不要过于放手,要建立阶梯式管理机制(即,一个人最多管7七个人)必要时,或者成本可以控制时,可以采用一班两岗的工作模式,避免因为人员失误导致错误操作和漏报的情况,特别是在处理服务请求中的更换硬盘、内存、电源等等工作

PS:特别注意夏天,空调工作效率会降低,注意,撰写应急预案

1.2机房容灾方面

制定机房应急预案,其中重点包括但不限于,空调故障时应急预案,单路电力故障时应急预案,环境温湿度高时应急预案等

二、基础环境运维:

基础环境运维实际可以分为周期性工作和非周期性工作,指导思想来自ITSM(itil)

名词解释:

周期性工作

服务请求

事件处理

变更管理

问题-风险跟踪记录

2.1 周期性工作

所谓的周期性工作,指的是周期的、重复的工作,比如:配置备份、账户回顾、配置回顾、更新各类系统的操作手册等等。别小看周期性的工作,其实它是运维工作权值较高的工作内容,怎么将周期性的工作合理而有效的运转起来呢?我们工作中将周期性工作纳入运维日历,将重复性的工作条带化规范化,通过制作SOP,检查SOP执行情况,执行团队反馈SOP使用情况,跟进SOP优化情况,进行周期性的、重复性工作的执行指导。 ----以上内容不知道有没有说透,要是没有请留言。

2.2非周期性工作(主要含服务请求、事件处理、变更管理、问题-风险跟踪记录)

本章节内容,主要围绕着流程、SOP、PDCA进行展开,那么咱们现在需要名词定义

定义,服务请求、事件处理、变更管理,问题-风险跟踪记录,如果学习或了解过ITSM的工程师对以上的名字并不陌生,我也是,我认真的学习过上面的内容,我的同事、朋友也学习过,但是我们在针对以上名词进行探讨的时候却发生了很大的奇异,所谓的奇异就是我们各自理解的不一致,而且这个现象困扰了我们很久,举个例子,领导让我在AD上创建一个账号,让我来做时,这个操作其实是很简单的,但是我应该走什么流程呢?

“执行者不需要动脑子”,通过这句话我恍然顿悟了,边界不清那么咱们就定义边界,怎么定义呢,这时候就引入了工作分类表,就是说,将运维工作量化,制作服务请求分类表,事件分类表,变更分类表,然后按照机房管理的内容照章工作即可----以上内容不知道有没有说透,要是没有请留言。

上面的内容,如果搜索ITSM或者ITIL都会有非常多的内容,而且内容相对是便于理解的,但是,咱们在此需要认真的讨论什么ITIL到底对我们来讲带来了什么好处,他的介入对运维工作来讲解决了什么问题?

下面章节,以本人对该内容的理解及经历,尽力描述:

------------------------------------

以上工作其实都是基础性的工作,一般来讲,招聘一般的工程师就可完成,但是领导(牵头人,主管)需要懂以上工作并且有较高的工作能力和协调能力。

运维工作远远不止以上内容,而且,我一直认为,运维工作与项目工作是不相伯仲的(之前有很长一段时间是看不上运维工作的),而且,能干高级运维经理的人一定能干高级的项目经理,但是反过来就不一定可以了

以上内容2018年5月8日更新

若有需要请提出,作者会进行优化

感悟:技术不是万能的,学会低调、圆滑的处世才是真正的本事

----------------------------------------------