首先,整体上看,网路是一个系统,我们的目的是保证它的正常运行,不能出问题,如果出了问题,有快速有效的拯救方案。

那么该如何做呢,总结前人的经验,概括为一下四点:

备份管理,为了保证正常,冗余备份是基本的思想,冗余是体现在了网络设计之中了的。而备份就需要运维人员来做了。大致分为两个层面:

1.软件层面:配置文件,系统(如IOS),补丁文件,维护工具软件,软件license,等等。

2.硬件层面:整设备,设备部件(如路由器的模块,服务器的硬盘等),拓扑图,互联关系列表,原始设计文档等(这些体现的是硬件之间的物理和逻辑关系,必不可少)。

变更管理,与备份管理类似,变更的主体也是。

1.软件层面:更改配置,升级系统,打补丁....

2.硬件层面:新增设备,替换设备,连接关系变化,topo变化.....

对于这要做的就是做好变更的记录,要有change request,关键点是:变更前备份,应急rollback plan.

状态监控,完成设备状态,网络性能的日常监控

使用基于SNMP等的网络管理软件,(很可惜我现在还用不上(⊙o⊙)…) 。

日志的记录和分析(日志服务器等)

故障的报警(发送邮件等)

安全管理,这就像给整个网络加一个保护罩,其实这么说不是很确切,因为,据说大多的网络是安全问题都出自内部...而且现在的安全措施大都融合到系统之中了的,独立于系统的单独的安全措施越来越少。

firewall、×××、IPs

访问控制、AAA

在我看来,运维管理,其实就是状态变更的管理,以时间为轴,状态的点构成了一条线,变更是线的转折点。备份管理是对状态的记录,而变更管理是对状态变化的记录,日常监控是对状态的监控。

网路运维模型之我见----状态,变更_运维模型

备份就是对每条线都做一个记录。
变更就是使接下来的线移动位置,变更管理就是记录如何移动的,如果移动不成功,如何移回去。
日常监控就是看它是不是走的直线,如果拐了就报告。
安全是保证影响他移动的因素是我们自己。

菜鸟浅见,敬请拍砖!