大型网络维护中的应急管理计划制订原则---简单实用,避免形式主义
 
 
 
一个运营商的主机系统的稳定、可用、关系到运营商的社会形象,在营业高峰宕机,损失是可以用金钱来衡量的。
一个大型运营商的信息中心,刚进行完安全审计、风险审计。完善了应急方案。又召开了内部的应急方案评审。可谓充分重视,应急方案表面上也无懈可击。
大家正要把这一段工作完美收关的时候,发生了代理全省业务的主机系统宕机55 分钟的重大事故。再拿来应急计划仔细研究其主要内容,在看了若干篇后,终于看到了具体的处理步骤:
(1)        值班人员确认发现的问题是属于一级应急问题,立即向本部门领导汇报,请求本部门支持解决。
(2)          值班人员立即向现场总值班汇报。
(3)          现场总值班确认后立即向部门领导和上级领导汇报。
(4)          现场总值班立即通知应急处理小组负责人。
(5)          。。。。。。。。。。。
(6)          。。。。。。。。。
(7)          。。。。。。。。。。
 
一、如此应急计划,怎么能够应急,出了问题,第一个先报告领导,领导在考虑几分钟后,再报告领导的领导,我个人觉得只有在国企背景的企业会这样,领导就是一切,如果领导是专家出身也好,如果领导什么也不明白,那告诉他是否反而增加了响应的时间。拖延了解决问题的速度。飞机马上要失事了,驾驶员不去处理问题,要报告领导吗?请示怎么处理问题吗?
  二、致命的问题是串行工作,为什么不并行工作。
      应急时主要的关键的约束条件是时间,如果出现重大问题,你能够在10分钟内解决,该奖励的;如果55分钟解决,那么该下岗了。
  三、看来的重新研究应急计划的流程了。简单、实用。避免形式主义。避免在关键路径上浪费时间,确定关键依赖关系,用网络图来分析一下,能够并行的,就不要串行,真正应急。
      真的希望所有的应急计划不是写给领导看的。
      简单实用。避免所谓的专家的误导。