做为企业的信息核心,机房的重要性非常突出,一旦发生影响正常使用的问题,那么在解决问题之后,写一份详细的事故报告就是非常重要。通过这份报告,一方面会追究责任,找出是如何造成的原因,另一方面引以为戒,避免日后再发生类似的问题。事故报告相当于生产企业的安全通报,大家都详细了解问题发生的原因,以后才能避免,大家也能够引起重视。<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />



 



首先写这份报告的应该是解决问题的人,需要他说明在什么时间出现问题,这个问题的影响面多大,造成多大损失,是由谁造成的,问题的解决方法是什么,问题是否得到完全解决,如果没有的话,应该如何去做下一步改进,另外着重要写出处理问题的流程。这个流程非常重要,事故报告的核心在于问题是否按流程处理,如果没有按流程去做,那么说明问题并没有得到根本解决,以后还有可能出现类似的问题。我们学习机房管理,重要的是对于问题的处理。



 



机房出现关键服务器宕机、邮件服务器自动重启、关键部门核心数据丢失、ERP服务器数据恢复失败等严重的问题,对企业信息安全构成威胁,哪怕是UPS的断电都会产生巨大的损失,IT机房的稳定体现在提供不中断的业务服务,我们能达到多少个“9”,通过事故报告来改变提高我们的机房整体的高可靠性运行。



 



在完成事故报告之后,要交给IT MANAGER去审批,由他来决定这份报告是否合理,处理是否恰当,然后根据影响面来递交上一级。我们在写事故报告过程中,需要明确的是团体的职责,不仅仅是每个人负责的某一方面,而是一起解决问题的能力,大家共同来处理问题,让问题得以终结。


转载于:https://blog.51cto.com/zhaiken/333265