(此文记录运维事故,为类似问题提供参考。)

   大约下午4点,发现一台主机web应用无法访问,迅速启动远程桌面管理,结果是无法响应,此时ping主机地址不通。

   此时去机房查看问题,刀箱显示面板报8errors,点击面板选择键,异常缓慢。与hp客服沟通后初步判断为刀箱OA故障,等待备件到达。

   等待期间,发现与故障主机同段地址中的一台主机无法访问,此时开始怀疑为网络事故,于是联系网络管理排查问题。通过对网关交换机的监控发现配置丢失,所有端口上传数据异常,每秒达到90m,开始时怀疑为个别主机系统问题导致,之后排查主机无问题。此时问题焦点集中在网关交换机上,用替换方式,排查到故障问题,之前的配置中划分vlan,隔离了一台防火墙(上联下联端口均接到网关交换机),当配置丢失后,产生网络环路,导致以上问题出现,取消防火墙,问题解决。