拓扑图:

网络瘫痪分析处理(午饭的一个例子)_网络瘫痪

全部上不了网,排除接入层交换机或者某个VLAN的问题,要从核心开始查

1:用笔记本核心层网关
2:再往上ping核心层和深信服相连的接口,不通
果断把深信服重启,再ping,通了,5分钟后,又挂了,没办法,只好先把深信服设备给停掉
直接把核心层的线插到PIX的内网口(甩掉)
3:PING  PIX的内网口,不通,再ping ,丢包
先把深信服放到一边,不用这个设备,检查PIX
丢包~~~~~~~~第一反应就是查看CPU,结果一看97%,98%,肯定不正常
眼观:核心交换和PIX相连的灯闪烁太快,和平时不一样
把PIX和核心相连的网线给拔掉,再查看CPU,7%,正常
确定问题出在内网里,(核心交换到内网)
在核心层做端口映射(把核心交换和PIX相连的这个端口映射到一个平时不用的端口上面,注意要把PIX和核心的网线要连接上,不然没数据包),用sniffer抓包,打开sniffer,把映射端口的网线插到笔记本上,短短几秒,笔记本竟然CPU100%, 操作sniffer查看,其中一个VLAN里的一台服务器向外发送大量连接,拔掉这台服务器的网线,1分钟后,PIX  cpu正常,处于7%左右。 

其他方法:

打开交换机和路由器的SNMP功能。用solarwinds,实时可以定位出哪个端口流量大!装个监控,类似cacti可以监看流量,容易发现异常流量。solarwinds工具可以监控cpu和内存的使用情况。 

如果是连接数多,pix上直接sh conn可以查到问题ip

不是挂了,是流量过大,拥塞了网络。SNMP一般是五分钟轮询一次。
solawinds看实时流量还是可以的。防火墙上开启syslog日志,实时查看日志!

 总结:逐段判断是那段出了问题,查看网络设备的实时运行状态,用特定监控软件来查询。