一、对网络管理人员的要求
目前互联网络技术、拓扑和应用的复杂性决定了网络管理人员必须:
1、确保网络稳定运行;
 
2、掌握故障排除方法;
 
3熟悉各种协议可能故障点,迅速定位排除故障。
 
对协议要求有精深的理解如静态和OSPF相互路由引入的问题 详细描述故障现象和相关信息
1、谁出了问题?
 
2、是什么问题?
 
3、问题何时发生的?
 
4何处发生的故障?
 
充分了解所管理和维护的网络
1网络物理拓扑
 
2、网络使用的各种技术,包括局域网技术、广域网技术、路由协议、网络安全技术、QoS等等
 
3、网络运行业务
 
4、流量分布
 
5、最近网络变化情况
 
6、网络测试基线
 
7及时进行故障排除的文档记录和经验总结
 
网络故障一般分类
1连通性问题
 
2、硬件、媒介、电源故障;
 
3、配置错误;
 
4、设备兼容性问题
 
5、性能问题
 
6、网络拥塞;
 
7、到目的地不是最佳路由;
 
8、供电不足;
 
9、路由环路;
 
10网络不稳定;
 
四、网络故障排除基本步骤
网络设备故障诊断主要有以下命令:
pingtracertdisplaydebug
 
Ping
ping主要用于检查网络连接及主机是否可达。
命令格式:
ping [ -a X.X.X.X ] [ -c count ] [ -d ] [ -h ttl_value ] [ -i {interface-type interface-number | interface-name } ][ ip ] [ -n ] [ -p pattern ] [ -q ] [ -r ][ -s packetsize ] [ -t timeout ] [ -v ] [ vpn-instance vpn-instance-name ] host  
命令执行结果输出包括:
对每一ping报文的响应情况,如果超时到仍没有收到响应报文,则输出“Request time out”,否则显示响应报文中数据字节数、报文序号、TTL和响应时间等。
最后的统计信息,包括发送报文数、接收报文数、未响应报文百分比和响应时间的最小、最大和平均值。 
vrp:-c 报文个数 –超时时间 –报文大小 Win-N 报文个数 –T  持续ping  -l 报文大小
 
Tracert
tracert用于测试数据包从发送主机到目的地所经过的网关,它主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。
命令格式:tracert [-a X.X.X.X ] [ -f first_TTL ] [ -m max_TTL ] [ -p port ] [ -q nqueries ] [ -w timeout ] host  
VRP平台:     -a 指定发送UDP源地址  -f  TTL初始值  -m 指定最大TTL值  -p 目的主机端口号,    缺省33434  -q 每次发送的报文个数 –指明UDP超时时间,缺省5000
WIN平台:-d 不解析主机名   –指定最大TTL值  -w 超时时间
 
案例:使用tracert命令定位配置不当的网络点 
故障排除常用display命令
display version
display current-config 
display saved-config 
display interface 
 
display interface:显示接口信息
 
display current-config& display saved-config 
显示当前设备配置文件信息
把启动配置文件存放到路由器以外的其他设备上 
使维护人员能够迅速配置一个替代的路由器; 
将该配置文件通过E-mail形式发给技术支持人员以帮助定位配置问题。 
 
debug
获得路由器中处理的报文和帧的细节信息 
debug命令使用注意事项
不使用debug命令监控正常的网络运行在网络使用的低峰期使用
不要轻易使用该debug命令不要轻易使用类似debug all之类的命令 
定位操作完成后,应立即以“undo debug xx”命令终止debug命令的执行。
displaydebug命令配合使用 
  
五、故障排除常用方法
1分层故障排除法
 
2、分块故障排除法
 
3、分段故障排除法
 
4替换法
 
分层故障排除法
按照OSI/ISO参考模型,由下到上,逐层进行故障排除。
 
分块故障排除法
配置文件分为以下部分:
管理部分(路由器名称、口令、服务、日志等)
端口部分(地址、封装、cost、认证等)
路由协议部分(静态路由、RIPOSPFBGP、路由引入等)
策略部分(路由策略、策略路由、安全配置等)
接入部分(主控制台、Telnet登录或哑终端、拨号等)
其他应用部分(语言配置、×××配置、Qos配置等)
 
分段故障排除法
开箱即无法使用检查接口卡或主板上的器件,查看是否器件脱落或被压变形,以及BOOTROM或内存条的插座有无插针无法弹起。检查PCI侧的插针、物理接口(包括电缆)的插针是否有弯针。当没有查到上述硬件故障后,可考虑更换或升级BOOTROM、内存条或主机版本。
 
安装后无法正常使用线路连接问题,如线路阻抗不匹配、线序连接错误、中间传输设备故障。与其它设备有兼容性问题。接口配置问题。电源或接地不符合要求。在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。 
 
使用过程中发生故障电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。传输线受到干扰。中间传输设备故障。环境的温湿度、洁净度、静电等指标超出使用范围。