一、对网络管理人员的要求
目前互联网络技术、拓扑和应用的复杂性决定了网络管理人员必须:
1、确保网络稳定运行;
2、掌握故障排除方法;
3、熟悉各种协议可能故障点,迅速定位排除故障。
对协议要求有精深的理解,如静态和OSPF相互路由引入的问题 ,详细描述故障现象和相关信息
1、谁出了问题?
2、是什么问题?
3、问题何时发生的?
4、何处发生的故障?
二、充分了解所管理和维护的网络
1、网络物理拓扑;
2、网络使用的各种技术,包括局域网技术、广域网技术、路由协议、网络安全技术、QoS等等;
3、网络运行业务;
4、流量分布;
5、最近网络变化情况;
6、网络测试基线;
7、及时进行故障排除的文档记录和经验总结;
三、网络故障一般分类
1、连通性问题;
2、硬件、媒介、电源故障;
3、配置错误;
4、设备兼容性问题;
5、性能问题;
6、网络拥塞;
7、到目的地不是最佳路由;
8、供电不足;
9、路由环路;
10、网络不稳定;
四、网络故障排除基本步骤
网络设备故障诊断主要有以下命令:
ping、tracert、display、debug
Ping
ping主要用于检查网络连接及主机是否可达。
命令格式:
ping [ -a X.X.X.X ] [ -c count ] [ -d ] [ -h ttl_value ] [ -i {interface-type interface-number | interface-name } ][ ip ] [ -n ] [ -p pattern ] [ -q ] [ -r ][ -s packetsize ] [ -t timeout ] [ -v ] [ vpn-instance vpn-instance-name ] host
命令执行结果输出包括:
对每一ping报文的响应情况,如果超时到仍没有收到响应报文,则输出“Request time out”,否则显示响应报文中数据字节数、报文序号、TTL和响应时间等。
最后的统计信息,包括发送报文数、接收报文数、未响应报文百分比和响应时间的最小、最大和平均值。
vrp:-c 报文个数 –t 超时时间 –S 报文大小 Win:-N 报文个数 –T 持续ping -l 报文大小
Tracert
tracert用于测试数据包从发送主机到目的地所经过的网关,它主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。
命令格式:tracert [-a X.X.X.X ] [ -f first_TTL ] [ -m max_TTL ] [ -p port ] [ -q nqueries ] [ -w timeout ] host
VRP平台: -a 指定发送UDP源地址 -f TTL初始值 -m 指定最大TTL值 -p 目的主机端口号, 缺省33434 -q 每次发送的报文个数 –w 指明UDP超时时间,缺省5000
WIN平台:-d 不解析主机名 –h 指定最大TTL值 -w 超时时间
案例:使用tracert命令定位配置不当的网络点
故障排除常用display命令
display version
display current-config
display saved-config
display interface
display interface:显示接口信息
display current-config& display saved-config
显示当前设备配置文件信息
把启动配置文件存放到路由器以外的其他设备上
使维护人员能够迅速配置一个替代的路由器;
将该配置文件通过E-mail形式发给技术支持人员以帮助定位配置问题。
debug
获得路由器中处理的报文和帧的细节信息
debug命令使用注意事项:
不使用debug命令监控正常的网络运行,在网络使用的低峰期使用。
不要轻易使用该debug命令,不要轻易使用类似debug all之类的命令 。
定位操作完成后,应立即以“undo debug xx”命令终止debug命令的执行。
display和debug命令配合使用
五、故障排除常用方法
1、分层故障排除法;
2、分块故障排除法;
3、分段故障排除法;
4、替换法;
分层故障排除法
按照OSI/ISO参考模型,由下到上,逐层进行故障排除。
分块故障排除法
配置文件分为以下部分:
管理部分(路由器名称、口令、服务、日志等)
端口部分(地址、封装、cost、认证等)
路由协议部分(静态路由、RIP、OSPF、BGP、路由引入等)
策略部分(路由策略、策略路由、安全配置等)
接入部分(主控制台、Telnet登录或哑终端、拨号等)
其他应用部分(语言配置、×××配置、Qos配置等)
分段故障排除法
开箱即无法使用,检查接口卡或主板上的器件,查看是否器件脱落或被压变形,以及BOOTROM或内存条的插座有无插针无法弹起。检查PCI侧的插针、物理接口(包括电缆)的插针是否有弯针。当没有查到上述硬件故障后,可考虑更换或升级BOOTROM、内存条或主机版本。
安装后无法正常使用,线路连接问题,如线路阻抗不匹配、线序连接错误、中间传输设备故障。与其它设备有兼容性问题。接口配置问题。电源或接地不符合要求。在安装过程也要考虑模块接口电缆所支持的最大传输长度、最大速率等因素。
使用过程中发生故障,电源、接地和防护方面不符合要求,在有电压漂移或雷击时造成器件损坏。传输线受到干扰。中间传输设备故障。环境的温湿度、洁净度、静电等指标超出使用范围。