在局域网环境中,什么样的网络故障都可能发生;遇到网络故障时,我们常常根据具体的故障现象,来层层推理、寻找故障原因,找到故障原因后,再有的放矢、采取针对性措施进行应对,多半就能将网络故障解决掉了。然而也有的网络故障是由多种原因交叉引起的,当我们想方设法将具体的故障现象排除之后,并不能将网络运行状态恢复正常,此时我们就需要突破故障现象,追查到底,全力缉拿网络故障幕后的“真凶”。这不,笔者曾经遇到一则奇怪的网络不通故障,并伴有IP 冲突现象,全力以赴排除IP冲突现象之后,网络不通故障仍然存在……
    故障回放:IP冲突
  单位局域网通过本地ISP提供的共享100M宽带光纤线路接入Internet网络,局域网中的所有工作站都连接到Cisco品牌的主交换机上,主交换机设备通过TP-Link品牌的宽带路由器连接到宽带光纤线路,平时所有工作站都能通过宽带光纤线路直接访问Internet网络中的资源。为了方便单位员工能够快速、安全地访问到单位中的各类重要信息,单位特意配置了一台文件服务器,平时要面向所有员工发布的各类信息全部存储在这台文件服务器中;为了保证文件服务器不受到非法用户的***与破坏,单位在该文件服务器系统中特地安装了加费尔防火墙,同时对该防火墙参数进行了合适设置,确保该防火墙工作于服务器模式状态。此外,连接到这台文件服务器中的网卡设备使用了千兆接口,该网卡接口借助6类双绞线与局域网网络中的主交换机直接相连,并且单位网络管理员在宽带路由器的后台管理界面中,依次启用了DHCP服务器功能、防火墙功能、以及静态地址组等功能。
  近日,单位局域网中的某台计算机不知道怎么回事,突然不能登录单位的文件服务器,去访问发布在这台服务器中的重要信息。笔者接到同事的紧急“求援”后,三步并成两步地赶到故障现象,并在故障计算机中尝试了文件服务器登录访问,果然出现无法登录的故障。面对这种故障,笔者下意识地想到了物理线路的连接因素,于是小心翼翼地检查了该计算机中的网卡设备安装是否牢靠,连接该网卡设备的物理线缆连通性能是否正常,线缆插入到网卡接口时接触是否牢靠等细节,结果并没有找到任何可疑之处;笔者估计故障原因多数不在这台计算机上,于是径直来到位于单位主机房中的文件服务器现象,并且以系统管理员权限登录进入该文件服务器系统,打开了服务器系统中的事件查看器,仔细查阅了相关的日志记录文件,最后发现故障计算机使用的IP地址可能与局域网中的其他计算机使用的IP地址发生冲突现象。
排除冲突故障
    原以为故障工作站无法登录单位的文件服务器,是由于IP地址冲突原因引起的,于是笔者打算全力以赴地将IP地址冲突先排除掉。考虑到故障工作站使用的IP地址是静态的,于是笔者进入该计算机的网络连接列表窗口,打开本地连接属性设置界面,在该设置界面中将故障工作站使用的IP地址换成了另外一个还没有使用的IP地址,不过在更换新的IP地址后,该故障计算机还是不能通过网络远程登录到单位的文件服务器中去访问数据内容,这是什么原因呢?
    按理来说,使用了备用IP地址替换后,故障计算机就不应该出现IP地址冲突故障了,难道故障计算机到文件服务器之间的通信线路不能正常连通?想到这一点,笔者在故障计算机系统桌面中依次单击“开始”/“运行”命令,在弹出的系统运行文本框中,运行了Ping命令,来测试文件服务器的IP地址是否能够正常Ping通,测试结果表明从故障计算机端Ping单位文件服务器的IP地址不成功;之后,笔者又尝试从文件服务器端来Ping故障计算机端的IP地址时,看到Ping命令能够被正确执行,该测试结果意味着故障计算机与单位文件服务器之间的通信线路是处于正常连通状态的。
    让人感到更为惊讶的是,笔者在故障计算机系统桌面中用鼠标双击“网上邻居”图标,进入故障计算机系统的网上邻居窗口后,开始尝试去访问单位局域网中的其他计算机中的共享信息时,故障计算机系统竟然能够非常轻松地进入其他计算机中的共享文件夹窗口,并能够随意访问任何共享信息。很显然,此时的故障计算机使用的IP地址已经与局域网中的其他计算机地址不发生冲突了;可是,当笔者尝试从故障计算机系统中去登录单位的文件服务器时,系统仍然提示登录失败,这是为什么呢!? 
缉拿背后真凶:交换机问题
    有没有可能是网卡设备的记忆效应在“捣乱”呢?在排除了IP地址冲突因素后,笔者头脑中突然又冒出了这样一个大胆的想法。为了排除网卡记忆效应,笔者决定先将故障计算机使用的网卡设备暂时停用,过一段时间后再将该网卡设备重新启用起来,同时再为它分配另外一个处于空闲状态的IP地址看看。想到做到,笔者立即用鼠标打开“开始”菜单,并依次选中该菜单中的“设置”/“网络连接”/“本地连接”选项,进入故障计算机的本地连接属性界面,单击该属性界面中的“常规”选项卡,并在该选项设置页面的“设备用法”处,将“不要使用这个设备(停用)”项目选中,同时用鼠标单击对应设置页面中的“确定”按钮,如此一来故障计算机的网卡设备就被笔者临时停止使用了。过一段时间后,笔者重新启动了一下故障计算机系统,并且按照之前的操作步骤再次进入目标网卡设备的“常规”选项设置页面,在该设置页面的“设备用法”处,笔者重新启动了网卡设备,在启用目标网卡设备的过程中笔者看到该故障计算机使用的IP地址是动态分配的。这时,笔者脑海中好象突然到了什么,原来局域网中使用的宽带路由器设备安装配置了DHCP服务器,有没有可能是DHCP服务器功能引起了故障计算机不能正常访问单位的文件服务器呢?想到这一点,笔者立即动手进入宽带路由器的后台管理界面,从中找到DHCP服务设置选项,并且尝试将该功能临时关闭掉,最后执行了保存操作,同时重新启动了一下宽带路由器设备。不过,笔者的这番辛苦还是没有让故障计算机正常登录单位的文件服务器;之后,笔者再一次进入宽带路由器的后台管理界面,将该界面中的MAC地址过滤列表以及静态地址全部清空掉,重启宽带路由器后,笔者看到故障计算机不能访问文件服务器的现象仍然存在。
    在毫无头绪的情况下,笔者偶然看到了交换机设备,难道问题会出现在交换机设备身上?考虑到各种可能因素都已经被尝试使用过,惟独交换机因素还没有考虑到,于是笔者打算将故障解决的重点“转移”到局域网的主交换机中。笔者先以系统管理员身份登录进主交换机的后台管理界面,并从该后台界面执行Ping命令,来对文件服务器使用的IP地址进行Ping测试,结果笔者看到从交换机端也没有办法Ping通单位的文件服务器使用的IP地址,再尝试从文件服务器端Ping主交换机使用的IP地址时,Ping命令仍然能够被正确执行。而且,笔者这一次还看到打开其他计算机的“网上邻居”窗口时,发现网上邻居窗口有时并不能将其他计算机的主机名称显示出来,并且从连接到主交换机中的任意一台计算机系统中Ping单位文件服务器使用的IP地址时,Ping命令都不能被正确执行。
    经过上面的多次测试,笔者认为故障计算机本身不存在任何问题,问题很可能出在单位的文件服务器系统中。联想到局域网中的普通计算机不能Ping通文件服务器,而文件服务器能够Ping通局域网中的普通计算机,于是笔者断定多半是文件服务器禁止了ping命令测试功能。依照这样的思路,笔者又一次以系统管理员身份登录进单位的文件服务器,在该服务器系统中笔者先将防火墙的工作模式调整为普通工作状态,后对防火墙的相关访问设置进行了修改,以便取消对Ping测试功能的限制,完成各项设置操作后,笔者发现故障计算机终于能够Ping通单位的文件服务器使用的IP地址了;并且在局域网中的其他计算机中进行Ping命令测试时,发现文件服务器使用的IP地址都能被正确Ping成功了。后来,笔者返回到故障计算机现场,并尝试从该系统远程登录单位的文件服务器,这一次登录操作很顺利,笔者很快就访问到文件服务器中的文件内容了,这说明故障计算机不能登录文件服务器的故障就被成功解决了!
  故障原因探究
    虽然故障已经被解决,但是笔者到现在还有弄清楚,那就是我们辛辛苦苦地将故障计算机的IP地址冲突现象排除后,故障计算机为什么还无法通过网络远程登录单位的文件服务器呢?后来笔者对文件服务器系统中的防火墙记录进行仔细查看,并且查阅网上的相关资料后,终于明白其中的原委,原来安装在文件服务器系统中的防火墙只要发现有IP地址冲突故障的计算机再次访问服务器时,防火墙就会对该计算机的访问行为进行自动限制,只有我们手工取消防火墙的这种限制才能解决问题。