某公司网络架构为:出口路由器--行为管理设备--华为核心--锐捷无线控制器

                                                                            |

                                                                        华为傻瓜接入----锐捷无线AP

   使用业务为两种:1、办公区电脑无线网办公   2、工作区扫码枪扫货

    客户反馈在使用过程扫码枪会出现严重的丢包现象,导致业务无法正常处理,需要查找问题原因并进行解决。

    接到客户反馈后,首先梳理了无线丢包可能的原因:1、干扰 2、带宽压力过大    3、有线网络异常

    到达客户现场后,通过wirelessmon扫描后发现,环境中确实存在干扰,但是只是轻量的干扰,不会影响到业务的正常使用。

    在工作区使用笔记本电脑行走一圈,ping包延时正常,不丢包;使用办公的手持PDA后发现经过个别区域时会出现严重的丢包现象。

    现场观察AP的点位部署,发现AP部署过于密集,存在干扰的可能性比较大,于是尝试通过降低AP的功率来减小干扰的范围,但是降低之后问题依旧。

    于是第二次利用笔记本进行长ping测试,第二次发现,笔记本的丢包规律与手持PAD一致,尝试登录到所关联的AP上时发现有明显的卡顿现象,远程登录无线控制器后,通过Ping命令测试与AP的联通性,结果发现大量丢包。遂测试全部AP与AC的联通性,结果必现有3台AP在进行ping测试时,丢包严重。通过图纸对比后,确定丢包AP所处的位置与终端丢包的位置基本吻合。

    由于现场AP的部署点位相对比较密集,争取客户同意后,直接将3台有异常的AP进行下电,后测试手持PDA,仍然存在丢包问题,在无线控制器上观察后发现,手持PDA,存在漫游粘滞的情况,于是通过调整AP的RSSI来强制终端进行漫游,测试后,信号正常,异常丢包现象消失。


    原理:由于个别AP的丢包,手持PAD在与此类AP关联后,即开始出现丢包现象;由于终端的漫游是由无线控制器通过AP与终端之间的RSSI进行监测,而AP的丢包导致用户状态数据无法及时上传到无线控制器上,最终导致终端的漫游粘滞情况的出现,加重了丢包的问题。

    

    总结:本次排查过程中,由于惯性思维,导致一开始认为丢包的问题可能出在干扰这一个环节,花费大量时间后,才确定后丢包是由于个别AP的丢包引起的,后续在处理问题的过程中,应该避免被这种惯性思维误导。