在公司部署了一套CactiEZ用于实时监控多个网络设备的工作状态,设置了阈值和宕机短信报警,异常发生时系统会自动给自己的手机发送短信提醒,但有一台SSG按照正常方式添加监控主机后,在图形当中始终无法出图、无数据显示。然而另外一台相同配置、相同型号的设备却能够正常出图。后来在网友“摩子”的协助下解决了这个问题,做一个记录以备以后查阅

故障主机截图:

CactiEZ10.1 不出图诡异故障排查_ssg5

Realtime插件实时数据:

CactiEZ10.1 不出图诡异故障排查_cacti_02

处理过程:

1.检查cacti日志,发现该监控主机在获取数据时一直处于超时状态

CactiEZ10.1 不出图诡异故障排查_ssg5_03

依据日志提示修改被监控主机SNMP Timeout选项为较大数值后,故障依旧

CactiEZ10.1 不出图诡异故障排查_cacti_04

2.网友提示若CactiEZ是安装在虚拟机上,虚机时间异常也可能会造成这个问题。检测虚机时间参数并未发现异常

3.检测是否获取到数据,使用snmpwalk –v 1 –c XXXX 10.108.41.1可以获取数据

CactiEZ10.1 不出图诡异故障排查_cacti_05

4.检测是否生成RRD文件

CactiEZ10.1 不出图诡异故障排查_ssg5_06

CactiEZ10.1 不出图诡异故障排查_ssg5_07

5.后来网友提醒检测下主机配置参数中的snmp版本,我默认使用的是V1,依据他的建议调整为V2并修改被监控设备的设置.

CactiEZ10.1 不出图诡异故障排查_监控_08

6. 重新设置过后故障排除

CactiEZ10.1 不出图诡异故障排查_监控_09

   虽然最后故障顺利排除但却没能找出问题产生的原因,自己推测是不是不同版本的SNMP agent造成的BUG,但无法找到相关的资料佐证。如果有朋友知道问题产生的原因,还望不吝赐教