要随时随地了解机房的温度是否正常,一种及时,高效的监控方法是必不可少的。我使用的是APC温度探针,不过它仅支持邮件,SNMP Trap和Syslog三种方法报警。如果手边没有电脑或网络的话,那么就会错过报警,后果可能非常严重。

      监控系统有很多选择,商业的有WhatsUp,ipMonitor…,开源的有Cacti, Nagois… 我用的是Whatsup,功能还是比较强大的。我是通过WhatsUp来监控温度探针的表示温度是否超越阈值的OID来实现监控的,大家可以举一反三,用在别的监控系统上。下面是个简单的步骤,供大家参考。

1)如果监控系统中没有监控对象的MIB,就需要导入Enterprise MIB。在WhatsUp中是通过mibextra <mib filename>这个命令来实现的(虽然帮助文件上说只要把MIB文件拷贝到…/Data/Mibs目录下就可以,但我试过并没有成功)。

2)增加新的监控内容 - 表示温度是否超过阈值的OID值。APC中这个值在如下目录中,1表示温度正常,2表示温度超过阈值。

image

3)配置报警方法 - 短信或者电话。如果用短信报警,可以用飞信,短信猫或者脚本+短信平台账户来实现;如果用电话报警,可以通过调制解调器+电话线来实现。

      这样一来,即使身边没有电脑或网络,也不会错过任何报警。只要温度超过阈值,我的电话就会响起来。同样的方法还可以应用在监控网络,主机上。

备注:Windows自带的dialer.exe不能用命令行形式拨号,附件中的dial.exe可以实现(还是通过调用dialer.exe),方法很简单 - dial.exe <电话号码>。