引言
Zabbix跨平台监控系统中,对AIX系统的监控,一般通过AIX上的zabbix_agent获取AIX系统的状态信息和性能数据。但是对于很多用户关心的errpt信息,没有现成的监控模板。 本文介绍了如何通过AIX上的zabbix agent的用户自定义参数来实现对errpt的监控和报警。
实现
首先,我们可以在agent端增加一个用户自定义参数,目的是统计errpt日志条数和详细信息。示例如下:
cd /usr/local/zabbix/conf/zabbix_agentd
新增配置:errpt.conf
securdb@/usr/local/zabbix/conf/zabbix_agentd>cat errpt.conf
UserParameter=aix.errpt,errpt | wc -l #统计条数
UserParameter=aix.errptlist,errpt #统计错误日志的详细信息
securdb@/usr/local/zabbix/conf/zabbix_agentd>
配置完成,需要重启agent节点的zabbix服务
securdb@/usr/local/zabbix/conf/zabbix_agentd>cd /usr/local/zabbix/sbin
securdb@/usr/local/zabbix/sbin>./zabbix_agentd -c /usr/local/zabbix/conf/zabbix_agentd.conf
securdb@/usr/local/zabbix/sbin>
重启完成之后在服务端server测试是否正常统计
[root@zabbix-server]# cd /usr/local/zabbix/bin
[root@zabbix-server bin]# ./zabbix_get -s 10.190.7.205 -k aix.errpt
ZBX_NOTSUPPORTED: Unsupported item key.
[root@zabbix-server bin]#
查看到报错,登录客户端,编辑配置zabbix_agentd.conf
securdb@/>cd /usr/local/zabbix/conf
securdb@/usr/local/zabbix/conf>vi zabbix_agentd.conf
找到UserParameter这一行,下面新增配置
# UserParameter=
Include=/usr/local/zabbix/conf/zabbix_agentd/errpt.conf #该配置为新增自定义参数配置文件
重启客户端agent的zabbix服务
再次回到server端测试是否正常
[root@zabbix-server bin]# ./zabbix_get -s 10.190.7.205 -k aix.errpt #统计条数
5
[root@zabbix-server bin]#
[root@zabbix-server bin]# ./zabbix_get -s 10.190.7.205 -k aix.errptlist #统计详细日志
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
DCB47997 0509035123 T H hdisk2 DISK OPERATION ERROR
4B436A3D 0509035123 T H fscsi1 LINK ERROR
DCB47997 0509020323 T H hdisk2 DISK OPERATION ERROR
4B436A3D 0509020323 T H fscsi1 LINK ERROR
[root@zabbix-server bin]#
能获取到具体的errpt条数就说明用户自定义参数功能正常。
在web页面上添加相关监控,使其触发告警
在配置 --> 模板 --> 监控项 --> 右上角创建监控项
分别创建errpt监控以及errptlist日志详细清单
内容分别为:
errpt监控:
此处需要注意,名称可以随便起,其中键值为 aix.errpt 即在前面配置的errpt.conf配置中所配置的键值
UserParameter=aix.errpt,errpt | wc -l #统计条数
errptlist:
此处需要注意,名称可以随便起,键值必须为aix.errptlist 即在前面配置的errpt.conf配置中所配置的键值UserParameter=aix.errptlist,errpt #统计错误日志的详细信息
最后创建触发器
配置 --> 模板 --> 触发器 --> 右上角创建触发器
表达式为:当errpt条数大于0时触发告警
last(/Create_Disk Memory usage.205/aix.errpt)>0
可以查看对应的图形errpt监控日志条数
以及详细的errpt日志信息