前面的文章里,我们已经配置好了Server和Agent,并且server能够自动发现agent。
邮件告警的前提:你已经配置好了server和agent之间的关系,server能够从agent抓取数据(能够监控到客户端)
在zabbix的使用中,最重要的一点就是完善的报警机制,作为监控平台,需要时刻关注机器和服务的运行状态,更重要的是发现故障之后需要及时的报警给相关人员,早点发现问题,将隐患消除在未然阶段。这样才能保证服务的稳定运行。
报警的方式是多种多样的,微信、短信和邮件报警是我们比较常见的方式。而且报警的频率和策略直接影响着运维人员的重视程度和检错效率。如果整个报警列表中都是一些无关痛痒的提示、轻度警告。而他们的发送频率又特别的高,则非常容易错过真正关键的报警。 报警涉及的触发器(trigger)一般包括以下几个方面: (1)服务器的基本状态:磁盘容量、内存大小、cpu的负载; (2)基础服务状态:web服务器(nginx、apache)的状态,数据库的状态(mysql、oracle、nosql等); (3)应用服务器状态:应用服务器的可用性以及负载状态;
由于zabbix-server配置在虚拟机上。所以物理机需要设置MASQUERADE开启保证虚拟机可以上网。
[root@foundation81 kiosk]# iptables -t nat -I POSTROUTING -s 172.25.81.0/24 -j MASQUERADE
虚拟机上添加网关
面对成千的服务器告警消息,一个平台的管理尤为重要。这里实验选用OneAlert云告警平台。OneAlert 将多种监控的告警信息集中处理,对告警消息有效区分,合理的告警处理流程以及事后可靠的告警分析,让团队的工作效率提升明显。
<1>通过查看zabbix_server.conf文件找到AlertScriptsPath参数
<2>下载oneitsm_zabbix_release-1.2.0.tar.gz软件并解压到上述目录下面
<3>安装该软件
登录OneAlert页面,在配置-->应用下添加zabbix应用。
添加完之后可以找到应用key
[root@zabbix-server alertscripts]# cd oneitsm
[root@zabbix-server oneitsm]# cd bin/
[root@zabbix-server bin]# ./install.sh e4d325d1-d4bc-d15b-011f-15d329906d31 安装,后面跟的是zabbix的应用key
./log.sh: line 6: /usr/lib/zabbix/alertscripts/oneitsm/bin/oneitsm.conf: No such file or directory
start to create config file...
Zabbix管理地址: http://172.25.81.11/zabbix
Zabbix管理员账号: Admin
Zabbix管理员密码:
<4>在zabbix监控网页上进行配置:
禁用除了oneitsm media之外的报警媒介
管理-->报警媒介类型
可以在onnealert页面设置告警通知策略,默认第一时间微信通知
微信通知必须绑定公众号以接收微信告警通知
测试:
关闭任一个zabbix-agent端的服务
在zabbix的web端可以监测到该问题:
微信可以收到告警通知:
认领该通知并解决:
onnealert页面也可以查看该告警的处理情况: