概述
由于生产环境有大量url需要监控,形式如http://ip:端口/login,要求url状态不为200即报警并且获得响应时间(url可改成自己应用里的url),如果用zabbix,一个一个手动添加模板,会造成大量重复工作,如果利用脚本+mail,则无法图形呈现。所以这里利用zabbix的discovery功能来实现应用的监控。
一、zabbix客户端配置
1、修改zabbix-agent端的配置文件
# vi /etc/zabbix/zabbix_agentd.conf=============================================================================================UnsafeUserParameters=1# 把这个值改为1,因为自动发现的脚本中有一些特殊字符,被认为是不安全的因素,1表示允许这些字符存在# 如果不改,后期在Server端就会报错,原因就在这里=============================================================================================# vi /etc/zabbix/zabbix_agentd.d/url.conf=============================================================================================# 第一行是自动发现脚本的路径UserParameter=url.discovery,/etc/zabbix/zabbix_agentd.d/url_discovery.sh# 第二行是检测URL状态的脚本路径UserParameter=url.status[*],/etc/zabbix/zabbix_agentd.d/url_status.sh $1 $2=============================================================================================
2、自动发现脚本(url_discovery.sh)
获取监控URL,输出格式为json格式,用于zabbix自动发现TCP
#!/bin/bashWEB_SITE=($(grep -v "^#" /data/zabbix/WEB.txt))length=${#WEB_SITE[@]}printf "{"printf ''""data":["for ((i=0;i
3、监控项脚本(url_status.sh)
指标解释 :
http_code:获取curl获取URL的http状态码
time_total:完成请求所用的时间,单位为s
time_connect:建立到服务器的TCP 连接所用的时间,单位为s
time_starttransfer:在发出请求之后,Web 服务器返回数据的第一个字节所用的时间,单位为s
speed_download:传输速度,单位为B/s,这里换算成MB/s
#!/bin/bashurl=$1status=$2http_code () { /usr/bin/curl -o /dev/null -s -w %{http_code} $url} time_total () {/usr/bin/curl -o /dev/null -s -w %{time_total} $url}time_connect () {/usr/bin/curl -o /dev/null -s -w %{time_connect} $url}time_starttransfer () {/usr/bin/curl -o /dev/null -s -w %{time_starttransfer} $url}speed_download () {/usr/bin/curl -o /dev/null -s -w %{speed_download} $url|awk '{print $1/1024/1024}'}case $status in http_code) http_code ;; time_total) time_total ;; time_connect) time_connect ;; time_starttransfer) time_starttransfer ;; speed_download) speed_download ;; *) echo "Usage:$0 {[URL] http_code|time_total|time_connect|time_starttransfer|speed_download}" ;; esac
4、监控URL列表(/etc/zabbix/WEB.txt)
#weburlhttp://服务器IP:8050/pass/login....
5、授权并重启zabbix客户端
chown -R zabbix:zabbix /etc/zabbixchmod -R 755 /etc/zabbixsystemctl restart zabbix-agent
6、在zabbix服务端验证并测试
zabbix_get -s localhost -p 10050 -k url.discovery
二、zabbix-server的web端操作
1、创建模板
配置--模板--创建模板
2、配置自动发现规则
2.1、创建发现规则
配置-模板-创建发现规则
名称:WEB URL discovery键值:url.discovery
2.2、创建监控项原型
在自动发现规则里选创建监控项原型。
注意,这是在模板的自动发现规则里面的监控项原型定义的监控项 并不是 模板里面的监控项 两者是不同的,当你把监控项原型定义之后,会自动发现里面的规则,然后自动在监控项里面添加
名称: {#URLNAME} 状态码键值: url.status[{#URLNAME},http_code]信息类型:数字(无正负)单位: ops/second #这个单位很重要,如果没有这个单位会导致触发器无法识别这个item名称: {#URLNAME} 响应时间键值: url.status[{#URLNAME},time_total]信息类型:浮点数单位: s 名称: {#URLNAME} 连接时间键值: url.status[{#URLNAME},time_connect]信息类型:浮点数单位: s 名称: {#URLNAME} 返回数据时间键值: url.status[{#URLNAME},time_starttransfer]信息类型:浮点数单位: s 名称: {#URLNAME} 传输速度键值: url.status[{#URLNAME},speed_download]信息类型:浮点数单位: MB/s
2.3、最终的监控项原型
3、模板关联主机
4、测试
4.1、查看监控项
配置-主机-监控项,可以看到我们定义的动态的key已经生成,失效的key到期会自动删除
4.2、查看最新数据
监测-最新数据,也可以看到已经获取到数据
5、配置触发器原型
配置-模板-自动发现规则-触发器类型-创建触发器原型
名称:http_code not 200表达式:如果最近连续4次取到的response_code值不是200,则触发报警{url:url.status[{#URLNAME},http_code].last()}<>200 and {url:url.status[{#URLNAME},http_code].last(#1)}<>200 and {url:url.status[{#URLNAME},http_code].last(#2)}<>200 and {url:url.status[{#URLNAME},http_code].last(#3)}<>200
6、配置图形
配置-模板-自动发现规则-图形原型-创建图形原型
监测-图形,可以查看图形