在监控生产环境的服务的时候,通常需要对多个端口进行监控,如果我们手动一个一个的添加,这将是一件很麻烦的事情,为了减少这样的情况,我们采用批量添加监控端口的方法,这是非常常见的需求,zabbix也是支持这种方式的,需要使用zabbix的Discovery功能来实现。

使用zabbix监控如何监控服务器端口状态,大概的流程:zabbix监控服务自带端口监控的监控项,所以需要我们自己手动定义所监控的item,客户端获取的端口列表通过agent传送到服务端。

只需在服务端进行端口监控模板配置,然后自定义监控图形,添加监控项即可!

下面就给大家讲解一下批量添加端口的方法。

一 自动扫描端口并监控报警

1. 编写脚本扫描端口

vim check_port.py

#!/usr/bin/env python

import os

import json

portlist = []

new_port_list = []

port_dict = {"data":None}

cmd = '''netstat -tnlp|egrep -i "$1"|awk {'print $4'}|'''

cmd += '''awk -F':' '{if ($NF~/^[0-9]*$/) print $NF}'|sort -n| uniq 2>/dev/null'''

auto_localport = os.popen(cmd).readlines()

for ports in auto_localport:

        new_port = ports.strip()

        portlist.append(new_port)

for port in portlist:

        pdict = {}

        pdict["{#TCP_PORT}"] = port

        new_port_list.append(pdict)

port_dict["data"] = new_port_list

jsonStr = json.dumps(port_dict,sort_keys=True,indent=4)

#python3
#print(jsonStr)

#python2
print jsonStr

脚本的作用就是从被监控的服务器上面采集数据,并且转换为特定的字典格式,这种格式是zabbix可以识别的一种数据字典格式,使用python来编写相对shell来说更加便捷。

在/etc/zabbix/zabbix_agentd.d/下创建目录externalscripts

mkdir -p /etc/zabbix/zabbix_agentd.d/externalscripts

将脚本放在客户端 /etc/zabbix/zabbix_agentd.d/externalscripts 路径下面。并赋予执行权限。

[root@mysql-master externalscripts]# chmod +x check_port.py
[root@mysql-master externalscripts]# ll -a check_port.py 
-rwxr-xr-x. 1 root root 672 Jul  1 01:25 check_port.py

 

2. 在 /etc/zabbix/zabbix_agentd.d/ 下创建 userparameter_checkport.conf 文件,并编辑。内容如下:

[root@mysql-master zabbix_agentd.d]# more userparameter_checkport.conf 
UserParameter=tcpport.listen,/etc/zabbix/zabbix_agentd.d/externalscripts/check_port.py

敢这么做是因为:

通常在zabbix_agentd.conf文件中有这段代码 include zabbix_agentd.d/*.conf。(如果注释掉的话就解除注释)

zabbix监控TCP连接 zabbix监控接口状态_TCP

重启客户端服务。

[root@mysql-master ~]# systemctl restart zabbix-agent.service

3. 服务端测试

执行命令: zabbix_get -s 192.168.158.141 -p 10050 -k tcpport.listen

zabbix监控TCP连接 zabbix监控接口状态_TCP_02

会发现zabbix报错,报错信息:(Not all processes could be identified, non-owned process info will not be shown, you would have to be root to see it all.)

解决方法:

zabbix_agentd端执行命令

chmod +s /bin/netstat


服务端再次使用zabbix_get 测试,便不会有报错信息。

zabbix监控TCP连接 zabbix监控接口状态_python_03

 

出现上面格式的数据,说明脚本编写成功!!!

如果客户端对check_port.py赋权方式采用的 chmod u+x check_port.py  即-rwxr--r-- 则,在服务端zabbix_get进行测试时,会报没有权限。如下所示:

[root@zabbix_nginx ~]# zabbix_get -s 192.168.158.141 -p 10050 -k tcpport.listen
 sh: /etc/zabbix/zabbix_agentd.d/externalscripts/check_port.py: Permission denied

 

二 页面配置

1. 创建端口监控专用主机群组

配置 > 主机群组 > 创建主机群组

zabbix监控TCP连接 zabbix监控接口状态_json_04

2. 创建模板

配置 > 模板 > 创建模板

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_05

 

3. 添加自动发现规则

在上面创建的模板中点击 ----> 自动发现规则 ----> 然后选择创建发现规则

zabbix监控TCP连接 zabbix监控接口状态_python_06

 

 

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_07

 

说明:上面的key 一定要和监控客户端配置文件中的 key 保持一致。

4. 创建监控项原型

创建自动发现规则后,点击该规则下的 “监控项原型” ----> 创建监控项原型

zabbix监控TCP连接 zabbix监控接口状态_json_08

 

zabbix监控TCP连接 zabbix监控接口状态_json_09

上面中的键值中的 {#TCP_PORT} 和我们的脚本 check_port.py 中的参数一致

5. 创建触发器原型

zabbix监控TCP连接 zabbix监控接口状态_json_10

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_11

其中,表达式详情如图:

zabbix监控TCP连接 zabbix监控接口状态_python_12

注意,这里的表达式中的 count(#3,0,eq) > 1表示最近3次的返回值为0,这个条件触发一次则报警。

配置到这里我们就完成了,zabbix自动扫描并监控的功能。

 

三 将端口监控模板链接到相关主机

将端口监控模板链接到相关主机上即可

zabbix监控TCP连接 zabbix监控接口状态_json_13

 

配置到这里我们就完成了,zabbix自动扫描端口并监控的功能。

报警效果:

zabbix监控TCP连接 zabbix监控接口状态_TCP_14



 

扩展1:

批量添加指定端口

有时候我们不需要监控自动扫描出来的所有端口,要监控的这些端口需要我们指定,这个需求也是比较常见的,有了上面的基础,实现这个东西其实是比较简单,其实仔细看看脚本就能实现。

要实现这个功能我们只需要,将脚本替换成下面的内容即可(以只监控8080,3306两个端口为例

#!/usr/bin/env python 
 
import json
 
portlist = ["8080","3306"]
 
new_port_list = []
 
port_dict = {"data":None}
 
#cmd = '''netstat -tnlp|egrep -i "$1"|awk {'print $4'}|'''
 
#cmd += '''awk -F':' '{if ($NF~/^[0-9]*$/) print $NF}'|sort -n| uniq 2>/dev/null'''
 
#auto_localport = os.popen(cmd).readlines()

 
for port in portlist:
 
        pdict = {}
 
        pdict["{#TCP_PORT}"] = port
 
        new_port_list.append(pdict)
 
port_dict["data"] = new_port_list
 
jsonStr = json.dumps(port_dict,sort_keys=True,indent=4)
 
#python3
#print(jsonStr)
 
#python2
print jsonStr

 



扩展2

自动发现批量监测指定端口方案优化

前面的方式以及扩展1的报警效果都是下面这个样子:

zabbix监控TCP连接 zabbix监控接口状态_python_15

而我们优化后想要的报警效果则是这样的:

(报警信息上很明了的指明是哪台机器上的哪个服务挂了)

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_16

 

要实现这样的效果,那么我们要理清思路:

实现上面效果,我们从zabbix客户端传数据到zabbix服务端,就要传两个变量参数,一个是端口,另一个是端口对应的服务

 

下面开启优化之旅:

1 对 check_port.py 脚本进行优化

check_port.py 脚本优化后内容如下:

#!/usr/bin/env python 
#coding:utf-8
 
import json

total_dict={"data":[{"{#TCP_PORT}":"3005","{#SERVICE_NAME}":"空气质量"},{"{#TCP_PORT}":"8009","{#SERVICE_NAME}":"自行车"},{"{#TCP_PORT}":"3118","{#SERVICE_NAME}":"实时公交"},{"{#TCP_PORT}":"3008","{#SERVICE_NAME}":"城市书房"},{"{#TCP_PORT}":"7001","{#SERVICE_NAME}":"城市图书馆"},{"{#TCP_PORT}":"3018","{#SERVICE_NAME}":"停车场"}]}

jsonStr = json.dumps(total_dict,sort_keys=True,indent=4,ensure_ascii=False)
 
#python3
#print(jsonStr)
 
#python2
print jsonStr

或者

#!/usr/bin/env python
#coding:utf-8

import json

total_dict={"data":[
{"{#TCP_PORT}":"3005","{#SERVICE_NAME}":"空气质量"},
{"{#TCP_PORT}":"8009","{#SERVICE_NAME}":"自行车"},
{"{#TCP_PORT}":"3118","{#SERVICE_NAME}":"实时公交"},
{"{#TCP_PORT}":"3008","{#SERVICE_NAME}":"城市书房"},
{"{#TCP_PORT}":"7001","{#SERVICE_NAME}":"城市图书馆"},
{"{#TCP_PORT}":"3018","{#SERVICE_NAME}":"停车场"}
]}

jsonStr = json.dumps(total_dict,sort_keys=True,indent=4,ensure_ascii=False)

#python3
#print(jsonStr)

#python2
print jsonStr

 

上面python脚本中total_dict 字典的值写在一行不好看出来,其实total_dict的值直观起来看如下图:

zabbix监控TCP连接 zabbix监控接口状态_json_17

执行check_port.py效果如图:

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_18

2. 优化 “Template Ports Discovery”模板的 自动发现规则 Template Ports Discovery

zabbix监控TCP连接 zabbix监控接口状态_json_19

2.1 优化 监控项原型

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_20

2.2 优化 触发器原型

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_21

3 . 将优化后的自动发现指定端口模板链接到某一台主机上比如:192.168.158.141

链接后,

在192.168.158.141 监控项列表可看到自动增加如下监控项:

zabbix监控TCP连接 zabbix监控接口状态_TCP_22

在192.168.158.141 触发器列表可看到自动增加如下触发器:

zabbix监控TCP连接 zabbix监控接口状态_json_23

如果192.168.158.141根本不存在上面指定的端口或上面指定的端口挂了,就会触发报警。

报警效果如图:

zabbix监控TCP连接 zabbix监控接口状态_python_24

 



扩展3

自动发现批量监测指定进程服务方案优化(对于没有固定端口的服务可采用此方式)

进程服务发现脚本 check_proc.py

#!/usr/bin/env python
#coding:utf-8
 
import json
 
total_dict={"data":[
{"{#CMDLINE}":"accountinfo-provider","{#SERVICE_NAME}":"accountinfo-provider"},
{"{#CMDLINE}":"account-provider","{#SERVICE_NAME}":"account-provider"},
{"{#CMDLINE}":"account-user-provider","{#SERVICE_NAME}":"account-user-provider"},
{"{#CMDLINE}":"account-userSeq-provider","{#SERVICE_NAME}":"account-userSeq-provider"},
{"{#CMDLINE}":"loginLogger-provider","{#SERVICE_NAME}":"loginLogger-provider"}
]}
 
jsonStr = json.dumps(total_dict,sort_keys=True,indent=4,ensure_ascii=False)
 
#python3
#print(jsonStr)
 
#python2
print jsonStr

userparameter_checkproc.conf 文件内容:

zabbix监控TCP连接 zabbix监控接口状态_zabbix监控TCP连接_25

自动发现规则:

zabbix监控TCP连接 zabbix监控接口状态_json_26

监控项原型优化:

zabbix监控TCP连接 zabbix监控接口状态_json_27

 

触发器原型优化:

zabbix监控TCP连接 zabbix监控接口状态_json_28