以前的文章中已经说过怎么安装部署zabbix了,现在细说一下怎么配置监控
zabbix监控端配置
yum -y install gcc pcre-devel
//安装依赖
tar xf zabbix-3.4.4.tar.gz
cd zabbix-3.4.4
./configure --enable-agent //只安装agent模块
make install
vim /usr/local/etc/zabbix_agentd.conf
030: LogFile=/tmp/zabbix_agentd.log //日志文件
093: Server=127.0.0.1,192.168.2.5 //允许访问服务的地址列表
134: ServerActive=192.168.2.5:10051 //监控服务器地址
useradd zabbix
zabbix_agentd
启动服务
ss -anput | grep 10050
killall -9 zabbix_agentd
添加监控主机
给主机添加模板
- 显示主机监控信息
sum(600) //600秒内所有值得总和
sum(#5) //最后5个值得总和
last(20) //最后20秒的值
last(#5) //倒数第5个值
avg(1h,1d) //1天前的1小时的平均值 - 添加被监控主机
主机是Zabbix监控的基础,Zabbix所有监控都是基于Host主机。
//通过Configuration(配置)>>Hosts(主机)>>Create Host(创建主机)添加被监控主机 - 主机名最好与linux的主机名相同
选择套用的监控模板
查看主机监控信息
自定义监控项
zabbix不会自动报警和提示,需要配置触发器和报警动作
触发器通过configuration→templates
创建expression
表达式:填写触发器内容
{<server>:<key>.<function>(<parameter>)}<operator><constant>
//{主机:key.函数(参数)}<表达式>常数
{web1:system.cpu.load[all,avg1].last(0)}>5 //0为最新数据
//如果web1的主机最新cpu平均负载大于5,则触发器状态为problem
{vfs.fs.size[/,free].max(5m)}<10G //5m为最近5分钟
//根分区,最近5分钟的最大容量小于10G,则触发器状态为problem
{vfs.file,cksum[/etc/passwd].diff(0)}>0 //0为最新数据
//最新一次校验/etc/passwd如果与上一次有变化,则触发器状态为problem
- Expression表达式案例
大多数函数使用秒作为参数,使用#代表不同含义
avg,count,last,min和max函数支持额外的第二个参数time_shift(时间偏移量)
这个参数允许从过去一段时间内引用数据
步骤:创建自定义key>>创建监控项目>>创建监控图形>>将监控模板关联到主机创建自定义key
1)修改配置文件
vim /usr/local/etc/zabbix_agentd.conf
//去掉264行的注释
264: Include=/usr/local/etc/zabbix_agentd.conf.d/
新建此文件
vim /usr/local/etc/zabbix_agentd.conf.d/count.line.passwd
UserParameter=count.line.passwd,wc -l /etc/passwd | awk '{print $1}'
// UserParameter=自定义key的名称,命令或脚本,要求绝对路径
测试自定义key
killall zabbix_agentd
zabbix_agentd //重启agent服务
zabbix_get -s 127.0.0.1 -k count.line.passwd
- 创建监控项目
Configuration(配置)>>Template(模板)>>Create template(创建模板)
创建完成模板后,默认模板中没有任何应用、项目、触发器、图形等资源。这里需要点击模板后面的Application(应用集)链接打开创建应用的页面,点击Application(应用集)后,会刷新出下图所示页面,在该页面中点击Create application(创建应用集)按钮。设置应用名称
创建监控项目item,与创建应用一样,在模板中还需要创建监控项目,并在刷新出的新页面中选择Create items(创建监控项)创建项目
接下来,还需要给项目设置名称及对应的自定义key
这里注意了:
key值需要手动书写
- 自定义监控项做完了需要配置触发器,过Configuration–> Templates,找到我们之前创建的count.line.passwd模板,点击模板后面的triggers
- 设置触发器名称,如图所示,点击add添加表达式,填写表达式:监控项为账户数量,最近300秒账户数量大于26
- 选择触发器报警级,Add创建该触发器
- 设置邮件
注意:这里的SMTP电邮是发信人的地址 - 设置动作触发邮件
无数次的发送邮件,只要问题没有解决,60秒发一次
在被监控主机上创建用户超过监控要求的个数,则会触发报警收到邮件