目录
- 各种zabbix角色的配置文件
- zabbix配置项之Items
- zabbix配置项之Graphs
- zabbix配置项之Screens
- zabbix配置项之Trigger
- zabbix配置项之Action
- zabbix配置项之Event
- zabbix配置项之Media Type
一、各种zabbix角色的配置文件
> Server的配置文件为zabbix_server.conf,至少应该为其配置数据库等有关信息;
> Agent的配置文件为zabbix_agentd.conf,至少应该为其指定server的IP地址
> Proxy的配置文件为zabbix_proxy.conf,至少应该为其指定proxy的主机名和server的IP,以及数据库相关信息
> Application:多个item组成一个application
二、zabbix配置项之Items
> Name:监控项的名字
> Type:item的类型,使用哪种方式采集数据
> Key:采集数据时的表达式,key是用来标记item的键,也称为标示符,用来标示唯一的指标,可以接受一个或多个参数
> Type of information:采集的数据类型格式
> Data type:对于type of information的数据类型
> Units:单位
> Use custom multiplier:乘多少倍,比如zabbix默认单位是k,但是linux的内存为kb,那么这里你需要输入1024
> Update interval(in sec):多长时间采集一次
> Flexible intervals:自定义列表
> New flexible interval:自定义只在什么时候采集
> Keep history:数据历史保存多少天
> Keep trends:趋势数据保存多少天
> Store value:保存类型:as is,采集的时候什么样,保存的时候就什么样;delta(speed per second),当前时间点的值减去上个时间点的值,并除以两个时间点之间的时间;delta(simple change),只记录差值
> Show value:显示什么样
> New Application:放到哪个application里面,比如监控网卡信息的item全部放在net的application里面
> Description:描述item
三、zabbix配置项之Graphs
> Name:图的名字
> Width/height:宽和高
> Graph type:图像类型;normal正常图、stacked堆叠图、pie饼图、exploded分裂饼图
> Show legend:显示纵轴横轴
> Show working time:
> Show triggers:显示触发器
> Percentile line(left):
> Percentile line(right)
> Y axis MIN value:Y轴的最小值,刻度,calculated(自动变化),fixed(固定)
> Y axis MAX value:Y轴的最大值,刻度,calculated(自动变化),fixed(固定)
> Items:要组合在一起的监控图像;function(avg平均值,min最小值,max最大值);Draw styple图形类型(line默认线,bold line加粗的线,dot点虚线,dashed line各个横杠组成的线);Y axis side(Y轴的显示位置)
四、zabbix配置项之Screens
> Name:名字
> Columns(列)
> Rows(行)
> 创建完之后返回上一层点击screens然后点击changes添加graph图
五、zabbix配置项之Trigger
> 触发器主要目的是定义域值,超出域值则状态为“problem”,恢复后转换回“OK”
> 触发器表达式高度灵活,可以创建出非常复杂的测试条件
> 创建触发器:
1) Name:触发器的名称,可以使用宏。如$1/$2..等
2) Expression:填写触发器表达式,用于评估触发器状态
3) Multiple problem events generation:依赖于当前触发器的“problem”状态生成其他事件
4) Description:当前触发器的描述信息
5) Url:在screen的“status of trigger”中显示的内容链接
6) Severity:当前触发器的严重级别
7) Dependencies:依赖关系,比如监控机和被监控机中间有一台路由器,路由器挂了,于是主机也连不上了,然后所有主机都会报警,但被监控主机并没有挂掉,zabbix只支持触发器之间的依赖关系,不能定义主机和主机之间的(nagios可以)。
> 基本的触发器表达式格式如下:
{<server>:<key>.<function>(<parameter>)}<operator><constant>
1) Server:主机名称
2) Key:主机上关系的相应监控项的key
3) Function:评估采集到的数据是否在合理范围内时所使用的函数,目前所支持的函数有avg(平均),count(计数),change(改变的值的大小,如;上一次是50这一次是30,改变的大小就是20),date(时间),dayofweek(星期),delta(二者差值),diff(不同之处),iregexp(与正则表达式做匹配),last(最后一次采样),max(最大值),min(最小值),nodata(没有采到值),now(当前的值),sum(求和)等
4) Parameter:函数参数大多数数值函数可以接收秒数为其参数,而如果在数值参数之前使用“#”号作为前缀,则表示最近几次的值,如 sum(300)表示300秒内所有取值之和,而num(#10)则表示最近10次的取值之和
5) 此外,avg、count、last、min和max还支持使用第二个参数,用于完成时间限定;例如,max(1h,7d)将返回一周之前的最大值
6) Operator:表达式;/(除)、*(乘)、-(减)、+(加)、<(小于)、>(大于)、#(不等于)、=(等于)、&(逻辑与)、|(逻辑或)
7) Constant:常数
> 一个例子:
{www.baidu.com:system.cpu.load[all,avg1].last(0)}>3
1) 表示主机www.baidu.com上所有的cpu,在过去1分钟内的平均负载的最后一次取值大于3时,将触发状态转换
2) 对于last函数来说,last(0)相当于last(#)
六、zabbix配置项之Action
> 在配置好监控项和触发器之后,一旦正常工作中的某触发器状态发生改变,一般意味着有异常情况发生,此时通常需要采取一定的动作(action),如告警或者执行远程命令等
> 并非所有的触发器状态发生改变的场景都需要对其进行干预,如状态转变为“OK”时,相应的,如果触发器的状态转变为problem,就需要告知所有关系其相关监控指标的人员了,通知“notification”是zabbix中最常用的动作之一
> 实现zabbix的通知功能需要两个步骤:
1) 定义所需媒介“media”,通常指发送消息的途径,如邮箱等等。
2) 配置一个动作“action”:发送信息至某“媒介”
3) 动作由“条件”和“操作”组成,他的逻辑为当“条件”满足时,就执行相应操作,操作可以使“发送通知”也可以是“执行远程命令”
> 定义action
1) Name:动作的名称
2) Default operation step duration:步长;在故障没有解决之前,每隔多久就发一次通知
3) Default subject:邮件主题(宏)
4) Default message:报警信息(宏)
5) Recovery message:恢复后的操作
6) Conditions:条件,在上面条件下触发operations,一般都要排除“maintenance”维护中的主机
7) Operation:操作,条件满足后,触发操作,action operation:已经配置好的操作;operation details:配置操作区域;operation type:发送消息,或者执行远程命令;from to:指定从第几步到第几步
七、zabbix配置项之Event
> 触发器(trigger)事件:每次触发器的状态发生变化,都会生成相应的事件
> 发现(discovery)事件:zabbix会周期性的扫描“网络发现规则”中指定的IP范围,一旦发现主机或服务,就会生成一个或几个发现事件;发现事件有8类:service up服务启动、service down服务器停止、host up主机上线、host dowm服务上线、service discovery服务发现、service lost服务找不到了、host discovery发现主机和host lost失去主机
八、zabbix配置项之Media Type
> 在zabbix中,媒介指发送通知信息的通道,其通常有一下几种类型
1) Email、SMS、Jabber、自定义的通知脚本(zabbix server可调用其配置文件“AlertScriptsPath”变量,所定义的脚本查找目录中的脚本来完成通知)
转载于:https://blog.51cto.com/xsboke/2346134