前言

zabbix作为开源监控平台,其强大是业界公认的。如果想了解zabbix具体功能及使用方法,可以参考链接:
zabbix从入门从精通官方说明文档(什么,打不开?多刷几次 :) )

言归正传,下面就对zabbix维护状态的实现做一个代码层面的分析说明。

版本

本文针对的zabbix版本是2.4.8

文件

主要涉及文件:timer.c

函数调用关系

zabbix server 启动过程中,专门创建了一个timer进程,用于维护状态。
timer进程的入口函数:

ZBX_THREAD_ENTRY(timer_thread, args)
{
...
}

从函数名称上看,像是线程。实际上,是宏定义封装的进程。

timer进程的执行过程如下图所示:

zabbix 新建维护 zabbix 维护模式_zabbix-监控

  1. timer进程每隔30s调用函数process_maintenance(),进行主机维护状态检查和管理。
  2. 该函数依次调用process_maintenance_hosts()、update_maintenance_hosts().
  3. process_maintenance_hosts()工作包括:
    - 查询表maintenance、timeperiod、maintenance_window,得到所有处于维护期的maintenaceid;
    - 针对每个maintenanceid,查询表hosts、maintenance_host,得到所有处于监控状态的主机;
    - 创建处于维护状态的主机列表,将监控主机插入列表。具体过程,调用的是get_host_maintenance();
  4. update_maintenance_hosts()工作包括:
    - 对比maintenance表和host表中状态等字段,对于刚加入维护状态的主机,更新这些主机的host表状态等,并更新内存中的host链表中主机状态;
    - 查询hosts表,获得所有处于维护状态但不在主机维护链表中的主机(即维护状态已过期的主机);
    - 对于维护状态已经过期的主机,更新hosts表中以及内存中host链表中的主机状态,并产生event;
  5. 在函数process_maintenance()的最后,销毁创建的维护主机列表。

数据库表关系

主要涉及的表包括:
maintenances、maintenances_windows、timeperiods、
maintenances_hosts、hosts、
maintenances_groups、hosts_groups

ER图关系如下图所示:

zabbix 新建维护 zabbix 维护模式_zabbix-监控_02

总结

本文对zabbix维护状态的实现进行了浅析,主要从函数调用关系和数据库表关系方面做了阐释。以此做个记录,方便以后查阅。