[TOC]
## 一.说明
zabbix自带很多模板,包含非常多的监控项可以满足系统层面的大部分要求。
模板有版本要求,有的zabbix-server是4.4版本,但客户端是3.2版本,可能会导致不支持此项监控,具体可以查看主机-》监控项,尽量让客户端和服务端版本一致。
以下是收集的zabbix-5.0上[Template OS Linux by Zabbix agent]模板的监控项,都是根据内容手工翻译的。推荐频率属于比较稳定的,具体根据需求配置。对于机器多的,可以让部分不重要(不搭配触发器)的监控项1h采集一次,减缓压力。
一天 1d 一小时 1h 一分钟 1m 1秒 1s
## 二.监控项
### 基础监控
| 归类 | 名称 | 键值 | 推荐频率 |
|--------|--------|--------|--------------|
| 客户端 | zabbix客户端名称 | agent.hostname | 1h |
| | 客户端是否ping通 | agent.ping | 1m |
| | 客户端版本 | agent.version | 1h |
| | 客户端是否可用 | zabbix[host,agent,available] | 1m |
| | | | |
| 网络(ddl) | 网卡类型 | vfs.file.contents["/sys/class/net/{#IFNAME}/type"] | 1h |
| | 运行状态 | vfs.file.contents["/sys/class/net/{#IFNAME}/operstate"] | 1m |
| | 网卡出接口每秒报文被丢弃数 | net.if.out["{#IFNAME}",dropped] | 3m |
| | 网卡进接口每秒报文被丢弃数 | net.if.in["{#IFNAME}",dropped] | 3m |
| | 网卡出接口每秒流量bps | net.if.out["{#IFNAME}"] | 3m |
| | 网卡进接口每秒流量bps | net.if.in["{#IFNAME}"] | 3m |
| | 网卡出接口每秒错误数据包数 | net.if.out["{#IFNAME}",errors] | 3m |
| | 网卡进接口每秒错误数据包数 | net.if.in["{#IFNAME}",errors] | 3m |
| | | | |
| 内存 | 系统中总共swap | system.swap.size[,total] | 1h |
| | 系统可用swap | system.swap.size[,free] | 1m |
| | 系统可用swap百分比 | system.swap.size[,pfree] | 1m |
| | 系统总共内存 | vm.memory.size[total] | 1h |
| | 系统中可用内存 | vm.memory.size[available] | 1m |
| | 系统可用内存百分比 | vm.memory.size[pavailable] | 1m |
| | 系统中已用内存百分比 | | |
| | | | |
| 系统信息 | 系统主机名 | system.hostname | 1h |
| | 系统本地时间 | system.localtime | 1h |
| | 操作系统架构 | system.sw.arch | 1h |
| | 系统版本信息 | system.sw.os | 1h |
| | 系统安装包信息 | system.sw.packages | 1h |
| | 系统详细信息 | system.uname | 1h |
| | 系统运行持续时间 | system.uptime | 1h |
| | 系统开机时间 | system.boottime | 1h |
| | 系统配置的最大文件描述符数 | kernel.maxfiles | 1h |
| | 系统配置的最大进程数 | kernel.maxproc | 1h |
| | 系统中总共进程数 | proc.num | 1m |
| | 系统中正在运行的进程数 | proc.num[,,run] | 1m |
| | 登陆用户数 | system.users.num | 10m |
| | 系统中/etc/passwd文件的md5值 | vfs.file.cksum[/etc/passwd] | 15m |
| | | | |
| 磁盘(ddl) | 可用inode百分比 | vfs.fs.inode[{#FSNAME},pfree] | 1m |
| | 磁盘总共空间 | vfs.fs.size[{#FSNAME},total] | 1m |
| | 磁盘已用空间 | vfs.fs.size[{#FSNAME},used] | 1m |
| | 磁盘已用空间百分比 | vfs.fs.size[{#FSNAME},pused] | 1m |
| | | | |
| cpu | 系统cpu的1分钟负载 | system.cpu.load[all,avg1] | 1m |
| | 系统cpu的5分钟负载 | system.cpu.load[all,avg5] | 1m |
| | 系统cpu的15分钟内负载 | system.cpu.load[all,avg15] | 1m |
| | 系统cpu核心数 | system.cpu.num | 1h |
| | 系统cpu每秒中断数 | system.cpu.intr | 1m |
| | 系统cpu的每秒上下文切换数 | system.cpu.switches | 1m |
| | 系统cpu用户空间使用百分比 | system.cpu.util[,user] | 1m |
| | 系统cpu的io操作使用百分比 | system.cpu.util[,iowait] | 1m |
| | 系统cpu的硬中断使用百分比 | system.cpu.util[,interrupt] | 1m |
| | 系统cpu的空闲时间占用百分比 | system.cpu.util[,idle] | 1m |
| | 系统cpu的软中断使用百分比 | system.cpu.util[,softirq] | 1m |
| | 系统cpu系统空间使用百分比 | system.cpu.util[,system] | 1m |
| | 系统cpu虚拟化使用百分比 | system.cpu.util[,steal] | 1m |
| | 系统cpu进程优先级变更使用的百分比 | system.cpu.util[,nice] | 1m |