都说监控是运维的眼睛,这短短几个字便直接概括了监控的重要性,但监控系统千千万,仅常用的几款主流监控系统都各有千秋,如何选择适合的监控系统,如何发挥监控的最大效用成为了运维亟需解决的问题。
今天给大家简单对比分析几款常见的监控系统:Zabbix、Prometheus、Nagios、Grafana等),并附上对应的学习资料,供大家参考学习。
Zabbix
Zabbix是一个分布式监控系统,拥有良好的扩展性,同时功能也十分丰富,可以监控CPU负荷、内存使用、磁盘使用、网络状况、端口监视、日志监视等。虽然是一款老牌监控系统,但是适用范围很广,好评率也很高,堪称是监控系统的王者。
这份Zabbix文档是由杰哥亲自整理的,一共159页7大部分,包括Zabbix入门基础和实战案例,图文并茂,干货满满。
目录:
- 监控服务介绍
- zabbix规划及部署
- zabbix监控入门基础
- zabbix proxy
- zabbix监控案例实战
- zabbix事件通知机制
- zabbix自动化运维
Zabbix监控入门基础
- 监控Linux系统
- 监控tomcat
- Zabbix主动与被动监控模式
Zabbix监控案例实战
- 监控Linux TCP连接状态
- 监控memcache
- 监控Redis
- 监控Nginx
- SNMP监控
- 监控MySQL
- 自定义端口和进程监控
- 故障自治愈功能
- grafana图形展示
- 自定义基础监控模板
- 结合Python脚本监控案例
Prometheus
Prometheus作为一个数据监控解决方案,是新一代监控系统的代表,近年来十分火爆,相较于Zabbix,Prometheus更灵活。
这份Prometheus操作指南,一共244页,几乎涵盖了Prometheus所有核心知识点,更适合有一定基础的朋友提升使用。
目录
- 第1章 天降奇兵
- 第2章 探索PromQL
- 第3章 Prometheus告警处理
- 第4章 Exporter详解
- 第5章 数据与可视化
- 第6章 集群与高可用
- 第7章 Prometheus服务发现
- 第8章 监控Kubernetes
- 第9章 Prometheus Operator
Prometheus告警处理
- Prometheus告警简介
- 自定义Prometheus告警规则
- 部署AlertManager
- Alertmanager配置概述
- 基于标签的告警处理路由
- 使用Receiver接收告警信息
- 告警模板详解
- 屏蔽告警通知
- 使用Recoding Rules优化性能
集群与高可用
- 本地存储
- 远程存储
- 联邦集群
- Prometheus高可用
- Slertmanager高可用
Nagios
Nagios是一个企业级的监控系统,可监控服务的运行状态和网络信息等,并能监视所指定的本地或远程主机参数和服务,同时提供异常告警通知功能等。虽然Nagios也占领了一定的市场份额,不过它的功能还有待增强。
这份51页Nagios详细教程,包括Nagios简介、基本原理、安装、基本配置等内容,图文结合,都是一些基础核心知识。
Garafana
Grafana和Prometheus一样,都是用Go编写的。Granafa支持许多不同的数据源,每个数据源都有一个特定的查询编辑器,该编辑器定制的特性和功能是公开的特定数据来源。
这份Grafana是一位使用者总结的学习笔记,更贴近学习者学习的路径,通俗易懂,可以拿来一读。