Promethus(普罗米修斯)监控系统

学习目标

能够安装Promethus服务器
能够通过安装node_exporter监控linux
能够通过安装mysqld_exporter监控远程mysql数据库
能够安装grafana
能够在grafana添加prometheus数据源
能够在grafana添加监控cpu负载的图形
能够在grafana图形显示mysql监控数据
能够通过grafana+onealert实现报警

任务背景

某某某公司是一家电商网站,由于公司的业务快速发展,公司要求对现有机器进行业务监控,责成运维部门来实施这个项目。

任务要求

部署监控服务器,实现7*24实时监控
针对公司的业务及研发部门设计监控系统,对监控项和触发器拿出合理意见
做好问题预警机制,对可能出现的问题要及时告警并形成严格的处理机制
做好监控告警系统,要求可以实现告警分级
一级报警 电话通知
二级报警 微信通知
三级报警 邮件通知
处理好公司服务器异地集中监控问题

任务分析

为什么要监控?

答:实时收集数据,通过报警及时发现问题,及时处理。数据为优化也可以提供依据。

监控四要素:

监控对象 [主机状态 服务 资源 页面,url]
用什么监控 [zabbix-server zabbix-agent]=>普罗米修斯监控
什么时间监控 [7*24 5*8]
报警给谁 [管理员]

项目选型:

mrtg:(Multi Router Traffic Grapher)通过snmp协议得到设备的流量信息,并以包含PNG格式的
图形的HTML文档方式显示给用户。
cacti:(仙人掌)用php语言实现的一个软件,它的主要功能是用snmp服务获取数据,然后用
rrdtool储存和更新数据。官网地址:https://www.cacti.net
ntop:官网地址:https://www.ntop.org
nagios:能够跨平台,插件多,报警功能强大。官网地址:https://www.nagios.org
centreon:底层使用的就是nagios。是一个nagios整合版软件。官网地址:https://www.centreo
m.com
ganglia:设计用于测量数以千计的节点,资源消耗非常小。官网地址:http://ganglia.info
open-falcon:小米发布的运维监控 软件,高效率,高可用。时间较短,用户基数小。官网地址:h
ttp://open-falcon.org
zabbix:跨平台,画图,多条件告警,多种API接口。使用基数特别大。官网地址:https://www.z
abbix.com
prometheus:基于时间序列的数值数据的容器监控解决方案。官网地址:https://prometheus.io

综合分析: prometheus比较适合公司的监控需求