什么是监控系统?

监控系统在我们的生活中无处不在,开车时的行车记录仪,路口的监控摄像头,医院使用的血压监测仪等等,这些都属于监控系统。这里所写,特指IT的监控系统,它是监控系统资源以及性能的硬件或者软件,其中监控软件比较常见,监控软件又分为单一监控程序和分布式监控程序。单一监控程序包含,window系统的任务管理,Linux系统中的top、vmstat、iostat等,而zabbix、Open-Falcon都属于分布式监控程序,通过这些系统,我们可以了解到设备的繁忙程度,是否有异常的进程暂用资源,监控硬件中比较常见的是,通过传感器获取设备的监控信息。

 

为什么需要监控系统呢?

每个人都有自己的答案,这里,我认为监控是为用户提供稳定、高效、安全的服务,在互联网时代,用户主要通过APP、浏览器等方式来享受公司提供的服务,而线上的业务系统稳定运行依赖的因素很多,大到运营商、IDC、基础设施,小到CPU、内存、应用、代码,任何一个环节故障都可能影响业务的稳定运行,从而给公司造成损失。如果在故障发生前,能及时告警并处理跟进,那么用户可能就无法感知故障。不久的将来,人工智能能将通过自主学习来监控和保障业务的稳定性。

 

监控系统功能

系统一般的监控项 系统监控通常会监控_监控系统

监控系统都有哪些最基本的功能,最基础的就是数据收集,其他的功能都是依赖底层数据收集,数据收集的方式多种多样,可以通过客户端,可以通过snmp协议,或者通过自定义插件等等,最终的目的都是将我们需要的数据,收集上报至监控系统中,但是,人很难直接通过原始数据发现问题,所以图形化展示就变得很有必要,我们可以很直观的从图形中发现数据变化趋势,告警是监控的重要功能,告警功能主要是由告警策略和告警发送两个部分组成,通过策略分析监控数据,匹配规则就会触发告警发送邮件的操作,告警可以通过短信、微信、邮件、电话语音等方式发送,每个告警都会存在历史事件中,便于后期的排查,以及统计分析告警的趋势,报表功能主要对一段时间的监控和告警数据进行分析,为运维和研发提供优化的方向,由于使用监控系统的用户来自不同的部门,他们关心的数据也是不同的,所以统一认证以及权限管理也是监控系统的基本管理之一。

 

监控系统的组成

系统一般的监控项 系统监控通常会监控_监控系统_02

以上这个图,可以更加直观表现数据的流向。

 

开源监控系统的现状

系统一般的监控项 系统监控通常会监控_系统一般的监控项_03

 

监控系统趋势

系统一般的监控项 系统监控通常会监控_系统一般的监控项_04

如何选择监控系统?

明确自己的需求和标准,不断的去了解、测试、记录数据,结合自己的实际情况和未来趋势做出最终的决定

系统一般的监控项 系统监控通常会监控_数据_05