一、监控系统的架构体系

大家都知道,监控系统由三大部分组成,一,监控数据采集;二,监控告警分析;三,监控数据报表、可视化。在市面上常见的开源监控软件,或者商业监控软件中,均有很好的实践和体现。

监控系统的架构,通常分为无代理模式C/S有代理模式 C/P/S,当然也有主主节点模式。

computer.png

二、监控系统的核心功能

下面谈谈监控数据的采集问题

数据的收集方式,可以分为主动模式,被动模式,投递模式。分别指的是:

  1. 主动模式:从监控中心去客户端获取数据

  2. 被动模式:从客户端向监控中心发送数据

  3. 投递模式:向监控中心push数据,这种模式,一般适合于时序数据库的监控系统,如OpenTSDB,influxDB,Promethus,在业内均有最佳实践

数据来源可以分为:

  1. 基础架构数据,服务器,OS,网络等层面,俗称主机层面。 

  2. 业务应用数据,如数据库,中间件,web服务等软件应用层面

  3. 日志层面数据,如各种应用的日志,这有日志领域的专门系统来实现,但和监控系统也是有相互关联的。

  4. 代码层面数据,如应用性能监控,针对代码运行的崩溃,错误日志,业务流的跟踪,面对的对象,通常是针对开发者。

  5.  舆论层面数据,如社交网络,新闻评论,博客聊天,这类数据通常由爬虫角色扮演,通常用于用户的评价,其范围有超过运维监控系统本身,但业界已有不少公司均已实践,通常还是运维来维护。

从监控数据的来源我们看到,凡是对业务有用的数据,我们都可以作为监控数据来源。凡是需要做数据分析的,也需要作为监控数据来源。在这种情况下,监控数据采集,已经不是传统意义的采集,而是融合了各种场景的数据采集,最终汇总为大数据处理,故监控系统的数据来源,已经需要各种专门的agent来做了,因为各种场景下面,其用途和扩展性难以统一。而多种agent的维护成本,以及各种agent相互影响,给运维又带来麻烦。因此有出现了all in one的一个需求,把各种组件的agent统一标准,只安装一个agent的需求逐渐出现。当然业内也有实践做到了这一点。

监控告警分析,其实也是一个比较难的问题,设计到数据分析统计的科学,本文不重点探讨这个问题。下面我们来谈谈监控数据可视化。

三、监控数据可视化的意义

监控数据从采集分析到告警,在业界各种监控系统里面已经做得非常成熟了。而监控数据的可视化,却是在近年兴起发展的,无论是开源产品,还是商业产品,均提供了监控数据可视化的解决方案,使用最为广泛的监控数据可视化产品grafana,可以对接各种监控系统,其数据类型又可以分为多种。

监控数据可视化的意义:

  • 直观了然

  • 查找数据方便

  • 统计分析更容易

  • 让监控信息透明化运作

  • 让监控信息为业务运行提供数据依据

datadiff.png

四、监控数据可视化的实践

监控数据可视化的实践,我们首选是grafana,来看看grafana可以做些什么?

  •      可视化

  •      告警

  •      支持插件

  •      开放

  •      扩展

       虽然grafana也提供了很多比较好的体验,但对Zabbix用户来说,依然不足,我们需要更专业的监控大屏,于是,这个时候OneOaaS的监控大屏产生了。

针对数据分析和可视化的痛点,OneOaaS Monitor在这种背景下面应运而生,为运维监控提供了立体化业务监控平台,在解决开源软件监控界面体验问题的基础上,提供了业务监控的视角,引导运维将监控重心转移到真正的业务监控中。

通过监控数据可视化,为运营人员,运维人员提供直观的实时的系统运行状态,让复杂的监控里面变得人人都可以看懂。针对监控报表需求,为用户提供报表,数据分析等模块,让用户通过监控系统为业务提供更多有价值的数据。

     来看看OneOaaS Monitor都有哪些功能呢?

业务看板

appboard1.png

展示业务的流程,如业务流程从前端负载均衡-WEB集群-数据库


基础架构


l   集中展示所有业务平台的运行状态

l   不同颜色标识业务的故障级别

l   展示业务的流程环节

业务状态

performance.png

监控图表

dataview.png


树形图


      以上介绍了部分功能,如需体验,点击http://www.oneoaas.com/products链接,即可下载申请试用。