GCMonitor 统一数据平台监控与运维系统是南大通用公司开发的GBase数据库配套工具。为用户提供了可视化的数据库节点监控数据,及时的报警功能,直观的数据库节点状态和性能趋势展示,可靠的数据分布视图和数据库节点会话、系统日志等展示。

统一数据平台监控与运维系统主要包含采集代理、采集中心和监控网站三大部分功能模块:

Agent:监控数据采集代理,部署到所有待采集数据的数据库节点。

Center:数据采集中心,用于统一协调各个Agent的数据采集,并对采集到的数据进行逻辑运算处理,存储到资源库。

Website:监控网站,提供监控界面,与用户进行交互,完成数据库节点监控功能。

安装与初始化

解压自动安装包

本平台支持多个操作系统,以Linux操作系统为例,其他操作系统使用相应的安装包。假设安装包为GBase8sV8.8Monitor_1.0.0_1_Linux_x86_64.tar,并将其放置到/opt/gcm_install目录下,并解压该压缩包。

启动服务与连接配置

在部署web端的时候采用全局的统一配置,就可以实现web端的部署和启动。简化流程,从而实现安装部署的易用性,并实现了在web端进行采集中心以及采集代理的页面化安装配置,减化了各自安装的繁琐步骤。

步骤一,进入解压好的安装包,进入tomcat的bin目录,执行./ startup.sh命令启动tomcat(文档中使用tomcat);

步骤二,启动tomcat服务后,访问http://[ip]:[port]/gcmonitor页面,

grof监控平台 gs监控_数据库

点击“配置”按钮进行全局配置页面;

步骤三,根据提示填写配置页面中的相关参数,如下图所示:

grof监控平台 gs监控_数据库_02

步骤四,填写后点击“连接”保存配置,后台保存信息并校验配置项的可用性;

步骤五,根据配置的参数,后台程序修改应用中的properties配置文件。

即可完成数据库的初始化的配置。

在浏览器中输入统一监控网站地址,如:http://[ip]:[port]/gcmonitor,进入用户登录界面,如下图所示:

grof监控平台 gs监控_tomcat_03

输入用户名、密码后(默认admin:admin),单击回车或者点击“登录”按钮,系统将进行用户校验,如果用户名和密码校验正确,则进入统一监控主界面;否则提示错误信息:登录失败,请检查用户名和密码!

在成功登录监控网站后,将进入到网站主界面,如下图所示:

当初始化登录监控平台,目前尚未配置采集中心和采集代理,所以提示采集中心不可达。也并未采集到任何数据。若此时采集中心与采集代理都能正常连通,则可以显示:数据库节点名称,数据最后更新时间,版本信息,报警信息,数据库空间利用率,VP繁忙率,数据库节点模式,会话数,DB Page R/W ,虚拟内存使用率。

新增GBase 8s监控

新增一个GBase 8s的监控,分为3个步骤:新增8s集群、初始化采集中心、初始化采集代理,这三个步骤通过监控平台管理来完成。

 平台管理

平台管理主要用于提供数据库节点监控的基础数据维护。平台管理包括了用户、角色、数据库节点、采集中心、监控策略、报警级别、监控日志、监控历史数据管理八大功能模块。

用户可以通过在主页导航中点击“平台管理”进入到平台管理界面,如下图所示:

grof监控平台 gs监控_数据库_04

新建8s集群

选择平台管理后,可以新建8s集群,如下图所示:

grof监控平台 gs监控_grof监控平台_05

在弹出框中填写对应的信息,并选择是否新建策略,即可完成新建集群的工作。

新建集群后,即可在右侧操作栏,进行初始化采集中心和采集代理的工作。

初始化采集中心

步骤一,页面中进入采集中心管理;

步骤二,输入相关的配置信息,如下图所示:

grof监控平台 gs监控_数据库_06

步骤三,保存成功后进行自动化安装(安装前需要用户输入服务器的连接密码);

步骤四,安装成功后,点击“启动”按钮启动center;

步骤五,查看列表中的状态,确保安装启动完成。

初始化采集代理

步骤一, 首先进入采集代理服务管理页面,点输入相关的配置信息,如下图所示:

步骤二,保存成功后进行自动化安装(安装前需要用户输入服务器的连接密码);

步骤三,点击服务状态和监控状态的“启动”按钮,启动采集代理。

采集中心和采集代理正常工作下,等待一个采集周期的数据回传,在集群状态页面就可以显示采集信息了。

监控展示

数据库整体状态监控

在集群监管页面中,我们可以监管本平台所有类型实例的集群,并展示各个集群当前的状态,单独选择某个集群,可以查看其下所有采集中心与采集代理的节点情况。 

数据库节点监管

点击数据库节点监管主界面的8s数据库节点名称,进入该数据库节点的节点概要信息界面,左侧显示8s数据库节点监控导航栏,界面显示如下:

grof监控平台 gs监控_数据_07

本界面包括三部分功能,

节点概要信息:数据库当前状态,以及基本信息;

趋势图信息:系统信息趋势图,以及数据库信息趋势图;

Top Busy Session列表信息。

会话监控概要信息

会话监控中的会话监控概要信息,会向趋势图中实时加载当前会话活跃的sql,数据库事务以及锁请求。

Top Lock Table

本功能展示top50的lock table的锁情况,如下图所示:

报警信息

报警信息展示了所选时间范围内,不同类型的报警信息以及具体报错信息,包含报错所在的ip以及对应的指标。可以通过该页面进行错误信息的一览,以便及时有效的根据报警级别,进行报警的归类以及处理。

grof监控平台 gs监控_数据_08

性能分析报告

性能分析报告通过选择性能分析包括的分析时段,以及选择需要分析的子项,系统会自动给出一个分析报告。

可以查看执行数据库,指定时间段,指定子项的分析报告,点击“结果分析”,在结果分析下方展示具体的分析报告,还有对应的指标的趋势图表。

grof监控平台 gs监控_数据_09

如上图,选择CPU使用情况趋势图后,分析出当前数据库活动最高的表还有对应的cpu平均繁忙率,数据库繁忙率和操作系统平均加载情况的趋势图,更加清晰的了解过去某一段时间内的情况。

本平台还支持将所选分析报告导出Word已经pdf文档。

总结

统一数据平台监控与运维系统支持对单个或多个数据库节点的监控,通过对数据库节点系统资源利用情况、网络通讯情况、进程运行情况和数据库节点运行状态等信息的采集,并根据用户设定的报警策略进行计算,如有报警,及时通知用户报警信息,以避免数据库节点出现故障。支持采集信息持久化到数据库中,并提供从多个维度对数据库节点的性能进行分析、展示,大大方便用户对数据库节点进行调优或排查问题。