2018年国内大数据公司50强榜单排名已经公布了出来,大快以黑马之姿闯入50强,并摘得多项桂冠。Hanlp自然语言处理技术也荣膺了“2018中国数据星技术”奖。对这份榜单感兴趣的可以找一下看看。本篇承接上一篇《DKM平台监控参数说明》,继续就大快的大数据一体化处理架构中的平台监控参数进行介绍和说明。

大数据平台的监控 大数据平台监控指南_大快大数据平台

DKhadoop大数据处理平台架构的安装相关文章已经分享过,详细的内容可以找一下看看。在上一篇中已经就集群平均负载、集群磁盘使用情况、HDFS监控界面、Hbase监控界面等监控参数进行说明。今天就把剩下的一些监控参数一起介绍完,关于大快大数据处理平台监控参数的介绍就完整了。

1、Yarn监控界面

(1) 执行失败的应用程序

大数据平台的监控 大数据平台监控指南_大数据服务平台_02

监控 yarn资源管理中总执行失败的应用程序数量

纵轴表示应用程序数量,单位个

横轴表示时间,单位分钟

(2)已提交的应用程序

大数据平台的监控 大数据平台监控指南_大数据平台的监控_03

监控 yarn资源管理中已提交的应用程序数量

纵轴表示应用程序数量,单位个

横轴表示时间,单位分钟

(3)正在运行的应用程序

大数据平台的监控 大数据平台监控指南_大数据服务平台_04

监控 yarn资源管理中正在运行的应用程序数量

纵轴表示应用程序数量,单位个

横轴表示时间,单位分钟

(4) 等待执行的应用程序

大数据平台的监控 大数据平台监控指南_大数据平台的监控_05

监控 yarn资源管理中等待执行的应用程序数量

纵轴表示应用程序数量,单位个

横轴表示时间,单位分钟

(5)已完成的应用程序

大数据平台的监控 大数据平台监控指南_大数据基础服务平台_06

 

监控 yarn资源管理中已完成的应用程序数量

纵轴表示应用程序数量,单位个

横轴表示时间,单位分钟

(6)被kill的应用程序

大数据平台的监控 大数据平台监控指南_大快大数据平台_07

监控 yarn资源管理中被杀死的应用程序数量

纵轴表示应用程序数量,单位个

横轴表示时间,单位分钟

2、Spark监控界面

注意:(spark 运行任务后才有监控数据)

(1) 最大可使用内存

大数据平台的监控 大数据平台监控指南_大数据管理平台_08

监控 Spark 集群中最大可使用的内存

纵轴表示内存容量,单位MB

横轴表示时间,单位分钟

(2)已使用的内存

大数据平台的监控 大数据平台监控指南_大快大数据平台_09

监控 Spark 集群中已经使用的内存

纵轴表示内存容量,单位MB

横轴表示时间,单位分钟

(3)剩余内存

大数据平台的监控 大数据平台监控指南_大数据基础服务平台_10

 

监控 Spark 集群中剩余的内存

纵轴表示内存容量,单位(MB)

横轴表示时间,单位分钟

(4)Spark中任务数量

大数据平台的监控 大数据平台监控指南_大数据基础服务平台_11

监控 Spark 集群中任务数量

纵轴表示内存容量,单位MB

横轴表示时间,单位分钟

(5)Spark中正在运行的任务数量

大数据平台的监控 大数据平台监控指南_大数据管理平台_12

 

监控  Spark中正在运行的任务数量

纵轴表示内存容量,单位MB

横轴表示时间,单位分钟

(6)正在运行的stage数量

大数据平台的监控 大数据平台监控指南_大数据管理平台_13

 

监控  Spark集群中正在运行的stage数量

纵轴表示stage数量,单位个

横轴表示时间,单位分钟

(7)失败的stage数量

大数据平台的监控 大数据平台监控指南_大数据平台的监控_14

监控  Spark集群中运行失败的stage数量

纵轴表示stage数量,单位个

横轴表示时间,单位分钟

(8)准备就绪的stage数量

大数据平台的监控 大数据平台监控指南_大快大数据平台_15

 

监控  Spark集群中准备就绪的stage数量

纵轴表示stage数量,单位个

横轴表示时间,单位分钟

备注:

(横轴的时间表示采集时间,一般是1分钟一次)