目录
1. 背景
2. 环境
3. 模板参数:
1. 背景
Grafana作为一个开源的度量分析和图表化展示工具,可以对接多种数据源,通过对采集到的数据处理后,进行可视化展示,还能设置告警条件进行不同方式的告警。在使用过程中,遇到一些限制的问题,记录在此以供其他需要的朋友们参考。在这篇文章中,使用Grafana对接数据源Prometheus,并设置监控告警条件进行邮件通知。
2. 环境
Grafana v6.3.0
Prometheus v2.12.0
node_exporter v0.18.1
3. 模板参数:
1.导入模板。这里在前一篇(Grafana使用杂记(一)-- 缺少图表插件)中已经介绍过了,这里不再赘述。模板下载地址:https://grafana.com/grafana/dashboards。
2.导入模板并经过一系列数据源的配置后,点击左侧导航栏Dashboards->Manage,选择并点击模板。
3.点击右上角的如下所示图标,在左侧导航栏点击 Variables,进入模板参数的配置页面。
4.Prometheus中的配置文件中,被监测节点(xxx3, xxx2)的job名称为node。
5.创建新的模板参数。这里设置的参数是期望能够过滤出Prometheus中健康的主节点和其他节点。
- Name:模板参数名称。
- Label:模板中显示的名称。
- Type:Query。这里是为了查询。
- Data source:Prometheus。
- Refresh:刷新的方式是按照模板刷新进行刷新。
- Query:查询的条件:
-- label_value:过滤条件。
-- up表示节点为启动状态的;反之是down
-- {job="node"}:这里的job和node都对应prometheus的yml配置文件中的参数。
-- Regex:正则表达式。这里过滤出来是IP的形式表示节点。
点击 Update 以后,满足条件的节点就被筛选出来。这里xxx3和xxx2为被监测节点,xxx8为Prometheus主节点。
6.回到监控的模板中,可以看到在参数一栏,多出来上面添加的参数 Test。这里是一个下拉列表的展示方式,选项即前面过滤出来的节点。
7.设置告警条件
1)在Dashboard中选择 Query 类型。
2)配置Query条件:
- Metrics:度量条件。这里是为了监控节点是否正常,采用prometheus中的up方法。健康的vm返回1,不健康为0或-1。
- Legend:这里设置变量最终影响到图表上线条所代表值的显示。
注意:Grafana的告警条件中不能带变量,只能是常量。即,不能在告警的Query条件中,使用${}这样的变量引用方式。
8.告警的阈值和通知条件。