作者:胡呈清

爱可生 DBA 团队成员,擅长故障分析、性能优化,个人博客:https://www.jianshu.com/u/a95ec11f67a8,欢迎讨论。



Zabbix Server5.4

我们可以在 Zabbix 官网的“解决方案-数据库”页面中发现 Zabbix 对 TiDB 的监控方案:https://www.zabbix.com/cn/integrations/tidb

监控逻辑:

  1. 通过 HTTP agent 方式,Zabbix server 主动调用 TiDB 的监控接口(比如 http://127.0.0.1:10080/metrics)获取监控数据;
  2. Zabbix 使用 Prometheus to JSON 功能(在4.2版本引入)对监控数据进行预处理,变成 JSON 格式;
  3. 再通过 JSONPath 功能取出任何想要的指标,比如所有 query 的总响应时间。

上述所说的内容都已经做成了模板,安装好就能够使用(部分表达式有错误,后文会指出)。不过要求也比较严格:

Zabbix 版本要求:>=5.4
而 Zabbix5.4 对操作系统也有要求:

  • Zabbix Server RHEL8/CeontOS8
  • Zabbix agent CeontOS6/7/8

主要是因为 Zabbix 的各版本兼容性较差,监控模板导出后基本无法导入到其他版本。如果要在其他版本使用,正确姿势是:

版本不低于4.2(4.0.x 最新版本不支持);

  • 参考 5.4 版本上默认的模板,手工创建监控模板和其中的 item 、trigger 等。
  • 我们先来看看 Zabbix5.4 上的使用方法。

1. 安装

参考官方文档即可,步骤非常简单:https://www.zabbix.com/cn/download?zabbix=5.4&os_distribution=centos&os_version=8&db=mysql&ws=apache

2. 添加host

路径:Configuration > Host

注意需要手工添加红框处的接口,其他版本默认就有:

技术分享 | Zabbix 监控 TiDB (一)_数据

3. 关联模板

给 host 关联 TiDB 监控模板:

默认就有 TiDB by HTTP 、TiDB PD by HTTP 、TiDB TiKV by HTTP 这3个模板,关联到 host 即可(这个 host 装了哪些就关联哪些)

技术分享 | Zabbix 监控 TiDB (一)_HTTP_02

4. 修改宏

模板中的 ​​{$TIKV.UL}​​​、​​{$TIKV.PORT}​​ 这两个宏需要修改:

技术分享 | Zabbix 监控 TiDB (一)_数据_03

​{$TIKV.PORT}​​ 指定对应的端口就行,如果使用的是默认端口就不需要修改了;

​{$TIKV.URL}​​ 在模板中的值是 localhost,它在 master item 中使用(其他 item 类型都是 dependent item):

技术分享 | Zabbix 监控 TiDB (一)_HTTP_04

技术分享 | Zabbix 监控 TiDB (一)_Zabbix_05

它是通过 HTTP agent 的方式去获取的监控指标,URL 就是用 ​​{$TIKV.URL}:{$TIKV.PORT}/metrics​​​ 表示的,我们要实现的是每个 TiDB、TiKV、PD 都替换成对应的接口,比如 10.186.64.59:20180/metrics,只需要用 ​​{HOST.IP}​​​ 替换 ​​{$TIKV.URL}​​ 这个宏即可:

  • ​{$TIKV.URL}​​ 是个自定义宏,所以需要在模板的宏定义中指定值(注意这个值只能是确定的值,而不能继续用宏表示);
  • ​{HOST.IP}​​ 是个内部宏,会自动取对应 host 的 IP,所以不再需要指定值。

5.查看监控数据

在 Monitoring-Latest data 页面中查看到有监控数据就说明成功了:

技术分享 | Zabbix 监控 TiDB (一)_TiDB_06