1. Skywalking 告警

通过/apps/apache-skywalking-apm-bin/config/oal/core.oal 定义指标数据如何查询数据

通过/apps/apache-skywalking-apm-bin/config/alarm-settings.yml定义告警规则.

对一定时间范围内的数据进行计算后告警.


2. Skywalking常用告警指标

config/oal/core.oal
https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-alarm.md

云原生--Skywalking 配置钉钉告警_响应时间


3. Skywalking配置文件

alarm-settings.yml

云原生--Skywalking 配置钉钉告警_响应时间_02


4. 默认报警规则

默认情况下alarm-setting.yml在发行版中提供了默认值。它包括以下规则:


  • 过去 3 分钟内服务平均响应时间超过 1 秒。
  • 最后2分钟服务成功率低于80%。
  • 过去 3 分钟内超过 1 秒的服务响应时间百分比
  • 服务实例最近 2 分钟平均响应时间超过 1 秒,并且实例名称与正则表达式匹配。
  • 过去 2 分钟内端点平均响应时间超过 1 秒。
  • 过去 2 分钟内数据库访问平均响应时间超过 1 秒。
  • 过去 2 分钟内端点关系平均响应时间超过 1 秒。


5. 钉钉告警发送

修改配置文件alarm-settings.yml

当对服务发起访问,就从钉钉告警

rules:
service_cpm_rule:
metrics-name: service_cpm
op: ">"
threshold: 1
period: 2
count: 1
silence-period: 2
message: 服务 {name} 访问次数大于1




dingtalkHooks:
textTemplate: |-
{
"msgtype": "text",
"text": {
"content": "Apache SkyWalking Alarm: \n %s."
}
}
webhooks:
- url: https://oapi.dingtalk.com/robot/send?access_token=1179c64f197a5da70d4b393111dd47578e58f8112e22f3e00d6632591337c43a

当对应用发起访问,就会触发钉钉告警

云原生--Skywalking 配置钉钉告警_响应时间_03

在skywalking控制台中也能看到告警触发记录

云原生--Skywalking 配置钉钉告警_IT_04

作者:上海_运维_Q先生

格式整理:IT运维技术圈