1. Skywalking 告警
通过/apps/apache-skywalking-apm-bin/config/oal/core.oal 定义指标数据如何查询数据
通过/apps/apache-skywalking-apm-bin/config/alarm-settings.yml定义告警规则.
对一定时间范围内的数据进行计算后告警.
2. Skywalking常用告警指标
3. Skywalking配置文件
alarm-settings.yml
4. 默认报警规则
默认情况下alarm-setting.yml在发行版中提供了默认值。它包括以下规则:
- 过去 3 分钟内服务平均响应时间超过 1 秒。
- 最后2分钟服务成功率低于80%。
- 过去 3 分钟内超过 1 秒的服务响应时间百分比
- 服务实例最近 2 分钟平均响应时间超过 1 秒,并且实例名称与正则表达式匹配。
- 过去 2 分钟内端点平均响应时间超过 1 秒。
- 过去 2 分钟内数据库访问平均响应时间超过 1 秒。
- 过去 2 分钟内端点关系平均响应时间超过 1 秒。
5. 钉钉告警发送
修改配置文件alarm-settings.yml
当对服务发起访问,就从钉钉告警
当对应用发起访问,就会触发钉钉告警
在skywalking控制台中也能看到告警触发记录
作者:上海_运维_Q先生
格式整理:IT运维技术圈