1、关于日志和项目名配置: 日志可在探针agent.config里面配置也可以在外面配置
在外面配置方式为:
-javaagent:/data/path/skywalking-agent.jar=logging.file_name=agent_passport.log,logging.dir=/data/applogs/skyagent/ -Dskywalking.agent.service_name=passport
由于是docker运行项目免得再覆盖配置所以直接再catalina.sh脚本修改覆盖即可
2、6.2版本去掉了web端的登录认证
3、告警的配置
概念:
SLA: 服务可用性(主要是通过请求成功与失败次数来计算)
CPM: 每分钟调用次数
Avg Response Time: 平均响应时间
service_resp_time_rule:告警规则名称 ***_rule (规则名称可以自定义但是必须以’_rule’结尾)
indicator-name:指标数据名称:
op: 操作符: > , < , = 【当然你可以自己扩展开发其他的操作符】
threshold:目标值:指标数据的目标数据 如sample中的1000就是服务响应时间,配合上操作符就是大于1000ms的服务响应
period: 告警检查周期:多久检查一次当前的指标数据是否符合告警规则
counts: 达到告警阈值的次数
silence-period:忽略相同告警信息的周期
message:告警信息
webhooks:服务告警通知服务地址
默认告警包含
1、服务serviceapi的响应时间在过去10分钟的3分钟内超过1000毫秒。
2、服务serviceapi的成功率在过去10分钟的2分钟内低于80%
3、服务serviceapi的90%响应时间在过去10分钟的3分钟内超过1000毫秒
4、服务实例serviceapi的响应时间在过去10分钟的2分钟内超过1000毫秒
5、端点serviceapi的响应时间在最后10分钟的2分钟内超过1000毫秒
项目中出现error的告警并没有找到方式配置告警
聚合函数: 提供的功能
longAvg. 每个作用域实体的所有输入的平均值。输入字段必须是long类型的。
instance_jvm_memory_max = from(ServiceInstanceJVMMemory.max).longAvg();
在这种情况下,输入是每个service instance jvmmemmory作用域的请求,平均值基于字段最大值。
doubleAvg. 每个作用域实体的所有输入的平均值。输入字段必须为double。
instance_jvm_cpu = from(ServiceInstanceJVMCPU.usePercent).doubleAvg();
在这种情况下,输入是每个ServiceInstance JVM CPU范围的请求,avg基于字段usePercent。
百分位数. 数字或比率表示为分数 100,对于条件匹配输入。
endpoint_percent = from(Endpoint.*).percent(status == true);
在这种情况下,所有输入都是每个端点的请求,条件是 endpoint.status == true.
sum.每个范围实体的总和调用。
Service_Calls_Sum = from(Service.*).sum();
在这种情况下,每个服务的调用。
p99, p95, p90, p75, p50. Read p99
All_p99 = from(All.latency).p99(10);
在这种情况下,所有传入请求的p99值。 thermodynamic.
All_heatmap = from(All.latency).thermodynamic(100, 20);
在这种情况下,所有传入请求的热力学热图。