1、数据缺失
可能是数据源或者数据加工导致的
如果是运行时间较长的程序,可以先通过数据的全链路流量等监控数据,排查数据是否抖动,
业务是否有变更等
业务数据库比如从库没有更新等
数据血缘看一下,上游时候有更新,导致问题
如果是刚上线的问题,可以排查一下程序,比如join 等,考虑不到的场景
2、数据偏高或则偏低
不一定是数据有问题,有可能是什么突发运行情况,考虑到业务场景
首先排查数据源的问题,可以通过同比 环比等比较数据源数据,可以做成监控告警
数据集成是否有异常的日志
对比相似的指标,比如有没有相关的漏斗模型,或者其他相似的维度
是不是升级导致的
指标告警
和业务紧密沟通
3、数据趋势的异常
和数据偏高偏低类似
4、数据指标相互矛盾
往往是统计口径的问题,要注意指标口径的统一,这样沟通也方便,
不同的人,对指标和口径的理解也可能有异常,
最好有指标文档,但是指标文档大家理解起来也会有歧义,这个要注意多沟通和宣贯
5、数据违背常识
大于100%等问题,这是低级的问题,往往是逻辑问题,
其次可能是数据源
数据问题,要有全链路数据思考问题,
要有监控告警的处理方式,及时收集相应问题
新版本上线,要对数据敏感
开发的逻辑要清楚,分层明确,指标解耦
注意总结和积累