作为数据分析师,经常遇到某个指标异常波动(如日活同比或环比大幅下降)的分析需求,很多数据分析都有为此而苦恼的经历。

如何解决指标波动的分析问题呢?掌握常见指标波动的分析方法,再结合行业知识和公司业务逻辑进行分析,有助于找出数据波动的原因,最终促进运营策略发现和业务增长。

案例:

某出行类APP本周二A、B、C、D四个城市同比上周二大幅下降,触发了最新建立的预警规则中的绝对波动预警(同比变化幅度),预警规则显示A、B、C、D三个城市日活同比分别下降6%、10%、12%和15%,但没有触发相对波动预警规则(即在预设的时间段内波动幅度没有异常,在标准差的限定范围内)。

分析该APP周二A、B、C、D四个城市日活下降的原因。

01 分解法与对比法结合

  1. 分解法

(1) 物理指标分解

如按城市、渠道、手机操作系统、手机品牌,时间段等。

(2) 计算指标分解

如有GMV=平均客单价*订单量,并将分解后的指标再按物理指标分解。

  1. 对比法

对比法主要是同比、环比的计算。

一般需要将分解法和对比法结合起来,才能找出变化的原因。

02 事件分析法

  1. 自然事件

如天气、自然灾害,以及最近发生的疫情等。

出行类app尤其容易受天气原因影响。

  1. 人为事件

(1) 内部事件

如运营活动、产品改版等。

(2) 外部事件

如电商自然流量变化,被竞争对手侵占等。

03 案例分析

  1. 分解法与对比法结合

案例中日活不能再分解为其他计算指标,且已经细分到城市,而手机操作系统、手机品牌等短期内不会对日活直接造成影响。所以,可只考虑按渠道、时间段分解。

通过与运营同学的沟通,发现近期渠道没有发生变化,所以分解的只有时间段。然后,再结合对比法分析。

分析结果如下图:

机器学习处理数据分布波动较大的方法 数据波动幅度分析方法_机器学习处理数据分布波动较大的方法

从上图中,可以看到分小时计算的日活本周二比上周二少了几个高峰,其中A城市少了10时、15时、16时、20时四个高峰,而B、C、D三个城市只少了10时、20时两个高峰。

其他两个高峰时段为出行早晚高峰时段,本周二和上周二一致。

接下来,需要分析不一致的几个高峰时段,是什么事件导致了这些时段的日活出现高峰。

  1. 事件分析法

从触发的预警规则看,近期日活一直在大幅波动,因为只触发了绝对波动预警(同比变化幅度),而没有触发相对波动预警(标准差)。所以分析近期各类运营活动在本周二和上周二两天有什么变化。

对各类运营活动数据进行分析后,发现这四个城市仅有push运营活动数据有大幅变化。分小时看A、B、C、D四个城市的点击用户,并与分小时的日活变化对比,结果如下:

机器学习处理数据分布波动较大的方法 数据波动幅度分析方法_机器学习处理数据分布波动较大的方法_02

从上图中,可以看到四个城市点击push用户的高峰时段与上周二日活高峰时段(除早晚出行高峰时段外)完全一致,并且从数值上分析也一致。

综上,可以得出结论:A、B、C、D四城市本周二日活同比上周二大幅下降的原因是,本周二没有大规模点击的push存在。由此也可以看出,push对日活的影响非常大。

具体A城市为什么多了一个高峰,再分析A城市的push。通过具体对比本周二和上周二发送的push,发现上周二15时对A城市单独发送了一条push,并分别在10时、20时对所有城市发送了一条push。

结语:

优秀的数据分析师是在数据敏感度(熟悉行业知识才能谈得上数据敏感度)、数据分析技能、商业意识、职业素养等综合方面的能力都突出的分析师。所以,数据分析师对自我提升的要求不能松懈,持续学习、总结经验,最终转化为自己的内在知识,才能从众多能力参差不齐的数据分析师中脱颖而出。