本文是“思路比代码重要”系列的第1篇
1 - 零售超市数据分析(趋势和指标)
01 前言
一不小心快半年没更新了,谢谢读者们的不离不弃。
以前的 “原理+代码” 系列,侧重的是以通俗易懂的方式来讲解一个模型/算法(比如随机森林,不平衡采样),然后再配上注释详细的代码,方便读者学习基本原理和代码实现,最终实现快速上手并为深入学习打下一些基础。
而这篇文章,将开启 “思路比代码重要” 这个新系列,目的是让读者们意识到,很多时候只了解算法模型和捣鼓代码是远远不够的。
平时所学理论是严谨的数学,统计学和代码知识,但真实的商业环境非常复杂
很多算法和模型都是只为强烈的去追求一个结果(如精确度,auc等),这也导致了对数据分析过程认识的缺乏(比如为什么会选用这些指标,为什么会这样分析,我模型跑出来的结果说明了什么?能用/落地吗?)
…
本文的主要分为两个部分:
- 直接走一遍实例(嵌有代码和分析思路)
- 分析思路总结
本文数据代码可以在公主号 “数据分析与商业实践” 后台回复「零售超市」获取
02 商业案例
直接来看面试题
问:拿到这份数据和它的指标解释,15分钟内能不能给出一个初步的分析结果和结论?
请读者至少先思考个5分钟再继续往下看
答:我只知道 2010~2018 年,数据中各项指标的数值都在不断变大,看起来这家公司经营得很不错。
老板:没了?这些我早就知道了。
这里便要开始引入我们的分析思路了(当然上述回答是最低端的)
2.1 看增长率
增长率代表了趋势到底是向好、向坏还是持平。
根据增长率曲线还可以延伸出其他指标:极值点、持续时间,波动幅度等。这里我们选用净销售额同比增长率曲线来作为示例。
同比简介和其计算公式为如下:
同比一般情景下是今年第n月与去年第n月比,如:本期2月比去年2月
同比增长速度=(本期发展水平-去年同期水平)去年发展水平×100%。
这里的数据处理可视化都是用 Python 来完成,但代码都先不展示了,希望把着重点放在对分析思路的理解上。
这里我们同时画出净销售额及其同比增长率两条曲线。我们能看到,尽管销售额一直在增长,但其实并不如我们想象得那么好,增长率在前五年一直下跌且跌幅较大。2016年跌入谷底后,便开始反弹,第一年反弹比较迅速。这里面一定有一些故事值得我们去探索。(提示:2010~2015年,电商井喷式爆发,给很多传统零售企业带来了不小的冲击)
问:为什么选用净销售额而不选取其他指标?
答:因为这只是为了叙述 “看增长率” 这个方法。至于为什么选用这个指标而不用其他的,以及背后的业务知识,之后的文章会提及。这里只要了解 “看增长率” 这个方法就行。
同理,我们也可以同时画出两条增长率曲线。这里选用商品毛利和运营费用的同比增长率,发现尽管商品毛利同比增长率在前五年均有下跌。但还是比同样在下跌的运营费用同比增长率要好,这也说明了一些问题。
2.2 看比例
比例通常代表了结构,它可以让我们看到重点和变化趋势。
1、自行探索的比例:
很多零售超市都有会员制度,既然刚刚我们发现净销售额同比增长率在前五年都呈下跌趋势,那是不是会员费收入情况也如此呢?
这里我们选择查看每年会员费收入占比净销售额,发现好像每年的会员费收入只是占我们所有收入的很小一部分。或许这个就是正常的百货公司?绝大部分收入都靠实体销售收入所得,所以我们只管卖货挣钱就行?
2、指标放在一起看:
当我们把这两两指标放在一起看后,我们发现:
- 运营费用(这里可以理解为成本)和商品毛利呈比较紧密的正相关关系,且二者的间距越来越大,这种趋势是否是好的呢?
- 会员费收入和净利润也呈现强正相关关系。这间公司其实是靠会员费存活的?
3、自带标准的比例:
有些比例本来就自带标准,即根据业务知识和常识我们都知道怎样是好/坏的:
毛利率=商品毛利/商品销售收入。 我们当然希望毛利率能保持在一定水平,能增长就更好。
成本率=运营费用成本/总收入。 我们希望成本率控制在一定水平,能降低更好(控制在一定水平就挺不错了,因为随着时间的推移,物价上涨,行业竞争加剧,多多少少会使成本率越来越高)
毛利率和成本率要有一定距离,越大越好(这样才能赚更多的钱)
我们发现,运营费用比例(成本率)和商品毛利率几乎没有波动(10%与11%),公司经营能力看着很不错?毕竟这么多年来,物价房价早已飞涨。
2.3 投入产出比法
投入产出比=1投入对应N产出(产出/投入)
我们希望投入产出比保持在一定水平,至少不持续下降,越高越好。
回看数据,运营费用可以作为投入项,至于产出项,到底该用毛利、净销售额还是净利润,这一点可以看具体业务和实际要求,这里我们只为学习分析方法。
所以我们选用了毛利/运营费用作为投入产出比,发现投入产出比略有提高(105%~109%),整体上没啥波动。说明这个企业的持续经营能力强。
03 数据+标准=结论
小结
仅有数据分析的过程和一些结果可视化的图片并不足以说明问题,只有辅以明确的标准,才能得出相对可靠的结论。
最后再小结本文提到的方法,其实分析思路没有高低级之分,哪怕在简单的方法其实也有深入分析的空间。空有代码能力而忽略了对业务背景的(深入)探究,也只会心有余而力不足。我们下期见~
- 看增长率:「增长率代表了趋势到底是向好、向坏还是持平」
- 看比例:「比例通常代表了结构,它可以让我们看到重点和变化趋势」
- 有些比例自带标准:「根据业务知识和常识我们都知道怎样是好/坏的,比如毛利率,成本率」
- 投入产出比法:「投入产出比=1投入对应N产出(产出/投入)」
本文数据代码可以在公主号 “数据分析与商业实践” 后台回复「零售超市」获取