上一篇文章我们谈到数据分析从入门到进阶需要具备哪些能力,其中很重要的一个就是分析方法和思维,这个可以说是数据分析的底层能力。所谓基础不牢、地动山摇,如果分析思维欠缺,在实际工作中必然是寸步难行,往往就会出现面对问题没想法的尴尬境遇。数据分析是一种能力,任何岗位都应该具备一定的分析方法和思维,这样不仅可以让你的工作更加高效,而且还会达到预期之外的成果。

那何谓好的分析思维呢?下面两张图代表了两种典型的思维方式,我们通过这两张图的对比就能够非常直观的理解两者的区别。

数据分析思维pdf 《数据分析思维》_数据分析

这两种分析思维的主要区别在于逻辑性。第一种分析思维是依赖感觉和经验的线性思维,第二种分析思维则注重严谨的逻辑推导,属于结构化的思维。两种不同的思维方式往往会导致不同的结果。如果没有经过刻意训练,大部分人的思维方式都倾向于第一种,也就是我们经常听到的“我觉得……、我认为……”,长此以往很容易陷入到个人经验主义中。

这篇文章就是关于分析思维系列的,为大家精心整理了数据分析必备十大分析思维,今天带来上篇。话不多说,我们直接上干货!

一、信度与效度

数据分析思维pdf 《数据分析思维》_大数据_02

所谓信度,是指一个数据或指标自身的可靠程度,包括准确性和稳定性。 比如说,在对某个短跑运动员百米成绩进行测量时,如果多次测量成绩都很接近,我们会认 为这个结果是可信的、真实的,也就是信度高。 如果每次测量的成绩都有很大的差异,则说明信度较低。

引申到我们数据分析日常工作中,类似取数逻辑是否正确?有没有计算错误?这些都属于准确性的范畴;每次计算的算法是否稳定?口径是否一致?这些属于稳定性的范畴。

那么当我们在以上两个方面都兼顾到以后,是不是就能够说这是一个好的数据或指标了呢?

其实还不够,还有一个更重要的因素,就是效度!

所谓效度,也就是数据的有效性,指测量结果能够反映想要考察内容的程度。测量结果与所要考察的内容越吻合,则效度越高;反之,则效度越低。 比如说,我们想要考察一个学生的综合成绩情况,如果我们仅测试语文成绩得分,然后得出结论,这样的研究有效性可能很低,原因在于语文成绩并不能代表综合成绩,实际测量的方向与研 究方向之间有较大的偏差。

综上所述,只有在信度和效度上都达标,才是一个有价值的数据指标。

举个小例子:当我们要衡量身体的肥胖情况时,我们不能简单的把身高或者体重作为衡量指标,这两个指标在信度和效度上都有一定的缺陷。但是体脂率,在信度和效度都比较达标,因此可以作为一个比较理想的衡量肥胖的指标。

其实,信度和效度的核心反映的是数据质量问题,这是我们进行一切分析的基础和前提,一定要引起足够的重视。因此我把它放在了十大分析思维的第一位!

二、溯源思维(5 why分析法)

数据分析思维pdf 《数据分析思维》_大数据_03

这种方法最初是由丰田佐吉提出,后来丰田汽车公司前副社长大野耐一举过一个小例子,有一次,他在生产线上发现机器总是停转,虽然修过多次,但仍不见好转。于是他询问工人机器停机的原因,产生了下面的对话:

问题一:为什么机器停了?

答案一:因为机器超载,保险丝烧断了。

问题二:为什么机器会超载?

答案二:因为轴承的润滑不足。

问题三:为什么轴承会润滑不足?

答案三:因为润滑泵失灵了。

问题四:为什么润滑泵会失灵?

答案四:因为它的轮轴耗损了。

问题五:为什么润滑泵的轮轴会耗损?

答案五:因为杂质跑到里面去了。

经过连续五次不停地问“为什么”,才找到问题的真正原因和解决的方法:在润滑泵上加装滤网。

虽说是5why分析法,但使用时不限定只做“5次为什么的探讨”,主要是必须找到根本原因为止,有时可能只要3次,有时也许要10次,正如古语所言:打破砂锅问到底。5why法的关键所在:鼓励解决问题的人要努力避开主观或自负的假设和逻辑陷阱,从结果着手,沿着因果关系链条,顺藤摸瓜,直至找出原有问题的根本原因。这也正是我们做任何分析都要坚持的准则。

三、逻辑树思维

麦肯锡分析问题最常使用的工具就是“逻辑树”。麦肯锡逻辑树又称问题树、演绎树或分解树等。逻辑树是将所要研究的问题分解为一个个子问题,从最高层开始,并逐步向下扩展。这里面涉及到两个概念,“分解”和“汇总”。对应到我们数据分析中,也有两个专业的术语:“下钻”和“上卷”。

所谓下钻,就是在分析某个指标时,按一定的维度不断进行分解。相应的,上卷就是反其道而行。随着维度的下钻和上卷,数据会不断细分和汇总,在这个过程中,我们往往就能找到问题的根源。

在实际工作中,下钻和上卷并不局限于一个维度,往往是多维组合进行交叉分析。

举个简单的小例子:比如我们给自己定个小目标,一个月的时间攒够10万块钱,如果按照结构化的思维我们就可以将问题拆解如下:

数据分析思维pdf 《数据分析思维》_大数据_04

四、公式化思维

刚才我们学习了逻辑树思维,但它有个致命的缺点:不够量化。因此我们在逻辑树分析法的基础上演变出了公式化分析法。

公式化可以简单地看成是利用加、减、乘、除等公式算法来进行量化分析的思维。公式化分析意味着:上下互为计算(一切结构皆可量化)、左右皆呈关联(最小不可分割)。

举个小例子,如果我们想要对交易额指标进行分析,利用公式化逻辑树就可以拆解成下面这个样子:

数据分析思维pdf 《数据分析思维》_数据分析思维pdf_05

五、实验思维

不论在现实生活还是实际工作中,我们也经常会遇到一类问题,比如解决同一问题,往往会有多个方案,那A方案和B方案到底哪个更好,我们应该采用哪一种?这些问题往往令我们左右为难、无法抉择,to be or not to be, it's a question!比如我们打开美团外卖,就有两种展示界面,你知道哪一种更好吗?

数据分析思维pdf 《数据分析思维》_数据_06

那如何避免拍脑袋决策呢,这时就需要通过实验的手段进行科学的决策,也就是我们常说的A/B Test。

那何为A/B Test,简单点说,就是有A、B两个设计方案或版本,在现有认知下不确定哪种方案更优,这时候可以通过小范围发布,得到并比较这两个版本关键核心数据,最后通过数据决定哪种方案更优,然后进行正式发版。

数据分析思维pdf 《数据分析思维》_大数据_07

当然实际进行A/B Test并不是这么简单,需要用到很多统计学的知识,比如如何选取样本,如何计算最小样本量,如何对实验结果进行决策等。

小结

好了,以上就是我们数据分析十大思维系列前五大分析思维。需要说明的一点是,各种分析模型不分排名、不分孰好孰坏。我们一定要深入业务,根据不同的业务场景具体情况具体分析。