数据分析思路及流程

数据分析可以分为数据获取与存储、数据探索(EDA)、数据预处理、数据建模与分析、数据可视化展现(汇报结论)这五个主要的流程。

数据分析过程的6个步骤 数据分析的五个步骤_数据


数据分析过程的6个步骤 数据分析的五个步骤_数据建模_02

该过程需要占用大量的精力和时间(约60%)进行数据准备,包括数据抽取、数据清洗、数据探索、数据转换。

但对于一个数据分析项目来说,里面的有些流程也并不一定是必须的,侧重点也并不一定相同,主要还是要看需求,如果需求偏向业务的话,可能主要流程就是接到业务需求→数据获取→一般从维度与指标方面或者统计学角度出发进行数据分析,得到一些结论→结论汇报给业务方,这种的重点主要还是指标体系的分析,获取数据的各项指标,从数据层面对业务有一定的分析与了解,比如电商想要了解用户的购物行为,就可以通过用户日常浏览的点击、购买、加购、喜欢收藏的行为,从整体上了解网站访问流量趋势的变化,哪些商品很受用户欢迎,网站的商品购买率。单个用户的购物需求后续进行商品推荐等,通过这些数据可以指导后续的一些活动,例如在销售量下降的时候进行促销,还可以用来作为活动效果的评判依据,通过活动前后的指标对比可以较明显得说明活动是否有效果。还可以依据业务指标制定一组数据指标,作为量化的业务指标等。通过数据来说话更有说服力。

需求偏向数据挖掘,重点可能就是数据探索与数据建模方面挖掘出主要特征,然后建立回归或者分类模型,对未来趋势进行预测,从而进行业务优化和防患于未然。当然对业务知识也要熟悉。例如软件新用户留存率分析,通过APP的日志表,把新用户在APP中的各种行为统计出来。根据用户是否有各种行为,及用户是否留存下来,建立决策树模型,找到影响用户是否留存下来的关键因素。从而对软件进行优化以提高用户的留存率。

需求也是复杂多变的,这也只是我的一个较为宏观的理解,具体分析还是要与公司和行业的具体需求挂钩。