数据分析基础理论知识
- 一、数据分析是什么
- 二、数据分析的作用
- 三、数据分析的具体流程
- 1. 明确目的
- 分析现状
- 分析原因
- 预测未来
- 2. 采集数据
- 3. 数据预处理
- 4. 数据可视化
- 5. 撰写报告
一、数据分析是什么
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
重点:
- 汇总和整理
- 提取有用的信息
- 形成结论
二、数据分析的作用
- 过程监控
- 问题溯源
- 战略规划
三、数据分析的具体流程
1. 明确目的
也可以叫识别信息需求。一般在实际业务中,目的比较明确。
一般的目的有三大类
分析现状
对现有的业务数据和竞品数据进行分析,得到当前的情况总结。
分析原因
一般是因为出现了什么问题,需要我们对现有数据进行分析,得到这个问题出现的原因。
预测未来
预测未来即根据数据发展的走向,预测业务未来的趋势。
2. 采集数据
采集数据的方式大的方向可以分为两大类,内部和外部的。
内部即可以直接拿到的数据,不管是我们通过数据库查询得到的数据,还是通过其他业务部门拿到的excel表,都是从内部系统得到的数据,这些数据的特点的是准确并且详细。
外部的数据则是指的外部系统的数据,比如竞品数据或者外部搜集的问卷调查,这类数据的精确度不如内部数据准确,并且存在一定的噪音,通常都要经过过滤清洗,才能得到可靠的数据。
使用的工具为Mysql、Have等数据库相关的软件。
3. 数据预处理
通过采集的数据,是不能满足第一步定义问题所追求的指标的,所以有了这一步,我们对数据进行预处理。
预处理之前有个操作,被称为数据建模。大厂一般都有数据建模师,专门根据问题做数据建模。
数据处理使用的工具为Excel、Python等可以套用函数和库的软件。
4. 数据可视化
经过上一步的处理,我们大致能得到一个趋势或者结果的报表。但是报表并不能直观地表现出数据的走向。所以我们就会通过图表的形式展示出数据,这就是数据的可视化。
数据可视化的工具一般为Excel、R、Python 等。
5. 撰写报告
数据分析报告是数据分析的最后结果,是综合了数据可视化之后总结出的结果和判断。
接收数据分析报告的一般为公司的管理层,管理层对于结果非常看重,反而对于产生结果的原因不在意,所以数据分析报告要做到尽量简洁精准。
数据报告的组成包括
标题,简洁准备描述原因
前言,分析背景目的和解决思路
正文,通过先给出中心观点,再用各个小点分别阐述
结论和建议,简洁地给出改进的方案,并给出解决思路和改进方法
附录,给出报告所需资料,比如原始数据、计算方法等
数据分析报告是整个数据分析的最后产出,非常重要。
你的反馈对我十分重要,请你来投票!