很多同学会认为Excel是很简单的工具,而数据分析师需要更“高端”的工具来处理数据。事实上,Excel 在数据分析师的日常工作中扮演着非常重要的角色。下面听我一一道来:
一、为什么要学习Excel
- Excel 是被最广泛使用的数据分析工具之一,比较便于跨部门间的沟通;
- 容易上手,不需要学习编程即可操作
- 功能强大,覆盖数据分析的全流程
小贴士:
数据分析全流程:①数据获取 – ②数据清理 – ③数据转换 --④ 数据探索 – ⑤统计分析与建模 – ⑥分析呈现;
数据探索:全面理解数据传达的信息,探索发现进一步深入分析切入点,常见的手段有作图、制表、统计量计算等;
二、在哪里获取数据
数据源的获取可以分为内部数据获取与外部数据获取两个来源;
内部数据:
- 直接获取
- 数据库:xls、xlsx、CSV
- BI工具:灵活度较高,指标可以实现上钻和下钻
- 报表:固化的、成体系的指标构成、可供分析使用
- 收集整理
- 日志:底层数据源,需清洗
- 文档:底层数据源,往往文字数字结合,需清洗
外部数据:
- 第三方数据:如艾瑞咨询、友盟、TalkingData
- 竞品数据:可对比的产品核心数据
- 财报数据:营收、利润、规模、增速
三、Excel必备操作知识
- 函数基础:相对引用 / 绝对引用的深刻理解
- 冻结窗格:冻结首行 / 冻结首列
- 数据排序:单字段排序 / 多字段排序
- 数据筛选:普通筛选 / 高级筛选
- 数据质量:格式不统一 / 删除重复值/逻辑错误值
四、函数:数据统计的重型武器
数据类型:数值型(靠右)、文本型(靠左)、逻辑值(居中)、错误值(有多种)
下面列举一些常用的Excel数据处理和分析类函数:
- 查找引用:VLOOKUP / INDEX / ROW / MATCH
- 计算统计:MAX / MIN / COUNT / SUM / SUMIFS / AVERAGE / STDEV
- 逻辑运算:IF / AND / OR / IFERROR
- 文本函数:LEFT / RIGHT / MID / FIND / TRIM / REPLACE / CONCATENAME / TEXT / LEN / LENB
- 日期函数:DATEDIF / TODAY / NOW / DATE / ;YEAR / MONTH / DAY / WEEKDAY / HOUR / MINUTE / SECOND (提取年、月、日、周、时、分、秒)
Excel函数那么多,如何学习使用所需Excel函数?
- 官网链接
- 使用搜索引擎寻找和学习你所需要的Excel函数,用什么学什么,这样也更高效;
五、数据透视表:数据分析的终极武器
什么是数据透视表(Pivot Table)?
- 对表格信息进行总结和归纳的一站式工具
- 更具体的描述:基于一个有更大信息量的表格、生成统计性总结和归纳的表格。所谓的“统计性总结”可以包括求和、平均值、或其他统计量
数据透视表的常用操作步骤:
第1步:开始选项卡插入“数据透视表”;
第2步:选择透视表字段;
第3步:选择表格数据的计算类型;
第4步:选择表格数据的“值显示方式”;(*)
第5步:对生成的表格进行“加工”方便理解;(*)
其中,第4步、第5步可以依据业务需要进行相关操作即可!
六、数据呈现:Excel可视化图表
数据可视化是非常重要的沟通方式。在日常数据分析师的工作中,可选择的可视化方式包括Excel作图、R的绘图以及Power BI、Tableau等;我们常说的文不如表,表不如图说的其实就是这个道理;
什么是数据可视化?
**数据可视化:**借助于图形化手段,清晰有效传达与沟通数据背后的信息。
为什么要进行可视化?
- 帮助更全面,多角度理解数据
- 向不了解数据的人解释分析结果
- 更容易发现数据的规律和趋势,从而开展进一步的研究
如何选择合适的图表类型:
- 对比分析:
- 应用场景:数值在不同群体的分布
- 图表推荐:柱形图、条形图、山峰图、滑珠图、蝴蝶图、南丁格尔图
- 趋势分析:
- 应用场景:数值走势
- 图表推荐:折线图、面积图
- 占比分析:
- 应用场景:数值比例情况
- 图表推荐:饼图、环形图、树状图
- 关联分析:
- 应用场景:两个数值之间的关系
- 图表推荐:散点图、气泡图、动态气泡图
- 地理分析:
- 应用场景:数值出现的频率
- 图表推荐:着色地图、热力图、三维地图
温馨提示:选择合适、正确的图表类型来表达数据是我们作图的第一步,否则后面图表再美观、再漂亮也无法有力表达我们的观点;通过表达目的来分析我们的图表类型;哪怕是同一种数据类型,哪怕我们的分析的目的不同、表达目的不同,我们就应该选择不同的图表;
七、Excel数据分析经验和建议
分析经验:
- 遇到一份新的数据首先要花时间熟悉一下你要分析或者理解的数据
- 理解各个字段的口径含义(自动思考的过程)
- 理解要分析的主体(比如一份销售数据n个销售单品)
- 理解源数据时间的范围
温馨小贴士:
- 在用Excel进行数据分析时;一定要注意对源数据的保存,这样便于核查;
- 及时保存数据、习惯ctrl + s
- 养成习惯,对于sheet工作表进行命名:数据内容、数据规则等