可视化学习小组第一周:解构数据可视化
【数据科学家学习小组】之数据可视化(第一期)第一周(20191111-20191117)mp.weixin.qq.com
完整的数据可视化过程可以分为四个步骤:
- 确定数据可视化的主题;
- 提炼可视化主题的数据;
- 根据数据关系确定图表;
- 进行可视化布局及设计;
1.确定数据可视化的主题
根据实际业务需求来确定可视化的目的,做可视化之前要先知道为什么要做。
2.提炼可视化主题的数据
2.1确定数据指标
根据目的去确认需要哪些指标,有针对性的作图。比如快递寄件业务,指标就有寄件量,运 输时效,下单渠道等等
2.2明确数据间的相互关系(选择指标维度)
趋势型:通常研究的是某一变量随另一变量的变化趋势,常见的有时间序列数据的可视化。
例:趋势型-折线图
对比型:对比两组或者两组以上的数据,通常用于分类数据的对比。
例:基于分类的对比-柱状图
比例型:数据总体和各个构成部分之间的比例关系。
例:饼图
分布型:展现一组数据的分布情况,如描述性统计中的集中趋势、离散程度、偏态与峰度等
例:符合正态分布的直方图
区间型:显示同一维度上值的不同分区差异,常用来表示进度情况。
例:表示进度的仪表盘图
关联型:用于直观表示不同数据之间的相互关系,如包含关系、层级关系、分流关系、联结关系等。
例:表达流程关系的漏斗图
地理型:通过数据在地图上的地理位置,来展示数据在不同地理区域上的分布情况,根据空间维度不同,通常分为二维地图和三维地图。
2.3确定用户关注的重点指标(问用户两个问题):
在做可视化之前,不仅要知道为什么要做(目的),还要知道我们要做什么(需求),需求来自于我们的用户,所以在动手之前,我们要知道客户最想要看到的信息是什么?客户为什么想把这些信息展示出来?通过这两个问题,就能了解到客户的核心诉求了。
3.确定图表
根据目的,需求,去选择最合适的图表去可视化数据,切记不能炫技,可视化的目的是简洁明了,突出主题。
居士分享的常见的数据关系和图表类型的对应关系
4.可视化布局及设计
4.1页面布局
4.1.1聚焦
凸显主体,吸引用户,提高效率
4.1.2平衡
合理利用空间,保持元素间的空间平衡,提高设计美感
4.1.3简洁
突出重点,避免冗余
4.2图表制作
4.2.1数据层面
数据中的极端值,异常值,或过多的分类等,都会影响可视化的效果,可以通过前期的预处理来清洗整理数据,达到我们想要的效果
4.2.2分数据层面
图表形状,颜色,边框,背景,网格等辅助元素,一定程度上可以帮助用户聚焦,但使用过当的情况下会使得图表杂乱,视觉上不够聚焦,影响观看
思维导图总结:
5.细节补充
Tao:对数据可视化步骤的说明及补充zhuanlan.zhihu.com
6.下一篇
Tao:数据可视化2-时序数据和比例型数据zhuanlan.zhihu.com