数据为什么要可视化?
- 一方面是因为数字太抽象,图表更直观,而且图表可以突出数据中的关注点(比如某个月的交易大幅度波动等);
- 另一方面,数据面向的受众大都不具备专业的数据知识,可视化的形式有助于降低读懂数据的门槛;
简言之,数据可视化提高了数据沟通的效率。
举个例子,假设现在年终汇报某KPI的达成情况,数据如下表所示:
可视化后的效果如下:
注:参考图说--目标达成展示
观察可视化后的图表,很容易就能发现Q3没有达标,但年度累计是达标的。
数据可视化的一般步骤(以数据汇报的场景为例):
- 准备原始数据,一般是经过统计的数据;
- 明确展示的对象(给谁看),不同的汇报对象关注的业务角度和数据颗粒度不一样;
- 筛选数据中需要突出的点,确认数据背后要表达的主题或者结论;
- 选择合适的图表类型;
- 选择可视化的工具;
- 根据PPT的风格,调整图表中的文字、线条、形状以及对应的大小、颜色等,对图表中的要素布局进行调整;
好的数据可视化具有的特征
- 展示了一个完整的故事(观点或结论等),也可以说“问题导向”(因为要说明一个问题,所以才会统计出数据);
- 适量地展示有效信息,展示的内容并不是越多越好,抓住问题的主干信息即可;
- 展示信息的形式能清晰直观地表达数据的内涵,受众能很好地理解图表要传达的信息;
注:来源见图片左下角
这里以Hans Rosling在TED上的一个演讲来说明“优秀的数据可视化”是什么样子的。
视频源地址:https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen
关于图表的选择
图表的选择主要基于两方面:
- 数据的类型和结构,比如数据是数值还是文字,是百分比还是绝对值?数据的维度如何等;
- 图表的功能,是要进行对比还是描述时间序列,抑或是说明成分结构等;
https://datavizcatalogue.com/ZH/这个网站总结了常见的可视化图表类型,不仅按功能进行了分类,还对每种图表的制作过程及适用场景进行了说明,非常推荐。比如关于时间序列的展示,可以选择的图表方案如下
另附两张图表选择的guideline供参考。
https://associationanalytics.com/2017/06/25/choose-right-visualization/
原作者 Andrew Abela 图源 https://vizard.co/tableau-interview-questions/
关于可视化工具的选择
如果是个人使用,建议选择现成的或者学习成本相对低的工具。按是否需要编程可以将作图工作分为两类:
- 不用编程(几乎),比如Excel, Power BI, Tableau, SPSS等
- 需要编程的工具,比如Python, R, SAS等统计软件,还有Fine Report, Echarts, D3.JS, plot.ly等可视化控件。
如果是工作中使用,则可能还要考虑其他方面:
- 图表类型的丰富度,e.g. 是否支持工作中要用到的图表;
- 前端交互的友好程度,e.g.是否有控件可以直接拖拉拽来生成图表,界面是否支持交互操作,是否能导出不同格式或者分辨率的图片,颜色风格可以自定义等;
- 底层数据的支持,e.g.非结构化的文本数据,数据量很大,数据接口调用是不是方便等;
关于数据可视化的补充
1. 基本的图表是可以组合使用的,比如柱形图和折线图组合使用:
注:笔者参考网上教程使用Excel制作的“折线柱状图”,还可以进一步美化的
2. 图表中的线条或者形状可以变得更有意思一点,比如做柱状图的时候可以在“柱”里填充图案,更多参考http://club.excelhome.net/thread-1019338-1-1.html
3. 可视化不要用力过猛,比如
图片来源:Say It with Charts Workbook, Gene Zelazny
4. 发挥创造性,增强对比性,比如
图片来源:Say It with Charts Workbook, Gene Zelazny
5. 不要在可视化中“耍花招”或者产生其他误导信息,比如调整坐标轴使并不严重的轻微数据波动趋势看起来很严重(最好不要这么干)
图片来源:https://www.huffingtonpost.com/raviparikh/lie-with-data-visualization_b_5169715.html
数据可视化的学习资源
网站
- https://datavizcatalogue.com/ZH/
- Python作图可以参考 https://python-graph-gallery.com/
- Python 实现50种图表的制作 https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/
- 如果用R作图,那么看这里 https://www.r-graph-gallery.com/
- https://datavizproject.com 给出各种图表的说明以及每种图表的实际使用案例(如果你知道图表长啥样但不知道名称可以来这里搜)
教材
- 用图表说话:麦肯锡商务沟通完全工具箱,Gene Zelazny,清华大学出版社,主要内容讲商务场景下选用什么图表,以及优化方案;
- 写给大家看的设计书,Robbin Williams,人民邮电出版社
- Excel图表之道,刘万祥,电子工业出版社,工具不重要,方法更重要;学习优秀的商业图表(经济学人等期刊杂志)也是可视化精进的方式之一;
- 数据之美:一本书学会可视化设计,Nathan Yau,中国人民大学出版社;
- 鲜活的数据:数据可视化指南,Nathan Yau,人民邮电出版社;
- Storytelling with Data: A Data Visualization Guide for Business Professionals,Cole Nussbaumer Knaflic(中译本为:用数据讲故事);
附
1.如果你要检索数据可视化指南相关的信息,可以使用关键词
- data visualization, charts, graph
- cheetsheet, guide, guideline, chooser, collection, cookbook, gallery