数据为什么要可视化?

  • 一方面是因为数字太抽象,图表更直观,而且图表可以突出数据中的关注点(比如某个月的交易大幅度波动等);
  • 另一方面,数据面向的受众大都不具备专业的数据知识,可视化的形式有助于降低读懂数据的门槛;

简言之,数据可视化提高了数据沟通的效率。

举个例子,假设现在年终汇报某KPI的达成情况,数据如下表所示:

数据可视化 陈为 pdf 数据可视化呈现与解答_数据可视化

可视化后的效果如下:

数据可视化 陈为 pdf 数据可视化呈现与解答_数据可视化_02

注:参考图说--目标达成展示

观察可视化后的图表,很容易就能发现Q3没有达标,但年度累计是达标的。

数据可视化的一般步骤(以数据汇报的场景为例):

  1. 准备原始数据,一般是经过统计的数据;
  2. 明确展示的对象(给谁看),不同的汇报对象关注的业务角度和数据颗粒度不一样;
  3. 筛选数据中需要突出的点,确认数据背后要表达的主题或者结论;
  4. 选择合适的图表类型;
  5. 选择可视化的工具;
  6. 根据PPT的风格,调整图表中的文字、线条、形状以及对应的大小、颜色等,对图表中的要素布局进行调整;

好的数据可视化具有的特征

  • 展示了一个完整的故事(观点或结论等),也可以说“问题导向”(因为要说明一个问题,所以才会统计出数据);
  • 适量地展示有效信息,展示的内容并不是越多越好,抓住问题的主干信息即可;
  • 展示信息的形式能清晰直观地表达数据的内涵,受众能很好地理解图表要传达的信息;

数据可视化 陈为 pdf 数据可视化呈现与解答_数据可视化_03

注:来源见图片左下角

这里以Hans Rosling在TED上的一个演讲来说明“优秀的数据可视化”是什么样子的。

视频源地址:https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen

关于图表的选择

图表的选择主要基于两方面:

  • 数据的类型和结构,比如数据是数值还是文字,是百分比还是绝对值?数据的维度如何等;
  • 图表的功能,是要进行对比还是描述时间序列,抑或是说明成分结构等;

https://datavizcatalogue.com/ZH/这个网站总结了常见的可视化图表类型,不仅按功能进行了分类,还对每种图表的制作过程及适用场景进行了说明,非常推荐。比如关于时间序列的展示,可以选择的图表方案如下

数据可视化 陈为 pdf 数据可视化呈现与解答_可视化_04

另附两张图表选择的guideline供参考。

数据可视化 陈为 pdf 数据可视化呈现与解答_Python_05

https://associationanalytics.com/2017/06/25/choose-right-visualization/

数据可视化 陈为 pdf 数据可视化呈现与解答_可视化_06

原作者 Andrew Abela 图源 https://vizard.co/tableau-interview-questions/

关于可视化工具的选择

如果是个人使用,建议选择现成的或者学习成本相对低的工具。按是否需要编程可以将作图工作分为两类:

  • 不用编程(几乎),比如Excel, Power BI, Tableau, SPSS等
  • 需要编程的工具,比如Python, R, SAS等统计软件,还有Fine Report, Echarts, D3.JS, plot.ly等可视化控件。

如果是工作中使用,则可能还要考虑其他方面:

  • 图表类型的丰富度,e.g. 是否支持工作中要用到的图表;
  • 前端交互的友好程度,e.g.是否有控件可以直接拖拉拽来生成图表,界面是否支持交互操作,是否能导出不同格式或者分辨率的图片,颜色风格可以自定义等;
  • 底层数据的支持,e.g.非结构化的文本数据,数据量很大,数据接口调用是不是方便等;

关于数据可视化的补充

1. 基本的图表是可以组合使用的,比如柱形图和折线图组合使用:

数据可视化 陈为 pdf 数据可视化呈现与解答_可视化_07

注:笔者参考网上教程使用Excel制作的“折线柱状图”,还可以进一步美化的

2. 图表中的线条或者形状可以变得更有意思一点,比如做柱状图的时候可以在“柱”里填充图案,更多参考http://club.excelhome.net/thread-1019338-1-1.html

3. 可视化不要用力过猛,比如

数据可视化 陈为 pdf 数据可视化呈现与解答_数据_08

图片来源:Say It with Charts Workbook, Gene Zelazny

4. 发挥创造性,增强对比性,比如

数据可视化 陈为 pdf 数据可视化呈现与解答_Python_09

数据可视化 陈为 pdf 数据可视化呈现与解答_Python_10

图片来源:Say It with Charts Workbook, Gene Zelazny

5. 不要在可视化中“耍花招”或者产生其他误导信息,比如调整坐标轴使并不严重的轻微数据波动趋势看起来很严重(最好不要这么干)

数据可视化 陈为 pdf 数据可视化呈现与解答_数据可视化 陈为 pdf_11

图片来源:https://www.huffingtonpost.com/raviparikh/lie-with-data-visualization_b_5169715.html

数据可视化的学习资源

网站

教材

  • 用图表说话:麦肯锡商务沟通完全工具箱,Gene Zelazny,清华大学出版社,主要内容讲商务场景下选用什么图表,以及优化方案;
  • 写给大家看的设计书,Robbin Williams,人民邮电出版社
  • Excel图表之道,刘万祥,电子工业出版社,工具不重要,方法更重要;学习优秀的商业图表(经济学人等期刊杂志)也是可视化精进的方式之一;
  • 数据之美:一本书学会可视化设计,Nathan Yau,中国人民大学出版社;
  • 鲜活的数据:数据可视化指南,Nathan Yau,人民邮电出版社;
  • Storytelling with Data: A Data Visualization Guide for Business Professionals,Cole Nussbaumer Knaflic(中译本为:用数据讲故事);

1.如果你要检索数据可视化指南相关的信息,可以使用关键词

  • data visualization, charts, graph
  • cheetsheet, guide, guideline, chooser, collection, cookbook, gallery