作者|林骥


01

柱形图是一种很常见的图形,用来进行对比分析,是一种比较好的选择。

为了强化柱形图的对比效果,我在常见柱形图的基础上,删掉了一些不必要的元素,包括坐标 Y 轴、刻度线和边框等,增加了一些辅助的元素,用双箭头标记前面两根柱子之间的倍数关系,另外用一根横线表示平均值。

比如说,对于某一段时间内产品的销量数据,为了形成更加鲜明的对比,我在常见柱形图的基础上,增加了一些辅助的元素,用双箭头标记前面两根柱子之间的倍数关系,并用一根横线表示平均值。另外,为了让主要信息更加突出,我删掉了一些不必要的元素,包括坐标 Y 轴、刻度线和边框等,效果图如下:

柱状图虚线 python 柱状图虚线对比_可视化

这张图制作起来并不难,你可以前往 https://github.com/linjiwx/mp 下载完整代码,其中包含详细的注释。

02

一旦你学会了恰当地使用辅助线,那么也就意味着,你理解了数据可视化的精髓,也就是用图表来强化你想要表达的信息,让观察者更容易理解,提高信息传递的效率,从而做出更好的决策。

有很多人做的数据图表,包含了太多无效的信息,该强调的地方没有重点强调,不该强调的地方反而过分修饰,分散了观察者对关键信息的注意力,这往往是因为制图者本人对关键信息的分析和理解不够透彻。

关于柱形图,下面提供 6 点建议,供你参考:

1、纵轴的底端要从 0 开始,避免造成误导,如果你是故意这么做的,那么有可能会影响到你的信誉;

2、柱子的宽度,不宜过窄,也不宜过宽,通常比柱子之间的空白略宽一些为宜,让观察者关注柱子的高度,而不是宽度和面积;

3、如果柱形图中某些具体的数值很重要,那么直接在柱子的附近显示数据标签,把 Y 轴隐藏掉,让观察者聚焦于关键的信息本身,而不是视线来回移动;

4、如果希望用柱形图来反映数据的整体趋势,那么可以考虑保留 Y 轴,但是应该将 Y 轴的颜色变成灰色,以削弱其重要性;

5、谨慎使用包含多组数据的条形图,因为这可能会让观察者难以得出结论,考虑你想对比什么,并以此构造分类的层级,尽可能让柱形图变得简单易懂;

6、不要使用 3D 效果,虽然 3D 效果看起来比较炫酷,但是它扭曲了数据的真实性,反而让数据变得难以解读和对比。

03

数据分析师思考问题的方法,不能只看事物的表面,还需要看到事物背后的逻辑。

也就是说,不仅要知道「What 是什么」,还要知道「Why 为什么」和「How 怎么办」。

比如说,假设现在有两个信息:

1、销售额同比增长 20%

2、销售额同比下降 20%

那么,这两个信息究竟哪一个更加重要呢?

事实上,这两个信息看似都很重要,但是,它们都只回答了「是什么」,却遗漏了「为什么」和「怎么办」。

不管销售额是增长还是下降,其背后肯定都存在着作为事实的主要原因。

在掌握了主要原因之后,还要想出相应的对策,实际情况可能是这样的:



柱状图虚线 python 柱状图虚线对比_编程语言_02

只有基于事实,开始思考应该采取什么行动的时候,数据才能变成有用的信息,信息之间产生关联,才会形成知识,知识之间发现新的关系,就会变成洞见,洞见串联起来,就能形成智慧,智慧向外传播,就有了影响力。



柱状图虚线 python 柱状图虚线对比_编程语言_03

数据可视化,是数据与艺术的融合,数据是理性的,艺术是感性的,用二者融合的方式来理解信息,制作出成功的数据可视化作品,从而让观察者更容易理解事物的本质。

数据可视化的成功,往往并不在于数据可视化本身。宋朝大诗人陆游,给他的儿子传授写诗的经验时说:

汝果欲学诗,工夫在诗外。

我觉得这句话用在数据分析上也适用,如果你真的想要学好数据分析,那么技术之外的历练,也是非常必要的。

有些图表,虽然表面看起来非常简单,但是背后却可能富含深意,希望你能领会到其中的含义。