数据可视化 不管接受或不接受、关心或不关心,我们都已经处于大数据的时代,每天都会被庞大的数据所包围,那么如何在看似纷杂的数据中找到并展现出关键而正确的信息呢,数据可视化可以效劳。 什么是数据可视化? 数据可视化就是指将数据转换成适当的可视化图表,然后将隐藏在数据中的信息直接展现于受众(即接受信息的群众)面前。而相比传统的表格或文档展现数据的方式,数据可视化能将数据以更加直观的方式展现出来,使数据更加客观,更具有说服力。同时,配合可视化图表工具能实现各种不同的展示效果。 在对数据的处理中,因为不同的需求,数据可视化的应用也非常广泛,有的用于观测、分析、比较数据,有的用于帮助受众快速理解数据,有的用于教育、宣传等。 如何做好数据可视化 一、了解受众 展现数据前优先要考虑的是谁将要查看这些数据,即受众是谁,因为受众的不同将直接影响数据的展现方式,同时,在对数据进行解释时,若面对的是专业人士,应当使用专业术语来解释数据,否则,应当尽量避免使用专业术语,以免平常受众在解读数据时产生疑惑。 此外,在了解了受众以后,还需要明白受众渴望从数据中得到什么信息,然后将关键信息呈现于数据中。 二、理解数据 除了了解目标受众,还需要充分地理解数据,如果不能完全理解数据,那么将无法有效地把数据背后隐藏的关键信息正确传达给受众。 三、取舍信息 分析数据,提取信息时,通常会包含大量的信息,但是不是所有的信息都是必不可少的,因此,对数据进行有效、正确地取舍是非常关键的。如果展示出来的可视化不够直观,那么就需要看看是否使用了错误的数据呈现方式或者是否包含了太多冗杂的信息。 四、选择合适的图表 展现数据时应当根据需求以及提取的信息来选择图表。基本的图表有柱形图、曲线图、饼图、散点图、气泡图、雷达图等。下表列出了它们的一些特点。
图表 维度 特点

柱形图 二维(x和y) 用来比较其中一维

曲线图 二维(x和y) 适用于较大的数据集,也可适用于多个二维数据集的比较

饼图 二维(部分和整体) 只适用于反映部分与整体的关系

散点图 二维或三维(x、y以及颜色或文字标识) 有两个维度需要比较

气泡图 三维或四维(x、y、面积以及颜色或文字标识) 只有两个维度能够精确辨识,面积维度人眼无法精确辨识

雷达图 四维以上 一般不超过6个点,否则难以辨别