一、可视化的目的

数据可视化,其目的在于检查异常数据,将数据转化为信息,显示某项活动的趋势,为查看数据背后的特殊现象提供有效的方法。

二、常见的可视化工具

  • Excel
    是最常用的可视化工具,操作简单,只需将图表插入到单元格中即可显示出来,并且还可以根据需要添加一些辅助项,使图表更加易懂。
  • PowerBI / TableAU
    目前在市面上有很多同种类型的数据可视化工具,它们都有一些共同的特点:

(1)上手快,可以支持多种数据源对数据进行导入;
(2)可以在不改变原数据的情况下对数据进行预处理;
(3) 对数据字段进行拖拽就可以显示出相应的图表。

其难点在于:

(1) 如何发现数据项之间的关联
(2)如何将正确的数据放在正确的位置
(3)如何将不同的图表合理的排版到同一个版面上

其让人感到遗憾之处在于提供的可视化图表模板比较固定,不能自定义,有时不能满足使用者的需求。

  • SPSS
    SPSS是世界上最早的统计分析软件,以功能丰富、效率高、操作 简便而著称,是非常适合进行数据分析的工具软件,在经济学、医学、 教育学、管理学、心理学、广告学、统计学及商业、工业、林业、农业 等各个领域有广泛应用
    其操作流程大致如下:
    (1)导入数据
    (2)切换到变量试图查看每个变量值的含义
    (3) 根据目的和数据的特点,选择相关的功能
    (4)对参数进行设置
    (5)输出报告(包括相关的表格、图表、处理分析过程等)
    其关键在于功能的选择,以及对各个功能的参数的了解程度。
    所以使用这个工具之前需要根据项目确定数据分析的目的以及数据分析的方法,以便选择正确的工具和方法。
    其不足之处在于,所呈现的图表不是特别华丽,且不支持或部分支持自定义,适用于科学研究或报告。
  • 编程
    可以通过编写程序的方法实现可视化,如python的第三方库、echarts、HTML/CSS/JS等实现数据的可视化。
    其优点在于可以自定义图表,无论是简单的还是华丽的,都可以制作出来,不受限制。
    其难点在于需要学习相关的编程知识,并能够灵活的运用于各种项目之中。

三、图表类型

大约可以分为两种类型:

1.对比分析

(1)比较型图表
反映了数据项之间的大小关系、数变化程度,如条形图

(2)时序型图表
反映数据在时间线上的变动情况,如折线图

(3)关系型图表
主要用于两组及以上数据的相关性分析,如散点图

2.分布型图表

(1)词云
反映数据分布的密集程度,字体的大小等于出现的频率。

(2)直方图、地图
反映了数据在某一个类别、某个空间的分布情况,在直方图中,柱体的高度等于某个类别出现的频率。
在地图中,不同区域的颜色深浅代表了数据在不同空间上的分布频率。

(3)饼图、堆积柱形图
反映了部分在总体中的比例。