直方图(Histogram)是一个用于表达数据分布的图表。在显示一组数据的汇总值时,最常用的方法是显示数据的平均值。比如我们对一个产品的满意度调查,往往会让用户打分,然后把所有评分加以平均,以平均值作为产品满意度的最后值。但仅仅局限于所有平均值往往会隐藏一些更深层的信息。
 
假设我们有两组讲座评分数据。如果我们只是显示评分(1-5)的平均值,它们可能得到完全相同的结果。
 
 
如果我们不做进一步的分析,我们可能会很快得到一个结论,听众对两个讲座的反馈基本相同。但是如果我们看看评分值的分布,就会看到不同的结果。我们首先用Histogram把数据的分布显示出来。
 
Histogram显示每个数据值的出现次数。我们可以很直观地看到两组数据十分不一样的分布。第一组数据主要集中在最高和最低的两个评分。而第二组数据有一个很标准的分布,以中间值为主,向旁边递减。
 
在没有其它信息的情况下,我们可以猜测第二个讲座属于比一般的水平。听众的评价基本反应了一个中等的水平。
 
而第一个讲座可能有一个听众和讲座题目或水平的差异。很多听众对它给予了很高的评价。而也有很多对它完全不欣赏。如此之大的差异,很可能有听众和讲座不匹配的情况。可能更应该从宣传和组织上找原因。