频数分布(frequency distribution):在几个互不重叠的组别中,每一组项目的个数
相对频数分布(relative frequency distribution)百分数频数分布(percent frequency distribution)
条形图(bar chart)
饼图(pie chart)
对数量型数据的频数分布步骤:
1. 确定互不重叠组的组数
2. 确定每组的宽度
3. 确定组限组数:5-20组
组宽:
组限:使每一个数据值属于且只属于一组 (上组限:分到该组的最大值,下组限:分到该组的最小值)打点图(dot plot):
直方图(histogram):提供数据的分布形态
直方图的偏离:
累积频数分布(cumulative frequency distribution):表示的是小于或等于每一组上组限的数据项个数
累积相对频数分布(cumulative relative frequency distribution)
累积百分数频数分布(cumulative percent frequency distribution)
茎叶显示(stem-and-leaf display):同时用于显示数据的等级排序和分布形态的图形显示
易于用手绘制在一个组内,由于茎叶显示提供了实际的数据值,因此比直方图提供更多信息
若数值太大,可以这样显示:
交叉分组表(crosstabulation):一种汇总两个变量数据频数的方法
可以提供变量之间的关系信息
但交叉分组表可能会产生辛普森悖论(Simpson’s paradox)
以下是综合交叉表
以下是未综合交叉表
发现两表是同样的数据却造成了不同的结论,因此在使用交叉分组表的时候,需要注意查看数据是综合的还是未综合的。散点图(scatter diagram)和趋势线(trendline)
相关性:
复合条形图(side-by-side bar chart):
结构条形图(stacked chart):
数据仪表板(data dashboard):