频数分布(frequency distribution):在几个互不重叠的组别中,每一组项目的个数

频率分布柱形图python 频率分布条形图的画法_数据可视化


相对频数分布(relative frequency distribution)百分数频数分布(percent frequency distribution)

频率分布柱形图python 频率分布条形图的画法_数据可视化_02

条形图(bar chart)

频率分布柱形图python 频率分布条形图的画法_数据分析_03

饼图(pie chart)

频率分布柱形图python 频率分布条形图的画法_统计学_04


对数量型数据的频数分布步骤:

1. 确定互不重叠组的组数

2. 确定每组的宽度

3. 确定组限组数:5-20组

组宽:

频率分布柱形图python 频率分布条形图的画法_数据可视化_05

组限:使每一个数据值属于且只属于一组 (上组限:分到该组的最大值,下组限:分到该组的最小值)打点图(dot plot):

频率分布柱形图python 频率分布条形图的画法_数据可视化_06


直方图(histogram):提供数据的分布形态

频率分布柱形图python 频率分布条形图的画法_频率分布柱形图python_07


直方图的偏离:

频率分布柱形图python 频率分布条形图的画法_数据分析_08

累积频数分布(cumulative frequency distribution):表示的是小于或等于每一组上组限的数据项个数

累积相对频数分布(cumulative relative frequency distribution)

累积百分数频数分布(cumulative percent frequency distribution)

频率分布柱形图python 频率分布条形图的画法_数据可视化_09


茎叶显示(stem-and-leaf display):同时用于显示数据的等级排序和分布形态的图形显示

频率分布柱形图python 频率分布条形图的画法_数据可视化_10


易于用手绘制在一个组内,由于茎叶显示提供了实际的数据值,因此比直方图提供更多信息

若数值太大,可以这样显示:

频率分布柱形图python 频率分布条形图的画法_数据可视化_11


交叉分组表(crosstabulation):一种汇总两个变量数据频数的方法

频率分布柱形图python 频率分布条形图的画法_数据分析_12


可以提供变量之间的关系信息

但交叉分组表可能会产生辛普森悖论(Simpson’s paradox)

以下是综合交叉表

频率分布柱形图python 频率分布条形图的画法_数据分析_13


以下是未综合交叉表

频率分布柱形图python 频率分布条形图的画法_数据可视化_14


发现两表是同样的数据却造成了不同的结论,因此在使用交叉分组表的时候,需要注意查看数据是综合的还是未综合的。散点图(scatter diagram)和趋势线(trendline)

频率分布柱形图python 频率分布条形图的画法_数据可视化_15


相关性:

频率分布柱形图python 频率分布条形图的画法_概率论_16


复合条形图(side-by-side bar chart):

频率分布柱形图python 频率分布条形图的画法_数据可视化_17

结构条形图(stacked chart):

频率分布柱形图python 频率分布条形图的画法_概率论_18

数据仪表板(data dashboard):

频率分布柱形图python 频率分布条形图的画法_频率分布柱形图python_19