3.1频数分析

频数分布分析主要通过频数分布表、条图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征。

例如,要对数据文件做描述性统计分析,并绘制直方图,操作如下:

(1)单击“分析”-“频率”,将弹出“频率”主对话框如下:

spss数据分析操作步骤 spss数据分析的几种方法_linq

注意对话框下方的“显示频率表”选项,SPSS默认选择,不选的话将只显示直方图,不显示频数分布表。

(2)单击“统计量”,弹出“频率:统计量”,如下图:

spss数据分析操作步骤 spss数据分析的几种方法_p2p_02

在该对话框中,选择需要显示的统计量。

割点:选择此项,在后面的文本框中输入数值,假设为N,则表示计算并显示N分位数。

百分位数:选择此项,在后面的文本框中输入数值,可实现想要显示的百分位数。 

值为组的中点:表示如果数据已经分组,而且数据取值为初始分组的中点,可以选择此项,将计算百分位数统计和数据的中位数。

(3)单击“图表”,打开“频率:图表”对话框,如下图所示:

spss数据分析操作步骤 spss数据分析的几种方法_p2p_03

 可以选择频数分析的图表类型。

(4)单击“格式”,打开“频率-格式”,如下图:

spss数据分析操作步骤 spss数据分析的几种方法_概率论_04

 可选择排序方式,其中“多个变量”中的:

比较变量:系统默认选择,SPSS将所有变量的描述性统计的结果显示在同一张表格中,方便用户进行比较分析。

按变量组织输出:SPSS将对每一个变量分别输出单独的描述统计表格。

同时,下方的“最大类别数”表示:

通过输入的数值,可确定频数表输出的方位,即输出数据的组数不得大于窗口中输入的数值。类别数最大参数的默认值是10。

最终的输出结果如下图:

spss数据分析操作步骤 spss数据分析的几种方法_数据_05

 

spss数据分析操作步骤 spss数据分析的几种方法_p2p_06

 

 3.2 描述性统计分析

描述性统计分析主要是用以计算描述集中趋势和离散趋势的各种统计量,此外还有一个重要的功能是对变量做标准化变换,及Z变换。

操作步骤如下:
(1)打开“分析”-“描述统计”子菜单下的“描述”命令,打开的对话框如下所示:

spss数据分析操作步骤 spss数据分析的几种方法_数据_07

将标准化值另存为变量:选择该项,将对“变量”列表框中被选中变量的数据进行标准化,然后将标准化的结果保存到新变量中。新变量的变量名为原变量名前面添加字母z,并被添加在数据编辑窗口中变量的最后一列。通过标准化,可将均值为

spss数据分析操作步骤 spss数据分析的几种方法_p2p_08

,标准差为s的原变量转化成均值为0,标准差为1的新变量。

(2)单击“选项”,将打开“描述-选项”对话框,如下图所示:

spss数据分析操作步骤 spss数据分析的几种方法_数据_09

变量列表:在结果输出窗口中,选择输出的数据将按照变量在数据编辑窗口中原来的排列顺序进行排列;

字母:按照变量的字母顺序进行排列;

按均值的升序(降序)排列:SPSS将计算每个输出变量的平均值,再按升序(降序)排列。

最终的输出结果如下图所示:

spss数据分析操作步骤 spss数据分析的几种方法_概率论_10

3.3 探索性分析

探索分析是指在对数据的基本特征统计量有初步了解的基础上,对数据进行更为深入和详细的描述性观察分析。主要进行的分析如下:

(1)观察数据的分布特征:通过绘制箱锁图和茎叶图等图形,直观地反映数据的分布形式和数据的一些规律,包括考察数据中是否存在异常值等。

(2)正态分布检验:检验数据是否服从正态分布,以便决定它们是否能用只对正态分布数据适用的方法。

(3)方差齐性检验:用Levene检验比较各组数据的方差是否相等,以判定数据的离散程度是否存在差异。

操作步骤如下:
(1)选择“分析”-“描述统计”下的子菜单“探索”,将弹出如下对话框:

spss数据分析操作步骤 spss数据分析的几种方法_数据_11

因变量列表:因变量是用户所研究的目标变量。

因子列表:影响因变量的因素。

个案标注依据:个案标注依据是区分每个观测量的变量。

(2)单击“统计”,将打开“探索:统计”对话框如下:

spss数据分析操作步骤 spss数据分析的几种方法_p2p_12

描述:选择此选项,将生成描述性统计表格,表中将显示样本数据的统计量,包括平均值、中位数、5%调整平均数、标准误、方差、标准差、最大值、最小值、组距、四分位数、峰度、偏度及封堵和偏度的标准误。

平均值的置信区间:可输入数值指定均值的置信区间的置信度,系统默认的置信度为95%。

M-估计量:选择此项,将计算并生成稳健估计量。M估计在计算时对所有观测值赋予权重,随观测量据分布中心的远近而变化,通过给远离中心值的数据赋予较小的权重来减小异常值的影响。

离群值:是指以多个变量为参照基准,数据中与其他数据不合群的数据。

百分位数:选择此项,将计算并显示指定的百分位数,包括5%、10%、25%、50%、75%、90%、95%等。

(3)单击“图”,打开“探索:图”对话框如下:

spss数据分析操作步骤 spss数据分析的几种方法_数据_13

箱图项:

因子级别并置:选择此项,将为每一个因变量创建一个箱锁图,在每一个箱锁图内根据分组变量不同水平的取值创建箱型单元。

因变量并置:选择此项,将为每个分组变量的水平创建一个箱锁图,在每个箱锁图内用不同的颜色区分不同因变量所对应的箱型单元,方便用户进行比较。

无:选择此项,则不创建箱图。

描述图项:

茎叶图:茎叶图主要由三个部分组成:频率、茎和叶。在图中按从左到右的顺序依次排列,在图的底端,注明了茎的宽和每一叶所代表的观测量数。

直方图:直接绘制直方图。

含检验的正态图项:选择此项,将进行正态检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。

含莱文检验的分布-水平图项:将对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归直线的斜率及方差齐性的莱文检验,但如果没有指定分组变量,则此选项无效。

转换后:变换原始数据。用户可在后面的参数框中选择数据变量类型。

未转换:不变换原始数据时选择此项。

(3)单击“选项”,打开“探索-选项”对话框如下图:

spss数据分析操作步骤 spss数据分析的几种方法_概率论_14

成列排除个案:选择此项,对所有的分析过程剔除分组变量和因变量中所有带有缺失值的观测量数据。

成对排除个案:同时剔除带缺失值的观测量及与缺失值有成对关系的观测量。

报告值:选择此项,将分组变量的缺失值单独分为一组,在输出频数表的同时输出缺失值。

(5)单击“确定”,即可得到最终结果。