SPSS 基础知识
一、SPSS图形绘制
1.1 散点图的绘制
散点图作用:
1、判断数据的属性
2、提供回归拟合方法的选择,如一次回归,二次曲线或者指数回归。
操作步骤:已知x,y两列数据。
1、单击“分析”——“回归”——“曲线估计”,弹出曲线估计对话框
2、导入自变量和因变量,勾选下方模型拟合方法(自由选择)。
3、点击“确认”,生成散点图和拟合曲线
4、通过比较检验参数估算值来选取最佳的拟合模型。
1.2 直方图绘制
直方图作用:
1、解析出资料的规则性
2、查看数据的特征分布
操作步骤:对于已知一列数据。
1、“图形”——“旧对话框”——“直方图”,弹出直方图对话框
2、导入变量,勾选“显示正态曲线”选项
3、单击“确定”按钮,得到相应的直方图
1.3 箱图
直方图作用:
1、显示一组数据的分散情况
2、识别异常值
操作步骤:
1、“图形”——“旧对话框”——“箱图”,弹出箱图对话框
2、选择简答箱图选项
3、输入变量,因变量(类别轴)
4、点击“确定”,得到箱图
箱图中,每个样本的区间都能很好的展示出来。
二、线下回归
回归分析是研究一个变量Y与其他若干变量X之间的相关关系,并用一直确定的函数关系去近似代替,这个函数被称为回归函数。
回归分析所研究的主要问题就是如何利用变量X,Y的观测值(样本),对回归函数进行统计推断,包括对它进行估计以及检验与它有关的假设等。
操作步骤:一直因变量Y以及其他若干自变量X。
1、“分析”——“回归”——“线性回归”
2、导入若干自变量X,因变量Y
3、进行统计量设置:回归系数置信区间勾选,一般默认设置为95%的置信区间,R方变化量求解回归拟合最小误差平均值的变化情况,描述性表面拟合xy之间的描述的变量相关性信息值,偏相关性用于检测变量之间的影响因子,共线性诊断用于诊断变量之间的线性关系。选择勾选。
4、进行图像设置:可选择勾选直方图和正态概率图。
5、点击“继续”按钮,再单击“确定”按钮,即可得到相应的输出。
得到的输出有:
统计特征描述(描述)——包含样本的个数,均值,标准差。
相关系数(相关性)——变量间的相关系数
回归模型参考表(模型摘要)——包含R,R2,自适应R2,累积误差e,统计量F,统计量F显著性水平p。据此判断自变量与因变量之间是否存在线性相关。
均方表(ANOVA)——包含回归平方和,残差平方和,回归后的模型自由度,残留样本值的自由度,累计样本自由度,统计量F,统计量F显著性水平p。
回归模型系数表——自变量系数a和常量b以及对应的计算标准差,置信区间。据此得到相应的线性函数。
共线性诊断表——显示一维的特征值(大于1,表明特征较明显);显示二维的特征值(远远小于1 时,表明不存在高次幂相关)。
残差统计表——模型预测值的最大最小值,均值,标准差,样本数以及残差最大最小值,均值,标准差,样本数。
残差直方图
拟合曲线图(正态P-P图)
等等。
3、因子分析
因子分析是通过分析多个观测变量之间的相关关系,探求数据内部的基本结构,并用少数几个假想变量来表示基本峰数据结构,来达到化简原始数据的目的。
操作步骤:
1、“分析”——“降维”——“因子分析”,弹出因子分析对话框
2、将所有指标导入变量。
3、进行描述统计设置:勾选“KMO和巴特利特球形度检验”。
4、进行提取设置:勾选“碎石图”,选择主成分分析方法。
5、进行得分设置:勾选“显示因子得分系数矩阵”。
6、点击“确认‘,得到相应结果
得到结果:
1、碎石图
2、总方差解释(总方差中旋转后的贡献率)
借助碎石图和方差累计贡献率确定公因子个数及其所对应的方差贡献率
3、公因子方差(各因子提取量)
5、系统聚类分析
聚类是将数据分类到不同的类或者簇这样一个过程。所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
聚类与分类的不同在于,聚类所要求划分的类是未知的。
传统的统计聚类分析方法包括系统聚类法,分解法,加入法,动态聚类法,有序样品聚类,有重叠聚类和模糊聚类等。
操作步骤:
1、“分析”——“分类”——“系统聚类”
2、导入分类指标到变量
3、进行“绘图” 设置:勾选树状图(谱系图)
4、进行“方法”设置:聚类方法选择“组间联接”或“组内联接”
5、点击“确认”,得到分析结果
得到结果:
1、个案统计量表:显示有效个案数
2、冰柱图:白色的越矮,表示两者之间结合更紧密。
3、树状图:可以清晰的看到聚类分析的结果