验证一组数据是否服从正态分布

There are twenty students whose average sore are: (1 score)

56,23,59,74,49,43,39,51,37,61,43,51, 61,99,23,56, 49, 49, 75, 20

Is the distribution of the series the normal distribution or not?
(How to transform the data into the spss is very important.)

1、将数据输入到SPSS

2、使用分析>描述统计>探索 进行正态分布验证

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据

关于正态性检验中,K-S和S-W哪个准确:
SPSS规定:当样本含量3≤n≤5000时,结果以Shapiro-Wilk(W检验)为准,当样本含量n>5000结果以Kolmogorov-Smirnov(D检验)为准。
使用SAS时当样本含量n≤2000时,结果以Shapiro-Wilk(W检验)为准,当样本含量n>2000结果以Kolmogorov-Smirnov(D检验)为准。

在本题中,因为样本量为20,故以S-W检验为准,sig.=0.2>0.05,不显著??服从正态分布(所以K-S及S-W结果可能不准,建议通过Q-Q图、P-P图等进一步确认…?)。

sig的含义

sig表示显著性。

在spss软件统计结果中,不管是回归分析还是其它分析,都会看到sig。spss分析中sig是significance的缩写,意为“显著性”,significance test称为显著性检验。sig后面的值就是统计出的P值,根据P值进行显著性检验。

sig小于0.05 说明有95%的显著差异
小于0.001 是极其显著
小于0.01 是非常显著
小于0.05 是模型显著

当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。

比如一些一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。

3、查看Q-Q图进一步确认,由图可见基本在直线附近,可以认为服从正态分布

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_02


shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_SPSS_03


由图可见P-P图和Q-Q图基本在直线附近,可以认为服从正态分布。


根据职工收入进行分组(income.sav)(1 score)

1、对收入进行排序

2、split file(如果不split,直接走下一步的话,会只输出一个总的结果)

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_04


3、descriptives

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_正态分布_05

输出结果:

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_SPSS_06


判断是否正态总体的方式

1、分析>描述统计>探索

2、选择因变量列表

3、勾选带检验的整体图,确定后查看分析结果

本题中,sig=.000<0.05

Sig值为0,表示拒绝原假设,即你所使用的样本数据不是正态分布数据

而t检验的前提是正态总体,不知道这样(非正态的样本)还能否用t检验?

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_07


单独样本t检验

会从这次上机实验题中选一道作为期末考试题!

1、SPSS教材57页例题2.4.1

t检验是一种变量显著性检验的方法

单独样本T检验(One-Samples T Test)用于进行样本所在总体均数与已知总体均数的比较,独立样本T检验(Independent-Samples T Test)用于进行两样本均数的比较。

例1

使用单样本t检验:

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_正态分布_08


shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_09


输出结果

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_SPSS_10

(本例中sig=p=0.01<0.05,p<a拒绝原假设,说明样本的均值在a=0.05的显著性水平下不等于13.1)
通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之间具备了差异显著或是极显著。
当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象。

如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持(拒绝原假设);反之若数据之间不具备显著性差异,则实验的备择假设可以被推翻,虚无假设得到支持。

例2

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_SPSS_11


sig=0.534>0.05 接受原假设 说明样本的均值在a=0.05的显著性水平下可以认为等于43

例1与例2比较,例2组的预测比较准确


2、SPSS教材57页例题2.4.2

(1)使用K-S检验(正态性检验)检测每组老鼠寿命是否服从正太分布

步骤:分析>描述统计>探索->

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_12

点击OK,输出结果:

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_正态分布_13


shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_14


偏度和峰度的角度来看:并参考偏度和峰度讲解,里面说,如果是标准正态分布,那么偏度为 0,峰度为 3。本题的两组老鼠的偏度和峰度较标准正态分布有偏差,不是标准正态分布。从K-S检验的角度来看,(不知道在一起的数据怎么分别进行正态性检验,我把他们拆开了)

(1)限制饮食组(分析>描述统计>探索 进行正态分布验证,要勾选带检验的整体图,还有一种办法是直接输出KS结果)

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_SPSS_15


Sig.=0.000<0.05,拒绝原假设,说明:限制饮食组的老鼠不服从正态分布。

另外同时会(2)正常饮食组

shapirotest 怎么判断是否正态分布 spss判断是否为正态分布_数据_16


Sig.=0.000<0.05,拒绝原假设,说明:限制饮食组的老鼠不服从正态分布。