验证一组数据是否服从正态分布
There are twenty students whose average sore are: (1 score)
56,23,59,74,49,43,39,51,37,61,43,51, 61,99,23,56, 49, 49, 75, 20
Is the distribution of the series the normal distribution or not?
(How to transform the data into the spss is very important.)
1、将数据输入到SPSS
2、使用分析>描述统计>探索 进行正态分布验证
关于正态性检验中,K-S和S-W哪个准确:
SPSS规定:当样本含量3≤n≤5000时,结果以Shapiro-Wilk(W检验)为准,当样本含量n>5000结果以Kolmogorov-Smirnov(D检验)为准。
使用SAS时当样本含量n≤2000时,结果以Shapiro-Wilk(W检验)为准,当样本含量n>2000结果以Kolmogorov-Smirnov(D检验)为准。
在本题中,因为样本量为20,故以S-W检验为准,sig.=0.2>0.05,不显著??服从正态分布(所以K-S及S-W结果可能不准,建议通过Q-Q图、P-P图等进一步确认…?)。
sig的含义
sig表示显著性。
在spss软件统计结果中,不管是回归分析还是其它分析,都会看到sig。spss分析中sig是significance的缩写,意为“显著性”,significance test称为显著性检验。sig后面的值就是统计出的P值,根据P值进行显著性检验。
sig小于0.05 说明有95%的显著差异
小于0.001 是极其显著
小于0.01 是非常显著
小于0.05 是模型显著
当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。
比如一些一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。
3、查看Q-Q图进一步确认,由图可见基本在直线附近,可以认为服从正态分布
由图可见P-P图和Q-Q图基本在直线附近,可以认为服从正态分布。
根据职工收入进行分组(income.sav)(1 score)
1、对收入进行排序
2、split file(如果不split,直接走下一步的话,会只输出一个总的结果)
3、descriptives
输出结果:
判断是否正态总体的方式
1、分析>描述统计>探索
2、选择因变量列表
3、勾选带检验的整体图,确定后查看分析结果
本题中,sig=.000<0.05
Sig值为0,表示拒绝原假设,即你所使用的样本数据不是正态分布数据
而t检验的前提是正态总体,不知道这样(非正态的样本)还能否用t检验?
单独样本t检验
会从这次上机实验题中选一道作为期末考试题!
1、SPSS教材57页例题2.4.1
t检验是一种变量显著性检验的方法
单独样本T检验(One-Samples T Test)用于进行样本所在总体均数与已知总体均数的比较,独立样本T检验(Independent-Samples T Test)用于进行两样本均数的比较。
例1
使用单样本t检验:
输出结果
(本例中sig=p=0.01<0.05,p<a拒绝原假设,说明样本的均值在a=0.05的显著性水平下不等于13.1)
通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之间具备了差异显著或是极显著。
当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象。
如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持(拒绝原假设);反之若数据之间不具备显著性差异,则实验的备择假设可以被推翻,虚无假设得到支持。
例2
sig=0.534>0.05 接受原假设 说明样本的均值在a=0.05的显著性水平下可以认为等于43
例1与例2比较,例2组的预测比较准确。
2、SPSS教材57页例题2.4.2
(1)使用K-S检验(正态性检验)检测每组老鼠寿命是否服从正太分布
步骤:分析>描述统计>探索->
点击OK,输出结果:
从偏度和峰度的角度来看:并参考偏度和峰度讲解,里面说,如果是标准正态分布,那么偏度为 0,峰度为 3。本题的两组老鼠的偏度和峰度较标准正态分布有偏差,不是标准正态分布。从K-S检验的角度来看,(不知道在一起的数据怎么分别进行正态性检验,我把他们拆开了)
(1)限制饮食组(分析>描述统计>探索 进行正态分布验证,要勾选带检验的整体图,还有一种办法是直接输出KS结果)
Sig.=0.000<0.05,拒绝原假设,说明:限制饮食组的老鼠不服从正态分布。
另外同时会(2)正常饮食组
Sig.=0.000<0.05,拒绝原假设,说明:限制饮食组的老鼠不服从正态分布。