☞☞☞样本均数比较最全总结

置信概率可以用来评估区间估计的什么性能? 当然是可靠性了,P值反映的是显著性。 有了参数估计,就会有对应的假设检验;知识结构如下:



python pearsonr 显著性 p显著性具体数值怎么算_正态分布

python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_02

01. 知识准备


python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_02


假设检验显著性水平的两种理解: 1. 显著性水平:通过小概率准则来理解,在假设检验时先确定一个小概率标准----显著性水平;用 


 表示;凡出现概率小于显著性水平的事件称小概率事件;

2. 通过两类错误理解: 


 为拒绝域面积

python pearsonr 显著性 p显著性具体数值怎么算_python pearsonr 显著性_04


原假设与备用假设 H0:原假设,零假设----零是相关系数为0,说明两个变量无关系 H1:备用假设 如何设置原假设:

1)H0与H1是完备事件组,相互对立,有且只有一个成立

2)在确立假设时,先确定备设H1,然后再确定H0,且保证“=”总在H0上

3)原H0一般是需要反驳的,而H1是需要支持的

4)假设检验只提供原假设不利证据 即使“假设”设置严密,检验方法“精确”;假设检验始终是建立在一定概率基础上的,所以我们常会犯两类错误;

第一类:原H0是真,却拒绝原假设;犯 

 类错误 第二类:原H0是假,却不拒绝原假设;犯 

 类错误


通常只能犯两种错误中的一种,且 


 增加, 


 减少 通常, 


 类错误是可控的,先设法降低第一类错误概率 

什么是双尾检验,单尾检验?

1) 当H0采用等号,而H1采用不等号,双尾检验 2)当H0是有方向性的,单尾检验 P值

当原假设为真时,比所得到的样本观察,结果更极端的结果会出现的概率。 如果P值很小,我们拒绝原假设的理由越充分。 P的意义不表示两组差别大小,p反映两组差别有无统计学意义, 显著性检验只是统计结论,判断差别还需要专业知识。 T检验与U检验


当样本容量n够大,样本观察值符合正态分布,可采用U检验 当样本容量n较小,若观测值符合正态分布,可采用T型检验



python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_02

02. 一个总体参数假设检验


python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_02

python pearsonr 显著性 p显著性具体数值怎么算_正态分布_07

1. 大样本总体均值的检验方法—Z检验与t检验



python pearsonr 显著性 p显著性具体数值怎么算_回归系数t检验公式_08


大样本总体均值的检验方法,在大样本情况下,无论总体服从什么分布,样本均值服从正态分布。

python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_09

python pearsonr 显著性 p显著性具体数值怎么算_回归系数t检验公式_10

python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_11


接下来用P值检验:

python pearsonr 显著性 p显著性具体数值怎么算_回归系数t检验公式_12

同样地,还有小样本情况下正态总体均值的检验;检测与大样本总体均值检测一样。


以往的教科书区分大样本,小样本,是因为大样本的统计量用正态分布,小样本用t分布。那是依赖查表时代的产物;如今,计算机软件中,t分布随机变量在大样本时自然就近似正态分布了。---统计学家吴喜之

2. 总体比例的检验


对于总体比例的检验,通常是在大样本条件下进行的,而小样本得到的结果是极不稳定的; 所以对总体比例进行检验时,通常用正态分布来确定临界值,即采用Z统计量,Z统计量计算公式:

python pearsonr 显著性 p显著性具体数值怎么算_python pearsonr 显著性_13


P为样本比例;


 为总体比例

3. 总体方差 

 的检验


不论样本容量是大是小,都要求总体服从正态分布;总体方差检验使用 


 .

python pearsonr 显著性 p显著性具体数值怎么算_python pearsonr 显著性_14

举例如下:


一个可以接受的罐装量方差 


 ,随机选取20杯饮料进行测试,其样本方差7.63ml, 试以0.1的显著性水平,判断样本是否方差过大?

python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_15

python pearsonr 显著性 p显著性具体数值怎么算_正态分布_16

python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_02

03. 两个总体参数假设检验


python pearsonr 显著性 p显著性具体数值怎么算_均值已知检验方差_02

1. 两个总体均值之差的检验

场景:比较一个学校的重点班和普通班英语平均成绩是否具有显著差异;比较改善后的平均产量与改善前的平均产量是否具备显著差异,这些问题都属于两个样本均值之差的检验。 2. 独立样本中大样本前提下的总体均值之差检验


python pearsonr 显著性 p显著性具体数值怎么算_正态分布_19


贾俊平 | 统计学 第七版 第八章 说明:大样本前提下,两样本均值之差的抽样分布近似服从正态分布 Excel操作:加载数据,选择“数据分析”功能--Z检验双样本均值差检验 选择了99个样本,算作大样本检验: 变量输入:变量1和变量2数据分别输入两列或两行;

假设平均差:如果检验两总体均值是否相等,输入0;如果检验两总体均值差是否等于某个常数,输入常数。

已知方差:输入已知的总体方差或大样本的方差。

显著水平:一般为0.1、0.05或0.01,根据需要填写


python pearsonr 显著性 p显著性具体数值怎么算_python pearsonr 显著性_20


从输出结果来看,不仅有单侧z检验和双侧z检验结果: z:计算得出的z值;

P(Z<=z)单尾与z单尾临界:已知显著水平下的单尾临界z值和P值;

P(Z<=z)双尾与z双尾临界:已知显著水平下的双尾临界z值和P值; 分析结论:以假设平均差为0举例 利用检验统计量z :|z|=0.39 利用P值:

1.95>0.05,不能拒绝H0;两样本均值之差等于0.

3. 独立样本中小样本前提下总体均值之差检验(*可不掌握)

独立样本提供的数据值可能因为样本个体在其它因素方面的“不同质”而对它们所提供的有关总体均值的信息产生干扰,为有效排除样本个体之间这些“额外”差异带来多误差,可以考虑采用匹配样本。 End. 作者:求知鸟