在假设校验统计1中谈到,假设校验中,先做假设,然后构造一个与假设有关的校验统计量Z。这里就谈论如何确定校验统计量
通常校验统计量主要有三个: Z统计量,t统计量,卡方统计量。
Z统计量和t统计量主要用于均值和比例的校验。
卡方统计量常用于方差的校验
实际选择哪种统计量时,主要考虑到这几个因素:
1、样本量
2、总体方差σ是否已知
根据以上的因素分析,常有如下使用规则:
1、如图所示,当样本容量足够大时,如果总体为正态分布,则样本统计量服从正态分布;如果总体非正态分布,则样本统计量渐近服从正态分布。在这这种情况下,我们可以把样本统计量视为正态分布,这时可以使用z统计量,分析参数校验。
如上图所示,当标准差σ已知时,可以直接使用方差公式估量。当标准差σ不可知时可以使用样本标准差s代替。
2、当样本容量较小时,如果总体标准差已知,则样本统计量服从正态分布;这时可以使用z统计量,分析参数校验。如果总体标准差未知,进行校验的依赖信息减少,这时只能使用样本标准差,样本统计量服从t分布,使用t统计量。
与正态分布相比,t分布更为扁平,在相同概率下,t分布的临界点想两边更为扩展,临界点,里中心更远,这意味着推断的精度下降,这时总体标准差σ未知所要付出的代价。
t统计量如上图右下角所示,但是其中的t统计量的自由度为n-1
单侧校验与双侧校验分析:
1)双侧校验问题:
它有两个拒绝域,两个临界值,每个临界值为α/2 。一般如果原假设为 u = u0形式多为双侧校验。在这种情况下,只要 u > u0或者 u< u0,就可以拒绝原假设
2)单侧校验问题:
该类问题一般有方向性。一种时数值越大越好,如灯泡使用寿命,轮胎行驶里程数等,另一种是数值越小越好,如废品率,生产成本等。应根据人们得关注点不同,确定不同方向。
例题分析:(双侧校验)
某厂生产一种钢索,其断裂强度X(kg/cm^2)服从正态分布N(u, 40^2),u未知。
今选择一个容量为9的样本,得到样本均值 /x = 780kg/cm^2
能否据此样本人为这批钢索的断裂强度为800kg/cm^2? (α = 0.05)
得:
σ = 40 u0 = 800 n = 8 /x=78 α = 0.05
有:
Zα/2 = Z 0.025 = ∮(1-0.025)= 1.96
又由:
样本容量小,σ=40,得到 |z| = 1.5 < 1.96 (1.96是正负数,所以这里用了绝对值)
因此接受H0假设:钢索的断裂强度为800kg/cm^2
例题分析:(单侧校验)
假设某种元件得使用寿命(单位:h)服从正态分布 N(u, 100^2),u未知。
按要求,原件得使用寿命不低于2500h才算合格。先从一批原件中随机抽取25件,测得其平均寿命为2484h。试,在显著水平0.1之下,这批元件是否合格。
分析:
原件得寿命越长越好。故可以考虑为左侧校验问题(即左边是拒绝域)
H0: u > u0 = 2500
H1: u < u0 = 2500
有:
σ = 100 u0 = 2500 n = 25 /x=2484 α = 0.1
得:
Zα = Z 0.1 = ∮(1-0.1)= 1.28 (正负得 标准正态分布是对称得)
得到拒绝域为 Z ≤ -1.28
又有:
样本容量小,σ=100 , 得到 z = 0.8 > -1.28
因此接受假设H0合格