在假设校验统计1中谈到,假设校验中,先做假设,然后构造一个与假设有关的校验统计量Z。这里就谈论如何确定校验统计量

 

 

        通常校验统计量主要有三个: Z统计量,t统计量,卡方统计量。

        Z统计量和t统计量主要用于均值和比例的校验。

        卡方统计量常用于方差的校验

 

        实际选择哪种统计量时,主要考虑到这几个因素:

                1、样本量

                2、总体方差σ是否已知

 

        根据以上的因素分析,常有如下使用规则:

        

ab test检验统计量 检验统计量u_正态分布

        

    1、如图所示,当样本容量足够大时,如果总体为正态分布,则样本统计量服从正态分布;如果总体非正态分布,则样本统计量渐近服从正态分布。在这这种情况下,我们可以把样本统计量视为正态分布,这时可以使用z统计量,分析参数校验。

        如上图所示,当标准差σ已知时,可以直接使用方差公式估量。当标准差σ不可知时可以使用样本标准差s代替。

 

    2、当样本容量较小时,如果总体标准差已知,则样本统计量服从正态分布;这时可以使用z统计量,分析参数校验。如果总体标准差未知,进行校验的依赖信息减少,这时只能使用样本标准差,样本统计量服从t分布,使用t统计量。

        与正态分布相比,t分布更为扁平,在相同概率下,t分布的临界点想两边更为扩展,临界点,里中心更远,这意味着推断的精度下降,这时总体标准差σ未知所要付出的代价。

        t统计量如上图右下角所示,但是其中的t统计量的自由度为n-1

        

 

单侧校验与双侧校验分析:

        1)双侧校验问题:

                它有两个拒绝域,两个临界值,每个临界值为α/2 。一般如果原假设为 u = u0形式多为双侧校验。在这种情况下,只要 u > u0或者 u< u0,就可以拒绝原假设

        2)单侧校验问题:

                该类问题一般有方向性。一种时数值越大越好,如灯泡使用寿命,轮胎行驶里程数等,另一种是数值越小越好,如废品率,生产成本等。应根据人们得关注点不同,确定不同方向。

 

 

例题分析:(双侧校验)

        某厂生产一种钢索,其断裂强度X(kg/cm^2)服从正态分布N(u, 40^2),u未知。

        今选择一个容量为9的样本,得到样本均值 /x = 780kg/cm^2

        能否据此样本人为这批钢索的断裂强度为800kg/cm^2? (α = 0.05)

 

    得:

        σ = 40  u0 = 800  n = 8  /x=78   α = 0.05

    有:

         Zα/2  = Z 0.025 =  ∮(1-0.025)=  1.96  

    又由:    

        样本容量小,σ=40,得到   |z| = 1.5  < 1.96    (1.96是正负数,所以这里用了绝对值)

        因此接受H0假设:钢索的断裂强度为800kg/cm^2

 

 

例题分析:(单侧校验)

        假设某种元件得使用寿命(单位:h)服从正态分布 N(u, 100^2),u未知。

        按要求,原件得使用寿命不低于2500h才算合格。先从一批原件中随机抽取25件,测得其平均寿命为2484h。试,在显著水平0.1之下,这批元件是否合格。

 

分析:

        原件得寿命越长越好。故可以考虑为左侧校验问题(即左边是拒绝域)

        H0:  u > u0 = 2500

        H1:  u < u0  = 2500

有:

        σ = 100  u0 = 2500  n = 25  /x=2484   α = 0.1

得:

         Zα  = Z 0.1 =  ∮(1-0.1)=  1.28  (正负得  标准正态分布是对称得) 

        得到拒绝域为   Z ≤ -1.28

又有:

        样本容量小,σ=100 ,  得到   z = 0.8   > -1.28

        因此接受假设H0合格