文章目录
- Z检验
- 例子
- 数据集
- Z检验步骤
- 步骤1: 确定零假设和备择假设
- 步骤2: 计算Z统计量
- 步骤3: 查Z表确定P值
- 步骤4: 做出决策
- 结论
- t检验
- 1. 单样本t检验
- 2. 独立样本t检验(两样本t检验)
- 3. 配对样本t检验
- 例子
- 1. 单样本t检验示例
- 2. 独立样本t检验示例(假设方差相等)
- 3. 配对样本t检验示例
Z检验
Z检验(Z Test)是一种统计学中的假设检验方法,主要用于在大样本
情况下(通常样本容量大于30)评估样本平均数与已知总体平均数之间是否存在显著差异,或者比较两个独立大样本的平均数是否存在显著差异
。
这种检验基于这样的前提:样本数据来自于一个正态分布
的总体,并且总体的标准差是已知
的或者是可以根据样本数据合理估计
的。
Z检验的核心
在于计算一个统计量Z值,这个Z值表示了观察到的样本均值与假设的总体均值之间的偏离程度
,以标准差为单位。计算公式如下:
其中:
计算得到的Z值随后会被与标准正态分布表进行比较,以确定这个差异发生的概率(P值),进而决定是否拒绝原假设(通常是认为两者的均值没有差异)。
如果P值小于
事先设定的显著性水平(如0.05),那么就认为样本数据支持拒绝原假设,即样本均值与总体均值或两个样本的平均数之间存在显著差异。
例子
数据集
首先,我们假设超市收集到的30块巧克力的重量数据如下(单位:克):
巧克力编号 | 重量 |
1 | 98 |
2 | 102 |
3 | 97 |
… | … |
29 | 101 |
30 | 103 |
为了简化,我将直接给出这些数据的统计摘要,而不是列出所有数据点:
- 样本标准差 (s) = 1.2克
- 样本大小 (n) = 30
Z检验步骤
步骤1: 确定零假设和备择假设
步骤2: 计算Z统计量
因此
步骤3: 查Z表确定P值
接下来,我们需要查找标准正态分布表或使用统计软件/计算器找到Z值为-2.88时对应的累积概率,从而得到右侧尾部的概率,因为是双侧检验,所以P值应该是两侧之和的一半。
从标准正态分布表中查得,对于Z=-2.88,右侧尾部的概率约为0.0019。因此,双侧P值为
步骤4: 做出决策
一般而言,如果P值小于显著性水平(例如0.05),我们将拒绝零假设。在这个例子中,P值=0.0038远小于0.05,所以我们有足够的证据拒绝零假设。
结论
基于这个Z检验,我们可以得出结论,超市收集到的巧克力样本平均重量与厂家声称的100克存在显著差异(P < 0.05)。这意味着根据样本数据,我们有理由相信这种巧克力的平均重量不等于100克。
t检验
t检验,又称为Student’s t检验,是一种在统计学中广泛使用的假设检验方法,主要用来判断两组数据的平均值(均值)
是否存在显著性差异。
它适用于样本数量相对较小
(通常n<30,尽管这个界限不是绝对的),并且总体标准差未知
的情况。t检验基于t分布,这是一种在小样本情况下对正态分布数据进行推断的连续概率分布。
1. 单样本t检验
前提条件:数据应近似正态分布
。
零假设(H0):样本均值μ等于一个已知的总体
均值μ₀。
公式:
决策:将计算出的t值与t分布表中的临界值比较,或者计算p值,如果p值小于显著性水平(如α=0.05),则拒绝H0,认为样本均值与总体均值之间存在显著差异。
2. 独立样本t检验(两样本t检验)
前提条件:两组数据独立
且各自来自正态
分布的总体,且两组的方差相等(同方差性)或不等(异方差性)。
零假设(H0):两组样本的总体均值相等(μ₁ = μ₂)。
公式:取决于是否满足方差齐性。
- 方差相等时( pooled variance ):
- 方差不等时(Welch’s t-test):
公式较为复杂,通常直接使用统计软件计算。
决策:同样通过比较t值与临界值或计算得到的p值来决定是否拒绝零假设。
3. 配对样本t检验
前提条件:配对数据需满足正态
分布,且差值也应近似正态分布
。
零假设(H0):配对样本的总体均差为零
(即处理前后的差异不显著)。
公式:
决策:与上述相同,依据t值或p值决定是否拒绝H0。
例子
为了便于理解,我们将使用假定的数据集,并假设我们正在使用α=0.05作为显著性水平。
1. 单样本t检验示例
问题:研究者想知道某工厂生产的一批产品的平均重量是否与规定的250克一致。
步骤:
- 提出假设:
- 计算t统计量:
- 查表或计算p值:使用t分布表或统计软件,找到自由度(df=n-1=14),对应双侧检验的t值约为-1.761(对于α=0.05)。
- 决策:因为|t|=|-1.633| < |-1.761|,我们不能拒绝H0,意味着没有足够证据表明这批产品的平均重量与250克有显著差异。
2. 独立样本t检验示例(假设方差相等)
问题:比较两种教学方法对学生考试成绩的影响。
方法A的样本(n1=20)平均分是85,标准差是5;
方法B的样本(n2=25)平均分是80,标准差也是5。
步骤:
- 提出假设:
- 计算t统计量:
- 查表或计算p值:自由度为n1+n2-2=43,查t分布表或用软件得到对应双侧检验的临界值约为±2.015(α=0.05)。
- 决策:因为|t|=2.92 > 2.015,我们拒绝H0,认为两种教学方法对学生成绩的影响有显著差异。
3. 配对样本t检验示例
问题:研究一种新药的效果,测量了10名患者治疗前后的血压变化。治疗前平均血压为140mmHg,治疗后为130mmHg,差值的样本标准差为4mmHg。
步骤:
- 提出假设:
- 计算t统计量:
- 查表或计算p值:自由度为n-1=9,查表或计算得到对应的双侧检验临界值远小于7.07。
- 决策:因为t值非常大,相应的p值会极小,远远小于α=0.05,我们强烈拒绝H0,表明治疗确实引起了血压的显著下降。
请注意
,这些例子中的计算简化了许多细节,实际应用中应使用精确数值进行计算,并考虑数据是否满足t检验的前提条件。