方差分析
一、基本概念
1.1 定义
- 研究一个(或多个)分类自变量如何影响一个数值因变量的统计分析方法
1.2 目的
- 判断某些因素对于我们感兴趣的因变量是否具有“显著”的影响
- 如果因素间有交互效应,寻找最佳搭配方案
1.3 特点
- 方差分析与一般的假设检验:方差分析处理的是多个均值的情况
- 方差分析与回归、相关分析:回归与相关处理的是两个数值变量的问题,相应的散点在 轴上具有顺序(从小到大),而方差分析的数据在
1.4 数学模型
1、定义
- 响应变量(因变量):进行随机试验所考察的数值指标
- 因素或因子(自变量):影响因变量的各不同分类原因
- 水平:各个因素所构成的组或者类型
2、例子:考察小麦产量()对于品种和施肥量的关系(两个不同的小麦品种,三个不同的施肥等级)
- 品种是否对产量有影响
- 施肥量是否对产量有影响
二、单因素方差分析
2.1 数据的结构
主要任务:
- 检验假设:
- 作出未知参数: 以及
2.2 因子效应与误差方差的估计
- 按照模型的假定,因变量的观察值来自
- 来自总体
- 未知参数
2.3 相关定义
- 因素各水平效应的估计采用各个组内平均
- 误差方差 的估计利用残差平方和
2.4 方差分析平方和分解公式
- 总平方和:表示因变量总的变化。(因子不同的水平,随机误差)
- 自变量平方和:表示自变量在因变量的变化中所占的份额
- 残差平方和:表示由其它原因引起的因变量变化
2.5 单因素方差分析的检验
- 如果零假设 成立,则
- 检验统计量
- 拒绝域
2.6 单因素方差分析表
2.7 变量关系的强度
三、双因素方差分析
3.1 数据的结构
主要任务:
- 因子的主效应是否显著,即检验: ,以及
- 交互效应是否显著:
- 如果拒绝了
3.2 相关定义
- 总平均
- 误差平均
- 因素平均
- 因素平均
3.3 方差分析平方和分解公式
- 总平方和
- 因子主效应平方和
- 因子主效应平方和
- 交互效应平方和
- 随机误差平方和
3.4 单因素方差分析的检验
- ~
- 当 成立时,~
- 当 成立时,~
- 当 成立时,~
- 对于零假设 ,相应的统计量及拒绝域为
- 对于零假设 ,相应的统计量及拒绝域为
- 对于零假设 ,相应的统计量及拒绝域为
3.5 双因素方差分析表