文章目录
- 简介
- 基本原理
- 前提条件
- 数学模型
- 基本步骤
- 平方和的分解
- 自由度的分解
- 方差的计算
- 显著性检验 -- F检验
- 多重比较
- 单因素方差分析
- 双因素方差分析
- 具有重复值的双因素方差分析
- 多因素方差分析
- 数据转换
简介
方差分析(analysis of variance,ANOVA)。
单样本或者双样本的显著性检验,可以是U检验或者t检验。多个样本的显著性检验如果还采用u检验或者t检验,需要两两进行比较,需要进行Cn2 次。麻烦而且出现α错误的概率增加。
英国统计学家R.A.Fiisher提出了而一种新的假设检验方法,基本思想是将所有数据(观测)的总变异拆分为处理效应与误差效应,如果处理效应显著不同于误差效应,也就可以肯定多样本间存在显著差异,然后再进行组间比较确定到底是哪些样本之间存在差异。
按因素对方差分析进行划分,可以分为单因素方差分析,主要是对因素的主效应进行分析;双因素方差分析和多因素方差分析,主要要是对主因素和因素之间的相互作用进行分析。
基本原理
前提条件
正态性检验可是使用偏度检验,峰度检验
方差齐性检验可以使用:卡方检验,F检验,或者巴特勒检验
数学模型
基本步骤
方差分析的基本步骤包括:总平方和分解,总自由度分解,和F检验,若F检验显著,在进行多重比较。其中多重比较包括两种方法:最小显著差值法(LSD)和最小显著极差法(LSR)。
平方和的分解
(T = 所有观测的和,Ti = 第i处理组所有观测的和)
SST = 所有观测 的平方和 - 矫正数
SSt = 组内观测的和 的平方和 /n - 矫正数
SSe = SST - SSt
自由度的分解
方差的计算
显著性检验 – F检验
多重比较
需要注意的是此时查t表的自由度 为dfe = k ( n-1 )
同时需要注意的是此时检验的是平均数的差值分布。
注意此时查的是邓肯表,自由度同样为误差SSe的自由度,等于K(n-1),M值为处理组之间的秩次距(可以认为是排第一和排第二相差两个秩次距,M=2),最后得到SSR值。
同时需要注意的是此时检验的是平均数的标准误
单因素方差分析
双因素方差分析
具有重复值的双因素方差分析
如果两个因素存在相互作用,而我们没有注意到,此时会将相互作用产生的方差计算到误差方差里,导致误差方法变大,从而出现显著性检验不显著的情况。设有重复观察时,我们可以将交互项的方差分解开,从而更精确的估计误差的方差。
多因素方差分析
数据转换