1、方差分析基本原理:是一种分析各类别自变量对数值因变量影响的一种统计方法。自变量对因变量的影响也称为自变量效应。由于影响效应的大小体现为因变量的误差里有多少是由自变量造成的,因此,方差分析通过对数据误差的分析来检验这种效应是否显著。通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小,这种误差可能是来自自变量的影响,也可能是由于各组内一些误差(如测量仪器的精确程度)
2、由于误差的可能来源有两种:各组间受自变量变化引起的不同;组内一些如测量误差等,故
总离差平方和=组间平方和+组内平方和
3、前提条件
(1)各样本是相互独立的随机样本
(2)各样本分布均为正态分布
(3)各样本的总体方差相等,即具有方差齐性
(4)在不满足正态性时可以用非参数检验;
但是今天上知网查找一些有关内容的时候,发现一篇有关方差检验的前提之一“服从正态分布是否对方差检验有影响”的论文,陈述并给出了相关证明,证明是否服从正态分布对能否用方差检验的影响不是很大,为了方便计算,在R语言中可省略对数据进行正态检验和转换过程。
4、如何用R语言实现单因素方差分析(举例)
(1)下载multcomp ,加载cholesterol数据集
install.packages("multcomp")
attach(cholesterol)#全局化该数据集
(2)进行正态性检验
shapiro.test(response)
(3)方差齐性检验
bartlett.test(response~trt,data=cholesterol)
或
leveneTest(cholesterol$response~cholesterol$trt)(来自于car包)
5、aov_response<-aov(response~trt)
或使用oneway.test(response~trt,data=cholesterol,var.equal=TRUE)(其实更符合单因素方差分析)
6、使用summary函数调用出结果
R语言作正态分布检验 - 菜鸟学院(正态分布系列函数及适用)