本笔记中原始数据及代码均来源于李东风先生的R语言教程,在此对李东风先生的无私分享表示感谢。
复相关系数平方
将总平方和分解为:
其中 - 总平方和
- 回归平方和
是能够用回归系数和自变量的变量解释的因变量变化。 - 残差平方和
是回归模型不能解释的因变量变化。 回归平方和越大,残差平方和越小,回归拟合越好。 定义复相关系数平方(判定系数)
则0≤R方≤1。 R方越大,说明数据中的自变量拟合因变量值拟合越好。 但是,“拟合好”不是唯一标准。 仅考虑拟合好, 可能产生很复杂的仅对建模用数据有效但是对其它数据无效的模型, 这称为“过度拟合”。 定义调整的(修正的)复相关系数平方:
克服了R方的部分缺点。 在体重与身高、年龄的模型结果中,R方=0.7729,R*方=0.7445
残差标准误差
模型中ε的方差σ方的估计为σe^方,
σ^是随机误差的标准差σ的估计量, 称为“残差标准误差”(Residual standard error)。 这是残差ei=yi-yi^的标准差的一个较粗略的近似估计。 在体重与身高、年龄的模型结果中,σ^=11.51 。