本笔记中原始数据及代码均来源于李东风先生的R语言教程,在此对李东风先生的无私分享表示感谢。

复相关系数平方

将总平方和分解为:

R语言 标准差函数编写 r语言求回归标准差_标准差

其中 - 总平方和

R语言 标准差函数编写 r语言求回归标准差_数据_02

- 回归平方和

R语言 标准差函数编写 r语言求回归标准差_拟合_03

是能够用回归系数和自变量的变量解释的因变量变化。 - 残差平方和

R语言 标准差函数编写 r语言求回归标准差_R语言 标准差函数编写_04

是回归模型不能解释的因变量变化。 回归平方和越大,残差平方和越小,回归拟合越好。 定义复相关系数平方(判定系数)

R语言 标准差函数编写 r语言求回归标准差_回归标准差和残差平方和的关系_05

则0≤R方≤1。 R方越大,说明数据中的自变量拟合因变量值拟合越好。 但是,“拟合好”不是唯一标准。 仅考虑拟合好, 可能产生很复杂的仅对建模用数据有效但是对其它数据无效的模型, 这称为“过度拟合”。 定义调整的(修正的)复相关系数平方:

R语言 标准差函数编写 r语言求回归标准差_数据_06

克服了R方的部分缺点。 在体重与身高、年龄的模型结果中,R方=0.7729,R*方=0.7445

残差标准误差

模型中ε的方差σ方的估计为σe^方,

R语言 标准差函数编写 r语言求回归标准差_回归标准差和残差平方和的关系_07

σ^是随机误差的标准差σ的估计量, 称为“残差标准误差”(Residual standard error)。 这是残差ei=yi-yi^的标准差的一个较粗略的近似估计。 在体重与身高、年龄的模型结果中,σ^=11.51 。