简介
1962年A.E.Hoerl首先提出,1970年他又和R.W.kennard合作在发表的论文中作了详细的讨论。应用回归分析有一种实际情况是:研究者希望在回归方程内包含2个或几个高度相关的共线性自变量。

这在医学研究中有时会遇到,例如有些生理指标,特别是生长发育指标(比如身高和体重),明知是高度相关的,有时却希望把它们都引入回归方程,以便作专业解释。这时用逐步回归法不合适,用一般回归分析法所求得的各回归系数值不稳定、难于解释。岭回归分析针对这种实际情况,用改进的最小二乘法拟合多元线性回归方程,叫做岭回归方程,可减少样本回归系数的标准误,使各回归系数值相对稳定和便于解释。其基本原理是:在用样本的相关系数值拟合标准化变量的岭回归方程时,把两两变量(包括自变量和应变量)Xi和Xj的相关系数rij,人为地减少成为rij/(1+k),k称为岭参数,取值0~1。求得的标准化岭回归系数可记作bi′(k),取使各bi′(k)相对稳定的k值,得标准化变量的岭回归方程为

岭回归分析python 岭回归分析结果解读_岭回归

还可得岭回归方程为

岭回归分析python 岭回归分析结果解读_回归分析_02

为岭回归系数。岭回归方程的方差分析、岭回归系数的标准误等的运算和一般多元线性回归分析的相同。岭回归分析主要用于解释:用岭回归系数bi(k)说明各自变量和应变量的数量关系;用标准化岭回归系数bi′(k)比较各自变量对应变量的作用大小。要指出的是:相对于一般回归分析所拟合的回归方程,特别是相对逐步回归分析所拟合的回归方程,岭回归方程的剩余均方要大,因此预报效果要差,一般不用于预报。