回型回归回归模式

转载

mob64ca13f8eecb 2024-08-20 17:22:25

线性回归模型

线性回归模型有如下形式
$回型回归回归模式_回型回归$
回归的主要目的是利用训练集 $回型回归回归模式_方差_02$ 来估计参数 $回型回归回归模式_回型回归_03$ . 最经常使用的方法是最小二乘法(LS), 即
$回型回归回归模式_最小二乘法_04$
可得唯一解为
$回型回归回归模式_线性回归_05$

注: 在书中, 此处给出了几何解释, 实质上就是最小二乘法的几何解释.

为了使得 $回型回归回归模式_回型回归_06$ 更加贴近于真实数据, 我们对数据的真实分布做一定的假设. 假设观测值 $回型回归回归模式_方差_07$ 不相关, 且有固定的方差 $回型回归回归模式_线性回归_08$ , 并且 $回型回归回归模式_线性回归_09$ 是固定取值. 类似地, 我们可以得到
$回型回归回归模式_回型回归_10$
对方差进行无偏估计有
$回型回归回归模式_线性回归_11$
假设 $回型回归回归模式_最小二乘法_12$ 与其期望的偏差是可加的且是正态的, 线性回归模型为
$回型回归回归模式_线性回归_13$
此处, $回型回归回归模式_最小二乘法_14$
据此可知 $回型回归回归模式_回型回归_06$ 和 $回型回归回归模式_方差_16$ 分别服从正态分布和卡方分布, 且两者统计独立. 进而得到假设检验和 $回型回归回归模式_方差_17$

线性回归问题的方法

子集的选择

子集选择意味着我们只保留变量的一个子集，并除去模型中的剩余部分。最小二乘回归用来预测保留下的输入变量的系数。

最优集选择

一个有效的算法: leaps and bounds 过程.

向前和向后逐步选择

向前逐步选择 (Forward-stepwise selection) 从截距开始, 然后向模型中依次添加最大程度提升拟合效果的预测变量. 至于更新算法, 可以利用QR 分解从当前拟合快速得到下一步的备选预测变量. 这是一种贪心算法 (greedy algorithm), 产生了一个嵌套的模型序列.
向后逐步选择 (backward-stepwise selection) 从整个模型开始, 并且逐步删掉对拟合影响最低的预测变量. 要删掉的候选变量是 Z 分数最低的变量

向后只能用于 $回型回归回归模式_最小二乘法_18$

向前逐渐 (Forward-Stagewise) 回归

Forward-Stagewise 回归比向前逐步回归有更多限制. 开始类似向前逐步回归，由等于 $回型回归回归模式_线性回归_19$ 的截距开始, 中心化后的预测变量系数都初始化为 $回型回归回归模式_最小二乘法_20$ . 每一步算法找出与当前残差最相关的变量, 然后计算所选择变量的残差的简单线性回归系数, 并且添加到该变量的当前系数. 这个过程一直继续直到没有变量与残差有相关性.

虽然可能需要比 Forward-Stepwise 花更多的步骤完成拟合, 这种“慢拟合”高维问题中会有很好的结果.

收缩方法

子集选择 (subset selection) 可得到一个可解释的、预测误差可能比全模型低的模型. 然而, 因为这是一个离散的过程(变量或保留或丢弃), 所以经常表现为高方差, 因此不会降低全模型的预测误差. 而收缩方法 (shrinkage methods) 更加连续, 不会受高易变性 (high variability) 太大的影响.

岭回归

岭回归 (Ridge regression) 根据回归系数的大小加上惩罚因子对它们进行收缩, 即
$回型回归回归模式_回型回归_21$
也可等价写作
$回型回归回归模式_方差_22$

Lasso

lasso 问题可写为如下格式:
$回型回归回归模式_线性回归_23$
在信号处理中，lasso 也被称作 basis pursuit. 与岭回归相比, 只是正则项的不同.

对子集选择, 岭回归和 lasso 进行讨论:
在正交输入矩阵的情况下, 三种过程都有显式解. 每种方法对最小二乘估计 $回型回归回归模式_回型回归_24$
lasso, 岭回归和最优子集选择是有着不同先验分布的贝叶斯估计. 然而, 注意到它们取自后验分布的众数, 即最大化后验分布. 在贝叶斯估计中使用后验分布的均值更加常见. 岭回归同样是后验分布的均值, 但是 lasso 和最优子集选择不是.

最小角回归(LAR)

最小角回归 (LAR) 可以看成是一种向前逐步回归的 democratic 版本. 采用了类似的策略, 但是仅仅加入一个变量应有的程度. 第一步确定与响应变量最相关的变量. 不是完全地拟合该变量, LAR 使得该变量的系数向最小二乘值连续变化(即, 使得它与进化的残差之间的相关系数绝对值降低). 只要其他变量与残差的相关性与该变量和残差的相关性相等, 则该过程暂停. 第二个变量加入活跃集, 然后它们的系数一起以保持相关性相等并降低的方式变化. 这个过程一直继续直到所有的变量都在模型中, 然后在全最小二乘拟合处停止.

其他方法(输入相关性强的情形)

主成分回归

偏最小二乘

这两部分感觉没太多说的, 阅读课本了解即可.

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Centos系统USB接口突然不识别硬盘了 centos打不开u盘

下一篇：mysql 更新语句双引号 mysql 更新数据语法

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯