回归分析拟合度过低的原因回归模型拟合度太低

转载

mob64ca14144dde 2024-03-15 08:11:10

文章标签 回归分析拟合度过低的原因拟合过拟合正则化 文章分类 机器学习人工智能

1. 什么是欠拟合和过拟合

先看三张图片，这三张图片是线性回归模型拟合的函数和训练集的关系

第一张图片拟合的函数和训练集误差较大，我们称这种情况为

欠拟合

第二张图片拟合的函数和训练集误差较小，我们称这种情况为

合适拟合

第三张图片拟合的函数完美的匹配训练集数据，我们称这种情况为

过拟合

类似的，对于逻辑回归同样也存在欠拟合和过拟合问题，如下三张图

2. 如何解决欠拟合和过拟合问题

欠拟合问题，根本的原因是特征维度过少，导致拟合的函数无法满足训练集，误差较大。

欠拟合问题可以通过增加特征维度来解决

过拟合问题，根本的原因则是特征维度过多，导致拟合的函数完美的经过训练集，但是对新数据的预测结果则较差。

解决过拟合问题，则有2个途径

减少特征维度; 可以人工选择保留的特征，或者模型选择算法
正则化; 保留所有的特征，通过降低参数θ的值，来影响模型

3. 正则化

过拟合例子, h(x) = θ0 + θ1x1 + θ2x2 + θ3x3 + θ4x4

惩罚, 也就是使得参数θ3, θ4接近于0。

最简单的方法是对代价函数进行改造，例如

这样在求解最小化代价函数的时候使得参数θ3, θ4接近于0。

正则化其实就是通过对参数θ的惩罚来影响整个模型

4. 线性回归使用正则化

代价函数J(θ)表达式如下

正则化后，代价函数J(θ)表达式如下，注意j从1开始

注意λ值不能设置过大，否则会导致求出的参数除了θ0，其它θ1,θ2 ... θn值约等于0，导致预测函数h(x)出现极大偏差

梯度下降算法和正规方程求解最小化J(θ)

1. 梯度下降算法(注意需要区分θ0和其它参数的更新等式)

2. 正规方程

对于正规方程来，需要修改等式如下

系数λ 所乘的矩阵为 (n+1)*(n+1)维

5. 逻辑回归使用正则化

和线性回归模型类型，逻辑回归也可以通过正则化来解决过拟合问题。

代价函数J(θ)表达式如下

正则化逻辑回归的代价函数，是在等式后加上一项，注意j从1开始

梯度下降算法求解最小化J(θ)，也需要做改变

不同的是逻辑回归模型中的预测函数 h(x)和线性回归不同

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：centos弹出bios指令 centos进去bios

下一篇：hologres sql节点里面的除法 sql如何做除法

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯