怎样处理过拟合和欠拟合？

关注二哥不像程序员

文章目录

过拟合和欠拟合
从模型在不同集合上的表现来看
从方差和偏差的角度来看
降低过拟合和欠拟合风险的方法
降低过拟合
降低欠拟合

怎样处理过拟合和欠拟合？

原创

二哥不像程序员 2023-05-06 10:15:40 博主文章分类：机器学习的100个坑 ©著作权

文章标签 过拟合欠拟合拟合方差 文章分类 JavaScript 前端开发

©著作权归作者所有：来自51CTO博客作者二哥不像程序员的原创作品，请联系作者获取转载授权，否则将追究法律责任

过拟合和欠拟合

从模型在不同集合上的表现来看

首先来明确一下过拟合和欠拟合的概念。

过拟合（下图中最右侧的图像）

过拟合指的是训练数据拟合程度过高的情况，也就是说模型在训练集上表现的很好，但是在测试集和新的数据集上表现的较差。

欠拟合（下图中最左侧的图像）

了解了什么是过拟合，欠拟合也显而易见，当模型在训练集和测试集表现的都不好的时候我们就称这种现象为欠拟合。

从方差和偏差的角度来看

偏差（bias）

算法在训练集上的错误率我们可以称之为偏差。

方差（variance）

算法在测试集上的表现低于在训练集上的程度我们可以称之为方差。

了解了偏差和方差在算法上的意义我们就可以说如果一个模型有低偏差，高方差便是过拟合，有高偏差，低方差便是欠拟合。

降低过拟合和欠拟合风险的方法

降低过拟合

增加数据量。更多的数据可以让模型学习到更多的有效特征，减小噪声的影响，从另一方面上讲，增加数据的数量也起到了减小方差的作用。
降低模型的复杂度。

神经网络：减少网络的层数，减少每一层网络的神经元个数。
树模型：剪枝，降低树的深度。

3. 正则化

L1：绝对值之和，让一部分特征缩小到0，常用于特征选择。
L2：平方之和，让特征的系数都进行缩小，使求解稳定快速。

4. 继承学习方法，多模型进行融合。

Boosting：该类模型中，后一个模型的输入会受到前一个模型的输出的影响。
Bagging：该模型中，模型之间相互独立，没有过大的影响。

降低欠拟合

增加新的特征。
增加模型的复杂度。简单的模型学习能力较差，通过增加模型的复杂度可以使模型有更强的拟合能力。
减少正则化的系数。正则化是用来防止过拟合的，当模型欠拟合时我们需要有针对的减少他们的系数。

赞
收藏
评论
分享
举报

上一篇：瞎聊机器学习——PR曲线、ROC曲线、AUC

下一篇：瞎聊机器学习——啥是决策树？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册