什么是过拟合:
对训练数据表现的很好,但对其他数据(验证数据或者测试数据)拟合的很差。
主要原因:算法过于特定于训练集而造成的。(出自pytorch深度学习,p56页)
发生过拟合的主要原因:
(1)模型有大量参数、表现力强。
(2)训练数据少。
解决过拟合的方法:
1、权值衰减通过在学习的过程中对大的权重进行惩罚。
2、Dropout方法
在学习过程中,随机删除神经元的方法。
3、正则化
4、降低数据量
5、获取更多数据
数据增强:是一种让用户通过执行不同的操作,如旋转、裁剪和生成更多数据,来轻微调整图像的技术。
数据增强可用于在计算机视觉相关的问题中生成更多的训练数据。
6、缩小网络规模
主要是减少层数,或者权重参数的数量