数据扩增

  • 基于图像处理的数据扩增
  • 几何变换
  • 灰度与彩色空间变换
  • 添加噪声和滤波
  • 图像混合
  • 随机擦除
  • 基于深度学习的数据扩增
  • 基于GAN的数据增强
  • 神经风格转换(Neural Style Transfer)
  • 使用pytorch(torchvision)进行数据增强
  • 总结


基于图像处理的数据扩增

几何变换

  • 旋转
  • 缩放
  • 反转
  • 裁剪
  • 平移

作用:几何变换可以有效地对抗数据中存在的位置偏差、视角偏差、尺寸偏差,而且易于实现,非常常用

灰度与彩色空间变换

  • 亮度调整
  • 对比度、饱和度调整
  • 颜色空间变换
  • 色彩调整
    作用:对抗数据中存在的光照、色彩、亮度偏差

添加噪声和滤波

  • 注入高斯噪声、椒盐噪声等
  • 滤波:模糊、锐化
    作用:提升模型在面对噪声时候的鲁棒性,帮助学习更泛化的特征。

图像混合

迁移学习扩充数据集样本数量_人工智能


这一点的用途,在cnn上我目前想不粗来。。。但是应该还是能提升模型的鲁棒性的把。

随机擦除

这一点是比较符合实际情况的,在实际的运用当中,我们的物体会被各种各样的东西挡住,所以在训练中应该有这类数据的存在,提升模型的泛化能力。

迁移学习扩充数据集样本数量_迁移学习扩充数据集样本数量_02

基于深度学习的数据扩增

基于GAN的数据增强

通过训练一个GAN网络来生成一些图片。用来解决一些训练集分布不均衡的问题。

神经风格转换(Neural Style Transfer)

通过神经网络风格迁移来生成不同风格的数据,从而防止模型的过拟合。

使用pytorch(torchvision)进行数据增强

pytorch的数据增强方法主要在torchvision中的transforms中。将图片放出,无需记住,只需要在用到的时候查找就可以了。

迁移学习扩充数据集样本数量_人工智能_03

总结

数据增强可以有效地防止过拟合。而且数据的预处理对最后的效果也占了很大的比重。