分享大纲

1. 图像读取

  • 常用图像读取的5种方法及其比较总结;

2. Pytorch数据读取

  • 介绍了常用数据集及自定义数据集读取的方法;

3. 数据扩增

  • 基于图像处理的数据扩增、基于深度学习的数据扩增及使用Pytorch的数据扩增。

图像读取

常用的图像数据读取方法如下:

图像数据读取及数据扩增方法_java

  • 方法1:OpenCV-python

  • 方法2:Pillow

  • 方法3:matplotlib

图像数据读取及数据扩增方法_java_02

  • 方法4:scipy

图像数据读取及数据扩增方法_java_03

  • 方法5:skimage

图像数据读取及数据扩增方法_java_04

  • 总结

Pytorch数据读取

Pytorch数据读取时分为常用数据集读取和自定义数据集读取两部分。

  • 常用数据集读取

  • 自定义数据集读取

图像数据读取及数据扩增方法_java_05

数据扩增

数据扩增用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力。常见的数据扩增方法有:基于图像处理的图像扩增、基于深度学习的图像扩增。

图像数据读取及数据扩增方法_java_06

1. 基于图像处理的数据扩增

  • 几何变换

图像数据读取及数据扩增方法_java_07

  • 灰色和彩色空间变换

  • 添加噪声和滤波

  • Mixing image(图像混合)

  • Random erasing(随机擦除)

2. 基于深度学习的数据扩增

图像数据读取及数据扩增方法_java_08

3. 使用Pytorch进行数据增强

图像数据读取及数据扩增方法_java_09

图像数据读取及数据扩增方法_java_10