pytorch加噪声的数据增强 pytorch数据增强代码

转载

mob64ca13ff5b03 2024-08-28 12:29:51

文章标签 pytorch加噪声的数据增强机器学习深度学习计算机视觉人工智能 文章分类 PyTorch 人工智能

数据扩增

Part 1 数据读取与数据扩增

图像读取
数据扩增

基于图像处理的数据扩增

几何变换
灰度和彩色空间变换
添加噪声和滤波
图像混合（Mixing images）
随机搽除（Random erasing）

基于深度学习的数据扩增

使用PyTorch进行数据增强
使用Albumentations进行数据增强

Part 2 评价与损失函数

IOU
Dice coefficient
Dice Loss
Binary Cross-Entropy
Balanced Cross-Entropy
Focal Loss

Part 1 数据读取与数据扩增

图像读取

常用的图像读取方法：OpenCV-python、Pillow、matplotlib.image、scipy.misc、skimage

Pillow只提供最基础的数字图像处理，功能有限，但方便轻巧
Scikit-image是基于scipy的一款图像处理包，功能强大
OpenCV是一个非常全面的图像处理、计算机视觉库
Pillow读入的图片是img类，其他库读进来的图片都是numpy矩阵
OpenCV读入的彩色图像通道顺序是BGR，其他图像库读入的彩色图像顺序都是RGB

数据扩增

数据扩增是一种有效的正则化方法，可以缓解模型过拟合，迫使网络学习到更鲁棒、更多样的特征，给模型带来更强的泛化能力。

pytorch加噪声的数据增强 pytorch数据增强代码_pytorch加噪声的数据增强

基于图像处理的数据扩增

几何变换

旋转、缩放、翻转、裁剪、平移、仿射变换

作用：几何变换可以有效的对抗数据中存在的位置偏差、视角偏差、尺寸偏差，而且易于实现

pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_02

灰度和彩色空间变换

亮度调整，对比度、饱和度调整，颜色空间转换，色彩调整，gamma变换

作用：对抗数据中存在的光照、色彩、亮度、对比度偏差

pytorch加噪声的数据增强 pytorch数据增强代码_pytorch加噪声的数据增强_03

添加噪声和滤波

添加高斯噪声、椒盐噪声
滤波：模糊、锐化、雾化

作用：应对噪声干扰、恶劣环境、成像异常等特殊情况，帮助学习更泛化的特征

pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_04

图像混合（Mixing images）

pytorch加噪声的数据增强 pytorch数据增强代码_计算机视觉_05

随机搽除（Random erasing）

pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_06

基于深度学习的数据扩增

基于GAN的数据增强（GAN-based Data Augmentation）：使用GAN生成模型来生成更多的数据，可用做解决类别不平衡问题的过采样技术。
神经风格转换（Neural Style Transfer）：通过神经网络风格迁移来生成不同风格的数据，防止模型过拟合
AutoAugment

使用PyTorch进行数据增强

在PyTorch中，常用的数据增强的函数主要集成在torchvision.transforms

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_07

pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_08

使用PyTorch进行数据增强

from PIL import Image
from torchvision import transforms as tfs
import matplotlib.pyplot as plt

im=Image.open('dog.jpg')
im_aug=tfs.Compose([
    tfs.Resize([200,200]),
    tfs.RandomVerticalFlip(),
    tfs.RandomCrop(110),
    tfs.ColorJitter(brightness=0.5,contrast=0.5,hue=0.5),
])

nrows=4
ncols=4
figsize=(8,8)
_,figs=plt.subplots(nrows,ncols,figsize=figsize)
for i in range(nrows):
    for j in range(ncols):
        figs[i][j].imshow(im_aug(im))
        figs[i][j].axes.get_xaxis().set_visible(False)
        figs[i][j].axes.get_yaxis().set_visible(False)
plt.show()

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_09

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_10

使用Albumentations进行数据增强

https://github.com/albumentations-team/albumentations

Part 2 评价与损失函数

IOU

T表示真实前景，P表示预测前景

pytorch加噪声的数据增强 pytorch数据增强代码_计算机视觉_11

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_12

Dice coefficient

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_13

A表示真实前景，B表示预测前景，Dice系数取值范围为[0,1]

用来度量集合相似度的度量函数，通常用于计算两个样本之间的像素之间的相似度。

Dice系数不仅在直观上体现了target与prediction的相似程度，同时其本质上还隐含了精确率和召回率两个重要指标。

Dice Loss

通过Dice系数转变而来，为了能够实现最小化的损失函数，方便模型训练，以1-Dice的形式作为损失函数。

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_14

在一些场合还可以添加上Laplace smoothing减少过拟合（为了解决零概率问题）：

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_15

Binary Cross-Entropy

pytorch加噪声的数据增强 pytorch数据增强代码_计算机视觉_16

y：真实值，非1即0；

$pytorch加噪声的数据增强 pytorch数据增强代码_pytorch加噪声的数据增强_17$ ：所属此类的概率值，为预测值；

交叉熵损失函数可以用在大多数语义分割场景中，BCE损失函数（Binary Cross-Entropy Loss）是交叉损失函数（Cross-Entropy Loss）的一种特例，BCE Loss只能应用在二分类任务中，对于像素级的分类任务时效果不错。

缺点：当前景像素的数量远小于背景像素的数量时，可能会使得模型严重偏向背景，导致效果不佳。

Balanced Cross-Entropy

pytorch加噪声的数据增强 pytorch数据增强代码_pytorch加噪声的数据增强_18

y：真实值，非1即0；

$pytorch加噪声的数据增强 pytorch数据增强代码_pytorch加噪声的数据增强_17$ ：所属此类的概率值，为预测值；

设置 $pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_20$ ，减少假阴性；设置 $pytorch加噪声的数据增强 pytorch数据增强代码_计算机视觉_21$ ，减少假阳性

优点：相比于原始的二元交叉熵Loss，在样本数量不均衡的情况下，可以获得更好的效果。

Focal Loss

pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_22

pytorch加噪声的数据增强 pytorch数据增强代码_计算机视觉_23

Focal Loss最初是出现在目标检测领域，主要是为了解决正负样本、难易样本比例失调的问题。

简而言之， $pytorch加噪声的数据增强 pytorch数据增强代码_人工智能_24$ 解决正负样本不平衡问题， $pytorch加噪声的数据增强 pytorch数据增强代码_深度学习_25$ 解决难易样本不平衡问题。

pytorch加噪声的数据增强 pytorch数据增强代码_机器学习_26

易分样本（即置信度高的样本），对模型的提升效果非常小，模型应该主要关注那些难分的样本。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：xgplayer ios mp4无法播放 xplayer怎么用ios使用

下一篇：Android开发向List集合中手动添加字符串安卓listview添加数据

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯