跟着小土堆学习pytorch（三）——常见transform

原创

周末不下雨 2024-11-04 15:00:51 博主文章分类：深度之眼 ©著作权

文章标签 学习 pytorch python 数据预处理 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者周末不下雨的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

一、Normalize
二、Resize
三、compose
四、RandomCrop
五、transform

一、Normalize

把图片进行，归一化
output[channel] = (input[channel] - mean[channel]) / std[channel] 这是Normalize，所使用的公式

print(img_tensor[0][0][0])
trans_norm transforms.Normalize([0.5,0.5,0.5],[0.5,0.5,0.5])
img_norm trans_norm(img_tensor)
print(img_norm[0][0][0])
writer.add_image("Normalize",img_norm)

因为RGB图片是三通道的，所以需要用中括号，在均值、方差处，输入三个参数

二、Resize

如果输入，两个参数，那么直接规定为长和宽，如果只有一个数字，那么就是等比例缩小

print(img.size)
trans_resize transforms.Resize((512,512))
img PIL -resize -img_resize PIL
img_resize trans_resize(img)
img_resize PIL -totensor -img_resize tensor
img_resize trans_totensor(img_resize)
writer.add_image("Resize",img_resize,0)
print(img_resize)

三、compose

Compose（）中的参数需要是一个列表
Python中，列表的表示形式为[数据1，数据2，]
在Compose中，数据需要是transforms类型,所以得到，Compose([transforms参数1，transforms参数2，.)

# Compose-resize-2
trans_resize_2 = transforms.Resize(512)
# PIL -PIL -tensor
trans_compose transforms.Compose([trans_resize_2,trans_totensor])
img_resize_2 trans_compose(img)
writer.add_image("Resize",img_resize_2,1)

trans_compose transforms.Compose([trans_resize_2,trans_totensor]) 着重讲一下这一行
首先明确三点

compose的作用就是把transform组合一起，按照前面处理完，再传完下一个
Resize对象输入PIL，输出也是PIL
totensor对象输入时PIL，输出时tensor
注意：trans_resize_2,trans_totensor，这是已经把对象实例化了
所以这一行的代码，是先放入trans_resize_2处理，再放入trans_totensor