python 实现conv2d pytorch conv2d函数详解

转载

mob6454cc6ccc8a 2024-02-13 23:06:54

文章标签 python 实现conv2d pytorch 深度学习计算机视觉 2d 文章分类 Python 后端开发

一.卷积层

1.Conv2d参数

conv2d = torch.nn.Conv2d(
	in_chinnels,	# (整数)输入图像的通道数
	out_channels,	# (整数)经过卷积后输出的通道数
	kernel_size,	# (整数或数组)卷积核的尺寸
	stride=1,		# (整数或数组)卷积的步长
	padding=0,		# (整数或数组)在输入两边进行0填充的数量
	dilation=1,		# (整数或数组)卷积核元素之间的步幅，可调整空洞卷积的空洞大小，默认为普通卷积
	groups=1,		# (整数)从输入通道到输出通道的阻塞连接数，分组卷据的组数，默认不分组
	bias=True		# 是否添加偏置
)

2.常用属性

conv2d.bias				# 偏置的具体内容
conv2d.bias.data		# 偏置的具体data数值

conv2d.weight			# 卷积核的具体内容
conv2d.weight.data  	# 卷积核的具体data数值
conv2d.weight.data[0]	# 第0个卷积核的具体数值

# 其他
conv2d.in_channels
conv2d.out_channels
conv2d.kernel_size
conv2d.stride
conv2d.padding
conv2d.groups

3.其他常见卷积

torch.nn.Conv1d()					# 1D卷积
torch.nn.Conv2d()					# 2D卷积
torch.nn.Conv3d()					# 3D卷积
torch.nn.ConvTranspose1d()			# 1D转置卷积
torch.nn.ConvTranspose2d()			# 2D转置卷积
torch.nn.ConvTranspose3d()			# 3D转置卷积

二.池化层

1.MaxPool2d参数

torch.nn.MaxPool2d(
    kernel_size,			# (整数或数组)池化窗口大小
    stride=None,			# (整数或数组)池化串口移动步长,默认和kernel_size一样
    padding=0,				# (整数或数组)输入的每一条边补充0的层数
    dilation=1,				# (整数或数组)控制窗口元素步幅
    return_indices=False,	# True时返回输出最大值的索引，便于MaxUnpool2d操作
    ceil_mode=False			# 计算结果是否向上取整，默认向下取整
)

2.常用属性

conv2d.padding
conv2d.kernel_size
conv2d.stride
conv2d.ceil_mode
conv2d.dilation
conv2d.return_indices

3.其他常见池化

# 最大池化
torch.nn.MaxPool1d()
torch.nn.MaxPool2d()
torch.nn.MaxPool3d()
# 最大池化逆池化
torch.nn.MaxUnpool1d()
torch.nn.MaxUnpool2d()
torch.nn.MaxUnpool3d()
# 平均池化
torch.nn.AvgPool1d()
torch.nn.AvgPool2d()
torch.nn.AvgPool3d()
# 自适应最大池化
torch.nn.AdaptiveMaxPool1d()
torch.nn.AdaptiveMaxPool2d()
torch.nn.AdaptiveMaxPool3d()
# 自适应平均池化
torch.nn.AdaptiveAvgPool1d()
torch.nn.AdaptiveAvgPool2d()
torch.nn.AdaptiveAvgPool3d()

三.激活函数

1.常见激活函数

import torch

torch.nn.Sigmoid()
torch.nn.Tanh()
torch.nn.Relu()
torch.nn.Softplus()	# Relu激活函数的平滑近似

2.使用

x = torch.linspace(-6,6,100)

sigmod = nn.Sigmoid()
relu = nn.ReLU()
tanh = nn.Tanh()
softplus = nn.Softplus()

y_sigmod = sigmod(x)
y_relu = relu(x)
y_tanh = tanh(x)
y_softplus = softplus(x)

四.循环层

1.RNN参数

rnn = torch.nn.RNN(
    input_size,				# 输入参数x的特征数量
    hidden_size,			# 隐藏层的特征数量
    num_layers=1,			# RNN网络循环层的数量
    nonlinearity='tanh',	# 只能是tanh或relu
    bias=True,				# RNN层是否使用偏置权重
    batch_first=False,		# 输入输出的shape是否应为(batch_size,time_steq,feature)
    dropout=0,				# 除了最后一层的其他RNN层是否都会套上一个dropout层
    bidirectional=False		# 是否是双向循环RNN
)

RNN的输入

input：形状为 (seq_len, batch, input_size) 的张量。
h_0：形状为 (num_layers * num_directions, batch, hidden_size) 的张量，保存初始隐藏层每个元素，默认为0。双向循环时num_directions = 2，否则为 1。

RNN的输出

output：形状为 (seq_len, batch, num_directions * hidden_size) 的张量，保存最后一层的输出特征。
h_n：形状为 (num_layers * num_directions, batch, hidden_size) 的张量，保存最后一个时刻的隐状态。

简单示例：

rnn = nn.RNN(10, 20, 2)
input = torch.randn(5, 3, 10)
h0 = torch.randn(2, 3, 20)
output, hn = rnn(input, h0)

2.其他常用RNN变体

import torch

torch.nn.LSTM()         # 多层长短期记忆LSTM单元
torch.nn.GRU()          # 多层门限循环GRU单元
torch.nn.RNNCell()      # 一个RNN循环层单元
torch.nn.LSTMCell()     # 一个长短期记忆LSTM单元
torch.nn.GRUCell()      # 一个门限循环GRU单元

五.全连接层

1.Linear参数

fc = torch.nn.Linear(
	in_features,		# 单样本的输入特征数量
    out_features,		# 单样本输出的特征数量
    bias=True			# 该层是否学习偏置

)

2.属性

fc.bias				# out_features 个偏置值，或者 None
fc.weight			# 形状为 (out_features,in_features) 的权值
fc.in_features		# 单样本的输入特征数量
fc.out_features		# 单样本输出的特征数量

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：sysbios SCI 接收中断发生后系统不运行 spi接收被中断打断

下一篇：jquery中表单焦点 javascript焦点

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python 实现conv2d pytorch conv2d函数详解

python 实现conv2d pytorch conv2d函数详解

一.卷积层

1.Conv2d参数

2.常用属性

3.其他常见卷积

二.池化层

1.MaxPool2d参数

2.常用属性

3.其他常见池化

三.激活函数

1.常见激活函数

2.使用

四.循环层

1.RNN参数

2.其他常用RNN变体

五.全连接层

1.Linear参数

2.属性

51CTO博客