pytorch Conv2d原理 pytorch中conv2d函数

转载

mob64ca14101b2f 2024-01-17 19:53:55

文章标签 pytorch Conv2d原理 2d 卷积权重 文章分类 PyTorch 人工智能

Pytorch的nn.Conv2d（）详解

nn.Conv2d()的使用、形参与隐藏的权重参数

in_channels
out_channels
kernel_size
stride = 1
padding = 0
dilation = 1
groups = 1
bias = True
padding_mode = 'zeros'

nn.Conv2d()的使用、形参与隐藏的权重参数

二维卷积应该是最常用的卷积方式了，在Pytorch的nn模块中，封装了nn.Conv2d()类作为二维卷积的实现。使用方法和普通的类一样，先实例化再使用。下面是一个只有一层二维卷积的神经网络，作为nn.Conv2d（）方法的使用简介：

class Net(nn.Module):
    def __init__(self):
        nn.Module.__init__(self)
        self.conv2d = nn.Conv2d(in_channels=3,out_channels=64,kernel_size=4,stride=2,padding=1)

<span >def</span> <span >forward</span><span >(</span>self<span >,</span> x<span >)</span><span >:</span>
    <span >print</span><span >(</span>x<span >.</span>requires_grad<span >)</span>
    x <span >=</span> self<span >.</span>conv2d<span >(</span>x<span >)</span>
    <span >return</span> x

print(net.conv2d.weight)
print(net.conv2d.bias)

它的形参由Pytorch手册可以查得，前三个参数是必须手动提供的，后面的有默认值。接下来将一一介绍：

pytorch Conv2d原理 pytorch中conv2d函数_权重

也许有细心的同学已经发现了，emm…卷积层最重要的可学习参数——权重参数和偏置参数去哪了？在Tensorflow中都是先定义好weight和bias，再去定义卷积层的呀！别担心，在Pytorch的nn模块中，它是不需要你手动定义网络层的权重和偏置的，这也是体现Pytorch使用简便的地方。当然，如果有小伙伴适应不了这种不定义权重和偏置的方法，Pytorch还提供了nn.Functional函数式编程的方法，其中的F.conv2d()就和Tensorflow一样，要先定义好卷积核的权重和偏置，作为F.conv2d（）的形参之一。

回到nn.Conv2d上来，我们可以通过实例名.weight和实例名.bias来查看卷积层的权重和偏置，如上图所示。还有小伙伴要问了，那么它们是如何初始化的呢？

首先给结论，在nn模块中，Pytorch对于卷积层的权重和偏置（如果需要偏置）初始化都是采用He初始化的，因为它非常适合于ReLU函数。这一点大家看Pytorch的nn模块中卷积层的源码实现就能清楚地发现了，当然，我们也可以重新对权重等参数进行其他的初始化，可以查看其他教程，此处不再多言。

in_channels

这个很好理解，就是输入的四维张量[N, C, H, W]中的C了，即输入张量的channels数。这个形参是确定权重等可学习参数的shape所必需的。

out_channels

也很好理解，即期望的四维输出张量的channels数，不再多说。

kernel_size

卷积核的大小，一般我们会使用5x5、3x3这种左右两个数相同的卷积核，因此这种情况只需要写kernel_size = 5这样的就行了。如果左右两个数不同，比如3x5的卷积核，那么写作kernel_size = (3, 5)，注意需要写一个tuple，而不能写一个列表（list）。

stride = 1

卷积核在图像窗口上每次平移的间隔，即所谓的步长。这个概念和Tensorflow等其他框架没什么区别，不再多言。

padding = 0

Pytorch与Tensorflow在卷积层实现上最大的差别就在于padding上。

Padding即所谓的图像填充，后面的int型常数代表填充的多少（行数、列数），默认为0。需要注意的是这里的填充包括图像的上下左右，以padding = 1为例，若原始图像大小为32x32，那么padding后的图像大小就变成了34x34，而不是33x33。

Pytorch不同于Tensorflow的地方在于，Tensorflow提供的是padding的模式，比如same、valid，且不同模式对应了不同的输出图像尺寸计算公式。而Pytorch则需要手动输入padding的数量，当然，Pytorch这种实现好处就在于输出图像尺寸计算公式是唯一的，即

pytorch Conv2d原理 pytorch中conv2d函数_权重_02

当然，上面的公式过于复杂难以记忆。大多数情况下的kernel_size、padding左右两数均相同，且不采用空洞卷积（dilation默认为1），因此只需要记 O = （I - K + 2P）/ S +1这种在深度学习课程里学过的公式就好了。

dilation = 1

这个参数决定了是否采用空洞卷积，默认为1（不采用）。从中文上来讲，这个参数的意义从卷积核上的一个参数到另一个参数需要走过的距离，那当然默认是1了，毕竟不可能两个不同的参数占同一个地方吧（为0）。
groups = 1

决定了是否采用分组卷积，groups参数可以参考groups参数详解

bias = True

即是否要添加偏置参数作为可学习参数的一个，默认为True。

padding_mode = ‘zeros’

即padding的模式，默认采用零填充。

Pytorch的nn.Conv2d（）详解

nn.Conv2d()的使用、形参与隐藏的权重参数

in_channels
out_channels
kernel_size
stride = 1
padding = 0
dilation = 1
groups = 1
bias = True
padding_mode = 'zeros'

nn.Conv2d()的使用、形参与隐藏的权重参数

class Net(nn.Module):
    def __init__(self):
        nn.Module.__init__(self)
        self.conv2d = nn.Conv2d(in_channels=3,out_channels=64,kernel_size=4,stride=2,padding=1)

<span >def</span> <span >forward</span><span >(</span>self<span >,</span> x<span >)</span><span >:</span>
    <span >print</span><span >(</span>x<span >.</span>requires_grad<span >)</span>
    x <span >=</span> self<span >.</span>conv2d<span >(</span>x<span >)</span>
    <span >return</span> x

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：备份架构系统集中管理平台备份策略详细方案备份组网架构

下一篇：android mvp模式讲解安卓mvp模式

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯