深度学习卷积结果计算公式推导过程

转载

coolfengsy 2024-07-16 07:06:33

0. 前言

对于卷积操作我们都很清楚其具体过程，不过卷积操作是如何在计算机上实现的呢？

我们当然可以按照卷积的操作那样去用一系列的for循环来实现，但效率很低下，而矩阵的乘法可以被高度优化和加速，且目前有很多现成的算法和加速包。于是问题就转换为：我们能否把卷积操作转换为矩阵的乘法？

实际上是可以的，而且还非常简单易懂。

我们先来快速回顾一下卷积的操作：假设卷积核大小为3x3，则feature map在原图上的一个感受野大小为3x3，将感受野在原图上进行滑动（一般步长stride=1），就可以得到一张feature map。D个卷积核就会得到D个feature map。

深度学习卷积结果计算公式推导过程_深度学习卷积结果计算公式推导过程

我们假设在某一层有D个卷积核，尺寸为K x K x C（即有C个channel，说明输入的feature map有C个channel）

深度学习卷积结果计算公式推导过程_卷积神经网络_02

我们把每一个KxKxC维度的卷积核拆成一个K²C长度的行向量，把D个K²C长度的行向量按行堆叠，就形成了一个Dx(K²C)的二维矩阵，如下所示：

深度学习卷积结果计算公式推导过程_卷积操作_03

我们假设输入的feature map尺寸为H x W x C，H、W为高和宽，C代表C个channel，如下图所示（卷积核大小为K x K x C）。

深度学习卷积结果计算公式推导过程_卷积操作_04

我们知道，感受野会在整个输入图像中滑动，每次滑动一个stride，假设感受野在整张图象上滑动N次。从上图可以看出，一个感受野为一K x K x C的矩形，我们将其拉伸为K²C个元素列向量，如下图所示：

深度学习卷积结果计算公式推导过程_卷积核_05

由于感受野在输入图像上滑动了N次，每次都会产生一个K²C的列向量，我们把这些列向量按列堆叠，就形成了一个(K²C)xN的二维矩阵，如下所示：

深度学习卷积结果计算公式推导过程_深度学习_06

我们将卷积核转换成的Dx(K²C)矩阵与输入的feature map经过感受野滑动得到的(K²C)xN矩阵进行相乘，得到DxN的二维矩阵，如下所示：

深度学习卷积结果计算公式推导过程_卷积核_07

最终输出D x N的二维向量的每一行代表：一个卷积核生成的feature map拉成的行向量（共N个元素）

END ：）

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯