深度学习卷积图像尺寸计算器卷积计算图像法

转载

mob64ca140761a4 2024-01-19 22:31:55

文章标签 深度学习卷积图像尺寸计算器 pytorch 深度学习计算机视觉卷积 文章分类 深度学习人工智能

图像卷积及其计算（特征图尺寸、参数量、计算量）

卷积前后特征图尺寸的计算

定义参数如下：

输入特征图尺寸： $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器$
卷积核尺寸： $深度学习卷积图像尺寸计算器卷积计算图像法_卷积_02$
步长： $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_03$
填充的像素数： $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_04$

则有输出特征图尺寸为 $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_05$ ：
$深度学习卷积图像尺寸计算器卷积计算图像法_卷积_06$

参数量的计算

卷积层的参数量

卷积的参数量即卷积核的参数量，设我们有如下参数：

卷积核尺寸： $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_07$
前一层的通道数： $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_08$
当前层的卷积核个数： $深度学习卷积图像尺寸计算器卷积计算图像法_卷积_09$

单个卷积核的参数量：
$深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_10$
有 $深度学习卷积图像尺寸计算器卷积计算图像法_计算机视觉_11$ 个卷积核，故：
$深度学习卷积图像尺寸计算器卷积计算图像法_卷积_12$

全连接层的参数量

上面已经说过卷积层的参数量计算方法了，那如何计算全连接层的参数量？其实和卷积层参数量的计算方法是一样的。我们在进行全连接层的计算之前需要将最后一层卷积得到的特征图展开为一维的向量，即 $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_13$ ，其中 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_14$ 是最后一层卷积输出特征图的高宽和通道数， $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_15$ 即为本全连接层的输入特征维度，又设 $深度学习卷积图像尺寸计算器卷积计算图像法_卷积_16$ 为输出特征维度，则有：
$深度学习卷积图像尺寸计算器卷积计算图像法_卷积_17$
可以理解为是一个卷积层，我们就是用4096个 $深度学习卷积图像尺寸计算器卷积计算图像法_卷积_18$

验证

我们用VGG16， PyTorch来验证我们的公式是否正确。

VGG16的第一个卷积层输入为原图像 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_19$ ，卷积核个数为 $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_20$ ，尺寸为3，则根据公式，我们有VGG16第一个卷积层的参数量：
$深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_21$
VGG16第一个全连接层的输入维度数为最后一张特征图的尺寸拉直： $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_22$ ，输出维度数为4046，则：
$深度学习卷积图像尺寸计算器卷积计算图像法_计算机视觉_23$
手动计算好之后我们用PyTorch来打印输出以下看一下：

import torch
from torchvision.models import resnet50, vgg16
import numpy as np

model = vgg16()
for name, parameters in model.named_parameters():
        print(name, ':', np.prod(parameters.size()))

输出：

features.0.weight : 1728
features.0.bias : 64
...
classifier.0.weight : 102760448
classifier.0.bias : 4096

计算正确。

卷积的计算量

参考：FLOPs、FLOPS、Params的含义及PyTorch中的计算方法

MAC

MAC：Multiply Accumulate，乘加运算。乘积累加运算（英语：Multiply Accumulate, MAC）是在数字信号处理器或一些微处理器中的特殊运算。实现此运算操作的硬件电路单元，被称为“乘数累加器”。这种运算的操作，是将乘法的乘积结果和累加器的值相加，再存入累加器：
$深度学习卷积图像尺寸计算器卷积计算图像法_卷积_24$
使用MAC可以将原本需要的两个指令操作减少到一个指令操作，从而提高运算效率。

计算量FLOPs的计算

以下不考虑激活函数的计算量。

卷积层

$深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_25$

$深度学习卷积图像尺寸计算器卷积计算图像法_卷积_26$ =输入通道数， $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_27$ =卷积核尺寸， $深度学习卷积图像尺寸计算器卷积计算图像法_计算机视觉_28$ =输出特征图空间尺寸， $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_29$ =输出通道数。

一个MAC算两个个浮点运算，所以在最前面 $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_30$ 。不考虑bias时有 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_31$ ，有bias时没有 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_31$ 。由于考虑的一般是模型推理时的计算量，所以上述公式是针对一个输入样本的情况，即batch size=1。

理解上面这个公式分两步，括号内是第一步，计算出输出特征图的一个pixel的计算量，然后再乘以 $深度学习卷积图像尺寸计算器卷积计算图像法_计算机视觉_33$

括号内的部分又可以分为两步， $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_34$ 。第一项是乘法运算数，第二项是加法运算数，因为 $深度学习卷积图像尺寸计算器卷积计算图像法_卷积_35$ 个数相加，要加 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_36$ 次，所以不考虑bias，会有一个 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_31$ ，如果考虑bias，刚好中和掉，括号内变为 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_38$ 。

全连接层

全连接层： $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习卷积图像尺寸计算器_39$

$深度学习卷积图像尺寸计算器卷积计算图像法_卷积_40$ =输入层神经元个数， $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_41$ =输出层神经元个数。

还是因为一个MAC算两个个浮点运算，所以在最前面 $深度学习卷积图像尺寸计算器卷积计算图像法_pytorch_30$ 。同样不考虑bias时有 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_31$ ，有bias时没有 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_31$ 。分析同理，括号内是一个输出神经元的计算量，拓展到 $深度学习卷积图像尺寸计算器卷积计算图像法_深度学习_41$ 了输出神经元。

可以用 thop 库来验证。