pytorch查看网络参数量 pytorch 网络参数量

转载

hochie 2023-09-06 11:22:23

文章标签 pytorch查看网络参数量 pytorch 网络深度学习卷积 文章分类 PyTorch 人工智能

文章目录

计算理论

卷积层：

参数量（注意包括weight和bias)：
输出特征图尺寸：
FLOPs

BN层：

插入BN反向传播推导
参数量
输出特征图尺寸
FLOPs:

池化层

参数量
输出特征图尺寸
FLOPs

ReLU

参数量
输出特征图尺寸
FLOPs

转置卷积

参数量
输出特征图尺寸
FLOPs

统计代码
举例
其他工具：PTFLOPS
其他工具：torchstat
其他工具：torchsummary
参考

计算理论

卷积层：

输入特征图大小为 $pytorch查看网络参数量 pytorch 网络参数量_深度学习$ ，卷积核为 $pytorch查看网络参数量 pytorch 网络参数量_深度学习_02$

参数量（注意包括weight和bias)：

$pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_03$

输出特征图尺寸：

$pytorch查看网络参数量 pytorch 网络参数量_pytorch_04$

至于为什么+1 ，画个图就清楚了：

pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_05

FLOPs

FLOPs（floating point operations per second）
FLOPs：s小写，floating point operations的缩写（s表示复数），指浮点运算数，可以理解为计算量，用来衡量算法/模型的复杂度。
MACs：s小写，multiply–accumulate operations的缩写（s表示负数），有的时候也用MAdd表示，指乘加（a+b×c）运算数，1MACs包含一个乘法操作与一个加法操作，通常MACs是FLOPs的2倍。MACs较FLOPs相比不那么常见。

每一个kernel一次卷积（得到输出feature map的一个点）的计算量： $pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_06$ 次乘法和 $pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_07$ 次加法，即需要 $pytorch查看网络参数量 pytorch 网络参数量_网络_08$ 次运算。如果考虑bias还要加1（输出feature map的这个点加上bias）： $pytorch查看网络参数量 pytorch 网络参数量_深度学习_09$ 。
整个卷积操作的计算量即上述再乘以输出feature map一共多少个点：
$pytorch查看网络参数量 pytorch 网络参数量_pytorch_10$

BN层：

BN层用来解决internal coviriate shift, ( i) 上层网络需要不停调整来适应输入数据分布的变化，导致网络学习速度的降低; ii) 让激活函数的输入分布保持在一个稳定状态来尽可能避免它们陷入梯度饱和区,以免使网络收敛变慢)

pytorch查看网络参数量 pytorch 网络参数量_pytorch_11

一个batch修正一次.

插入BN反向传播推导

BN层的反向传播推导

pytorch查看网络参数量 pytorch 网络参数量_pytorch_12

pytorch查看网络参数量 pytorch 网络参数量_网络_13

pytorch查看网络参数量 pytorch 网络参数量_卷积_14

参数量

需要学习的参数即 $pytorch查看网络参数量 pytorch 网络参数量_卷积_15$ 和 $pytorch查看网络参数量 pytorch 网络参数量_卷积_16$
$pytorch查看网络参数量 pytorch 网络参数量_深度学习_17$

输出特征图尺寸

保持不变。

FLOPs:

$pytorch查看网络参数量 pytorch 网络参数量_卷积_18$

池化层

参数量

池化层没有需要学习的参数，参数量为0

输出特征图尺寸

$pytorch查看网络参数量 pytorch 网络参数量_卷积_19$ , H 和 W的计算与卷积层一致：
$pytorch查看网络参数量 pytorch 网络参数量_pytorch_04$

FLOPs

以average pooling为例，一个kernel的运算里有 $pytorch查看网络参数量 pytorch 网络参数量_深度学习_21$ 次加法，和 $pytorch查看网络参数量 pytorch 网络参数量_卷积_22$ 次除法，共 $pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_23$ 次。总FLOPs：
$pytorch查看网络参数量 pytorch 网络参数量_网络_24$

ReLU

参数量

没有要学习的参数。

输出特征图尺寸

保持不变。

FLOPs

要对每一个点进行判别:
$pytorch查看网络参数量 pytorch 网络参数量_网络_25$

转置卷积

pytorch-ConvTranspose2d

参数量

weight:
$pytorch查看网络参数量 pytorch 网络参数量_网络_26$
bias：
$pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_27$

输出特征图尺寸

即普通卷积层取逆操作，pytorch里面包含参数output_padding ，可以使输入输出feature map一样大。

$pytorch查看网络参数量 pytorch 网络参数量_pytorch_28$

FLOPs

理解deconvolution

pytorch查看网络参数量 pytorch 网络参数量_pytorch_29

统计代码

举例

先举个网络的例子：

import torch.nn as nn



def conv_block(in_dim,out_dim,act_fn):
    model = nn.Sequential(
        nn.Conv2d(in_dim,out_dim, kernel_size=3, stride=1, padding=1),
        nn.BatchNorm2d(out_dim),
        act_fn,
    )
    return model


def conv_trans_block(in_dim,out_dim,act_fn):
    model = nn.Sequential(
        nn.ConvTranspose2d(in_dim,out_dim, kernel_size=3, stride=2, padding=1,output_padding=1),
        nn.BatchNorm2d(out_dim),
        act_fn,
    )
    return model


def maxpool():
    pool = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
    return pool


def conv_block_3(in_dim,out_dim,act_fn):
    model = nn.Sequential(
        conv_block(in_dim,out_dim,act_fn),
        conv_block(out_dim,out_dim,act_fn),
        nn.Conv2d(out_dim,out_dim, kernel_size=3, stride=1, padding=1),
        nn.BatchNorm2d(out_dim),
    )
    return model


class Conv_residual_conv(nn.Module):

    def __init__(self,in_dim,out_dim,act_fn):
        super(Conv_residual_conv,self).__init__()
        self.in_dim = in_dim
        self.out_dim = out_dim
        act_fn = act_fn

        self.conv_1 = conv_block(self.in_dim,self.out_dim,act_fn)
        self.conv_2 = conv_block_3(self.out_dim,self.out_dim,act_fn)
        self.conv_3 = conv_block(self.out_dim,self.out_dim,act_fn)

    def forward(self,input):
        conv_1 = self.conv_1(input)
        conv_2 = self.conv_2(conv_1)
        res = conv_1 + conv_2
        conv_3 = self.conv_3(res)
        return conv_3


class FusionNet(nn.Module):

    def __init__(self, input_nc=6, output_nc=2, ngf=32):
        super(FusionNet,self).__init__()
        self.in_dim = input_nc
        self.out_dim = ngf
        self.final_out_dim = output_nc
        act_fn = nn.LeakyReLU(0.2, inplace=True)
        act_fn_2 = nn.ReLU()

        print("\n------Initiating FusionNet------\n")

        # encoder
        self.down_1 = Conv_residual_conv(self.in_dim, self.out_dim, act_fn)
        self.pool_1 = maxpool()
        self.down_2 = Conv_residual_conv(self.out_dim, self.out_dim * 2, act_fn)
        self.pool_2 = maxpool()
        self.down_3 = Conv_residual_conv(self.out_dim * 2, self.out_dim * 4, act_fn)
        self.pool_3 = maxpool()
        self.down_4 = Conv_residual_conv(self.out_dim * 4, self.out_dim * 8, act_fn)
        self.pool_4 = maxpool()

        # bridge
        self.bridge = Conv_residual_conv(self.out_dim * 8, self.out_dim * 16, act_fn)

        # decoder
        self.deconv_1 = conv_trans_block(self.out_dim * 16, self.out_dim * 8, act_fn_2)
        self.up_1 = Conv_residual_conv(self.out_dim * 8, self.out_dim * 8, act_fn_2)
        self.deconv_2 = conv_trans_block(self.out_dim * 8, self.out_dim * 4, act_fn_2)
        self.up_2 = Conv_residual_conv(self.out_dim * 4, self.out_dim * 4, act_fn_2)
        self.deconv_3 = conv_trans_block(self.out_dim * 4, self.out_dim * 2, act_fn_2)
        self.up_3 = Conv_residual_conv(self.out_dim * 2, self.out_dim * 2, act_fn_2)
        self.deconv_4 = conv_trans_block(self.out_dim * 2, self.out_dim, act_fn_2)
        self.up_4 = Conv_residual_conv(self.out_dim, self.out_dim, act_fn_2)

        # output
        self.out = nn.Conv2d(self.out_dim,self.final_out_dim, kernel_size=3, stride=1, padding=1)
        # self.out_2 = nn.Tanh()
        # self.out_2 = nn.Sigmoid()


        # initialization
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                m.weight.data.normal_(0.0, 0.02)
                m.bias.data.fill_(0)
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.normal_(1.0, 0.02)
                m.bias.data.fill_(0)


    def forward(self,input):
        down_1 = self.down_1(input)
        pool_1 = self.pool_1(down_1)
        down_2 = self.down_2(pool_1)
        pool_2 = self.pool_2(down_2)
        down_3 = self.down_3(pool_2)
        pool_3 = self.pool_3(down_3)
        down_4 = self.down_4(pool_3)
        pool_4 = self.pool_4(down_4)

        bridge = self.bridge(pool_4)

        deconv_1 = self.deconv_1(bridge)
        skip_1 = (deconv_1 + down_4)/2
        up_1 = self.up_1(skip_1)
        deconv_2 = self.deconv_2(up_1)
        skip_2 = (deconv_2 + down_3)/2
        up_2 = self.up_2(skip_2)
        deconv_3 = self.deconv_3(up_2)
        skip_3 = (deconv_3 + down_2)/2
        up_3 = self.up_3(skip_3)
        deconv_4 = self.deconv_4(up_3)
        skip_4 = (deconv_4 + down_1)/2
        up_4 = self.up_4(skip_4)

        out = self.out(up_4)
        # out = self.out_2(out)
        #out = torch.clamp(out, min=-1, max=1)

        return out

统计参数量：

def get_parameter_number(net):
    total_num = sum(p.numel() for p in net.parameters())
    trainable_num = sum(p.numel() for p in net.parameters() if p.requires_grad)
    return {'Total': total_num, 'Trainable': trainable_num}


net=FusionNet(input_nc=1, output_nc=1).cuda()
print(net)

para_num_dict= get_parameter_number(net)
print(para_num_dict['Total'])

计算down_1层的参数量:

pytorch查看网络参数量 pytorch 网络参数量_pytorch_30

参数量为：

$pytorch查看网络参数量 pytorch 网络参数量_pytorch查看网络参数量_31$

其他工具：PTFLOPS

ptflops-github

pytorch查看网络参数量 pytorch 网络参数量_卷积_32

Requirements: Pytorch >= 1.1, torchvision >= 0.3

安装：

pip install ptflops
# 或者 从 https://pypi.org/project/ptflops/#files  下载
pip install ptflops-0.6.9.tar.gz

使用

net = FusionNet(input_nc=6, output_nc=2)
model_name = 'FusionNet'
flops, params = get_model_complexity_info(net, (6, 256, 256), as_strings=True, print_per_layer_stat=True)
print("%s |FLOPs: %s |params: %s" % (model_name, flops, params))

输出：

其他工具：torchstat

torchstat

安装：
pip install torchstat
使用：

from torchstat import stat
import torchvision.models as models

model = models.resnet18()
stat(model, (3, 224, 224))

效果：
不足：不支持转置卷积

其他工具：torchsummary

安装
pip install torchsummary
使用

from torchsummary import summary
unet=UNet(1,1)
summary(unet.cuda(),input_size=(1,256,256),batch_size=-1)

效果

参考

ML/DL-复习笔记【九】- 神经网络中各层的计算量与参数量

https://www.freesion.com/article/6637381582/

CNN网络各种层的FLOPs和参数量paras计算

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：android studio文件读写 android studio读取csv文件

下一篇：taptap 会做ios联运 taptap有ios版游戏吗

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯