如何计算神经网络模型的梯度如何计算神经网络参数

转载

attitude 2023-05-26 10:03:53

概述

神经网络模型运算可以看成一个数据流入流出的过程，涉及的计算包含内存占用和浮点运算量两个方面。数据占用的空间计算很容易，数据量乘以表示单个数据所占用的字节数 (e.g, 4, 8)。复杂一点的是 layer 部分的参数占用的空间。

本篇不涉及训练时的梯度保存空间。

data-->layer-->data

FLOPs：floating point operations，即表示浮点运算次数。

FLOPS：floating point operations per second，意指每秒浮点运算次数。

下图是各种显卡的计算能力（TFLOPS，每秒万亿次浮点运算 $10^{12} FLOPs /s$)。参考NVIDIA.

如何计算神经网络模型的梯度如何计算神经网络参数_深度学习

输入data: (x,1);

输出data: (y, 1);

$ params = y \times (x+1) $

"+1": bias.

$ FLOPs = y \times x [乘] + y \times x [加] $

输出feature map大小计算公式：

$ out_w = \frac{(in_w + 2P-f)}{2}+1 $

P 是 padding size，f是卷积核大小， $out_h$同理。

输入data：$in_w, in_h, in_{chs}$;

输出data: $out_w, out_h, out_{chs}$;

$ params = f \times f \times(in_{chs} + 1) $

$ FLOPs = 2 \times (f \times f \times in_{chs})\times(out_w\times out_h \times out_{chs}) $；加和乘各一半。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯