pytorch每个batch都分层

转载

mob64ca1417736e 2024-09-07 19:10:09

文章标签 pytorch每个batch都分层网络层存储管理迭代 文章分类 PyTorch 人工智能

模型模块包括两部分：模型创建与权值初始化；模型创建又包括构建网络层（卷积层、池化层、激活函数层等）和拼接网络层（LeNet、AlexNet、ResNet等）；权值初始化有Xavier、Kaiming、均匀分布、正态分布等。

LeNet网络结构

pytorch每个batch都分层_pytorch每个batch都分层

运算示意图

pytorch每个batch都分层_存储管理_02

nn.module

torch.nn.Parameter：张量子类，表示可学习参数，如weight、bias
torch.nn.Module：所有网络层基类，管理网络属性
torch.nn.functional：函数具体实现，如卷积、池化、激活函数等
torch.nn.init：参数初始化方法
parameters：存储管理nn.Parameter类
modules：存储管理nn.Module类
buffers：存储管理缓冲属性，如BN层中的running_mean
***_hooks：存储管理钩子函数

self._parameters = OrderedDict()
self._buffers = OrderedDict()
self._backward_hooks = OrderedDict()
self._forward_hooks = OrderedDict()
self._forward_pre_hooks = OrderedDict()
self._state_dict_hooks = OrderedDict()
self._load_state_dict_pre_hooks = OrderedDict()
self._modules = OrderedDict()

nn.module总结：

一个module可以包含多个子module
一个module相当于一个运算，必须实现forward()函数
每个module都有8个字典管理它的属性

模型容器与AlexNet构建

Containers

nn.Sequential：按顺序包装多个网络层
nn.ModuleList：像python的list一样包装多个网络层
nn.ModuleDict：像python的dict一样包装多个网络层

nn.Sequential是nn.module的容器，用于按顺序包装一组网络层

Sequential的特性：

顺序性：各网络层之间严格按照顺序构建
自带forward()：自带的forward里，通过for循环依次执行前向传播运算

nn.ModuleList是nn.module的容器，用于包装一组网络层，以迭代方式调用网络层的主要方法：

append()：在ModuleList后面添加网络层
extend()：拼接两个ModuleList
insert()：指定在ModuleList中位置插入网络层

nn.ModuleDict是nn.module的容器，用于包装一组网络层，以索引方式调用网络层主要方法：

clear()：清空ModuleDict
items()：返回可迭代的键值对（key-value pairs）
keys()：返回字典的键（key）
values()：返回字典的值（value）
pop()：返回一对键值，并从字典中删除

nn.Sequential：顺序性，各网络层之间严格按照顺序执行，常用于block构建

nn.ModuleList：迭代性，常用于大量重复网构建，通过for循环实现重复构建

nn.ModuleDict：索引性，常用于可选择的网络层

AlexNet

AlexNet：2012年以高出第二名10多个百分点的准确率获得ImageNet分类任务冠军，开创了卷积神经网络的新时代

AlexNet特点如下：

采用ReLU：替代饱和激活函数，减轻梯度消失
采用LRN(Local Response Normalization)：对数据归一化，减轻梯度消失
Dropout：提高全连接的鲁棒性，增加网络的泛化能力
Data Augmentation：TenCrop，色彩修改

参考文献：ImageNet Classification with Deep Convolutional Neural Networks

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：如何在实验室服务器上配置pytorch

下一篇：可以通过ssms查schema

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

pytorch每个batch都分层

pytorch每个batch都分层

51CTO博客