深度学习21天实战caffe学习笔记《9：Caffe 模型》

关注女王de专属领地

文章目录

一个深度学习模型的参数包括三部分：
1、prototxt表示
2、内存中的表示
3、磁盘上的表示
4、Caffe Model Zoo

深度学习21天实战caffe学习笔记《9：Caffe 模型》

原创

女王de专属领地 2023-06-25 08:49:51 ©著作权

文章标签 二级描述文件卷积核 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者女王de专属领地的原创作品，请联系作者获取转载授权，否则将追究法律责任

一个深度学习模型的参数包括三部分：

可学习参数：

又称可训练参数、神经网络权系数、权重，其数值由模型初始化参数、误差方向传播过程控制，一般不可人工干预。
在内存中用Blob对象保持，必要时以二级制ProtoBuffer文件（*.caffemodel）形态序列化并存储于磁盘上，便于进一步微调（finetune，又称精调）、共享（例如参数服务器Parameter Server，PS）、性能评估（benchmark）

结构参数：

包括卷积层/全连接层/下采样层数目、卷积核数目、卷积核大小等描述网络结构的参数，一旦设定好，在网络训练阶段不能更改：训练阶段网络结构参数和预测阶段参数很可能不同。
使用ProtoBuffer文件格式（*.prototxt）描述，网络初始化时通过该描述文件构建Net对象、Layer对象形成有向无环图结构，在Layer与Layer之间、Net输入源和输出源均为持有数据和中间结果的Blob对象

训练超参数：

用来控制网络训练收敛的参数，训练阶段可以自动或手动调节以获得更好的效果，预测阶段不需要该参数。
使用ProtoBuffer文本格式（*.prototxt）描述，训练阶段利用该描述文件构建求解器（Solver）对象，该对象按照一定规则在训练网络时自动调节这些超参数值。

1、prototxt表示

修改：examples/mnist/lenet_train_test.prototxt

修改：examples/mnist/lenet_lr_solver.prototxt

2、内存中的表示

solver.hpp中声明了SolverParameterparam，它是ProtoBuffer工具生成的结构体，用来解析lenet_lr_solver.prototxt

3、磁盘上的表示

Caffe使用ProtoBuffer二级制文件有最小文件尺寸，并由ProtoBuffer工具自动生成高效的序列化/反序列化接口（多语言支持，包括C++、Java、Python），以及可读性好、兼容二进制文件的文本格式文件。
.caffemodel文件是在特定训练间隙保存的文件，包含当前网络各层的权值状态；
.solverstate是与.caffemodel一起产生的二级制文件，包含从上次停止点恢复训练模型所需的信息。

4、Caffe Model Zoo

由于规模更大、结构更加复杂的模型训练需要过硬的硬件计算能力和过硬的调参能力，所以可以使用前人已经训练好的模型。

赞
收藏
评论
分享
举报

上一篇：深度学习21天实战caffe学习笔记《8：Caffe I/O模块》

下一篇：深度学习21天实战caffe学习笔记《7 ：Caffe数据结构》

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册