深度学习21天实战实战caffe学习笔记《5 ： Mnist手写体识别案例》

原创

女王de专属领地 2023-06-25 07:40:35 ©著作权

文章标签 迭代数据集手写体 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者女王de专属领地的原创作品，请联系作者获取转载授权，否则将追究法律责任

Mnist手写体识别案例

源码详解

MNIST

MNIST是一个大型手写体数字识别数据库，广泛应用与机器学习领域的训练和测试。包括60000个训练集和10000个测试集，每张图都已经进行尺寸归一化、数据居中处理，固定大小为28×28像素。

深度学习21天实战实战caffe学习笔记《5 ： Mnist手写体识别案例》_手写体

数据集

使用Caffe源码目录中data/mnist下用get_mnist.sh脚本下载。

$ cd data/mnist/
$ ./get_mnist.sh

mnist数据格式描述：

data/mnist 目录下多出四个文件

文件名	说明
train-images-idx3-ubyte	训练集，图片
train-labels-idx1-ubyte	训练集，标签
t10k-images-idx3-ubyte	测试集，图片
t10k-labels-idx1-ubyte	测试集，标签

深度学习21天实战实战caffe学习笔记《5 ： Mnist手写体识别案例》_迭代_02

测试图像和训练图像的格式无二；

转换格式

图片文件中像素按照行组织，白色（像素值0）是背景，黑色（像素值255）是前景；

下载到的数据集为二进制文件，需要转换为LMDB或LEVELDB才能被Caffe识别。

$ ./examples/mnist/create_mnist.sh
Creating lmdb...
Done.

在examples/mnist目录下生成了mnist_train_lmdb/ 和mnist_test_lmdb/ 两个目录，每个目录下都有两个文件：data.mdb和lock.mdb。 mnist_train_lmdb是LMDB格式的训练集，mnist_test_lmdb是LMDB格式的测试集。

tips：

caffe采用LMDB和LEVELDB的原因1：提供统一的数据类型格式；原因2：提高磁盘IO利用率；

网络模型

复习：Lenet的网络结构（proto配置）examples/mnist/lenet_solver.prototxt

训练网络

tips：一定要阅读打印的log；

GLOG输出格式：日期时间进程号源码文件：代码行号]输出信息；

便于追踪远啊运行流程，分析运行效率；

CPU模式：examples/mnist/lenet_solver.prototxt最后一行修改如下

# solver mode: CPU or GPU
solver_mode: CPU

运行examples/mnist/train_lenet.sh脚本

$ ./examples/mnist/train_lenet.sh

训练的最终结果保存在examples/mnist/lenet_iter_10000.caffemodel中。

测试

使用MNIST测试集对训练好的模型进行测试

$ ./build/tools/caffe.bin test \
-model examples/mnist/lenet_train_test.prototxt \
-weights examples/mnist/lenet_iter_10000.caffemodel \
-iterations 100

命令行参数：

./build/tools/caffe.bin test 表示只做预测(前向传播)，不做参数更新；
-model examples/mnist/lenet_train_test.prototxt 指定模型描述文件
-weights examples/mnist/lenet_iter_10000.caffemodel 指定训练好的权值文件
iterations 100 指定测试迭代次数，参与测试的数目=iterations*batch_size,每次迭代的数据量在模型描述文件中设定batch_size: 100，迭代100次刚好覆盖测试集的10000个样本。

补充：

./build/tools/caffe.bin

深度学习21天实战实战caffe学习笔记《5 ： Mnist手写体识别案例》_数据集_03