如何用python强化图片的文字 python如何训练图片

转载

温柔一刀 2024-03-13 22:11:19

文章标签 如何用python强化图片的文字 python 重命名数据 文章分类 Python 后端开发

1. 准备自己的图片数据

选用部分的Caltech数据库作为训练和测试样本。Caltech是加州理工学院的图像数据库，包含Caltech101和Caltech256两个数据集。该数据集是由Fei-FeiLi, Marco Andreetto, Marc 'Aurelio Ranzato在2003年9月收集而成的。Caltech101包含101种类别的物体，每种类别大约40到800个图像，大部分的类别有大约50个图像。Caltech256包含256种类别的物体，大约30607张图像。图像如下图所示，下载链接为：http://www.vision.caltech.edu/Image_Datasets/Caltech101/

Caltech其中的airplanes、Faces、Motorbikes、watch 4个类别分别包含800、435、798、239张图片，选用这4种图片训练和测试数据。

airplanes：

如何用python强化图片的文字 python如何训练图片_数据

Faces：

如何用python强化图片的文字 python如何训练图片_python_02

Motorbikes：

如何用python强化图片的文字 python如何训练图片_重命名_03

watch：

如何用python强化图片的文字 python如何训练图片_如何用python强化图片的文字_04

2. 图片重命名

为了清楚的分类，收集的图片按照各自的分类重命名一下（该过程也可以省略），airplanes、Faces、Motorbikes和watch类别中的图片分别以0、1、2、和3作为名称的第一个字母（如上图所示，已经做好了重命名），代表自己的分类。python实现的文件批量重命名：

1. import os  
2.   
3. def renameImage(pathFile,label):  
4. 0  
5. for files in os.listdir(pathFile):  
6.         oldDir=os.path.join(pathFile,files)  
7. if os.path.isdir(oldDir):  
8. continue  
9. 0]  
10. 1]  
11. '_'+str(startNum)+filetype)  
12.         os.rename(oldDir,newDir)  
13. 1  
14. print(oldDir+' 重命名为： '+newDir)  
15. renameImage('D:\\0704\\Motorbikes',2)

renameImage函数第一个参数是需要重命名的文件所在文件夹路径，第二个参数是图片分类。

3. 灰度图转换&&图片大小统一

Caltech中的图片是三通道彩色图片，大小不统一，需要修改成单通道灰度图片，统一修改成64*64大小：

1. import cv2  
2. import os  
3. import numpy  
4.   
5. def Resize(pathFile,reSizeFile):  
6. for files in os.listdir(pathFile):  
7.         imagePathFile=os.path.join(pathFile,files)  
8. 0)  
9. 64,64),interpolation=cv2.INTER_CUBIC)  
10.         reSizeDir=os.path.join(reSizeFile,files)  
11.         cv2.imwrite(reSizeDir,imgResize)  
12. print(imagePathFile+' 调整大小成功，存放路径在： '+reSizeFile)             
13. Resize('D:\\0704\\Motorbikes','D:\\0704\\RMotorbikes')

第一个参数是的图片文件

所在路径，第二个参数是保存路径。

4. 生成Label文件

图片准备好之后开始制作label标签文件，格式是 “xx.jpg 0”，python实现：

1. import os  
2. def maketxtList(imageFile,pathFile,label):  
3. 'a')  
4. for files in os.listdir(imageFile):  
5. '\n'+files+' '+str(label))  
6. print(files+' '+str(label)+' 写入成功！')  
7.     fobj.close()  
8. maketxtList('D:\\0704\\Testwatch','D:\\0704\\testLabel.txt',3)

第一个参数是在第3步处理好的图片路径，第二个参数是生成的标签文件，第三个参数是标签，生成的标签如下：

如何用python强化图片的文字 python如何训练图片_python_05

测试数据集分别取airplanes、Faces、Motorbikes、watch各200、200、200、100张图片共700张，按同样的方法生成测试标签。

5. 转化成lmdb数据库文件

新建一个MakeLmdb.bat的脚本文件，使用caffe中的convert_imageset.exe工具转化图片数据为lmdb数据文件：

1. D:\Software\Caffe\caffe-master\Build\x64\Release\convert_imageset.exe   
2. D:\0704\testImage\ D:\0704\testLabel.txt D:\0704\test_lmdb  
3. pause

执行结果：

如何用python强化图片的文字 python如何训练图片_如何用python强化图片的文字_06

分别生成train_lmdb和 test_lmdb文件：

如何用python强化图片的文字 python如何训练图片_重命名_07

6. 计算均值文件mean.binaryproto

计算均值文件备用：

1. D:\Software\Caffe\caffe-master\Build\x64\Release\compute_image_mean.exe   
2. D:\0704\test_lmdb D:\0704\mean_test.binaryproto  
3. pause

7. 建立CNN网络和训练参数

CNN网络和训练参数文件使用caffe中mnist例子中的 “lenet_train_test.prototxt” 和 “lenet_solver.prototxt”两个文件，做一些参数修改：

lenet_solve.prototxt文件参数修改：

如何用python强化图片的文字 python如何训练图片_重命名_08

测试数据量比较少，这里的test_iter参数修改为20，另一个就是基础学习率设置为0.0001，这个参数比较重要，需要根据实际情况调整，如果按照之前学习率设置为0.01的话，会出现训练过程中loss一直保持87.3365（其实已经溢出了）这个值不变的情况。

lenet_train_test.prototxt文件参数修改：

1. 修改训练和测试lmdb数据路径和训练数据每组包含数据（batch_size），这里的batch_size不宜设置过小，建议最少为20：

如何用python强化图片的文字 python如何训练图片_python_09

2. 修改输出层 ip2中的输出由10改为4，这里的4代表训练分为4种分类：

如何用python强化图片的文字 python如何训练图片_如何用python强化图片的文字_10

8. 执行训练

1. D:\Software\Caffe\caffe-master\Build\x64\Release\caffe.exe   
2. train --solver=D:\0704\lenet_solver.prototxt    
3. pause

训练结果，accuracy为0.9928：

如何用python强化图片的文字 python如何训练图片_python_11

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python 打造智能机器人 python开发机器人

下一篇：ubuntu中如何查看自己的系统安装了多少个python版本 ubuntu查看已安装的软件

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯