Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配

转载

小屁孩 2024-05-14 12:37:01

文章标签 opencv4 图像特征匹配图像特征匹配 opencv4 OpenCV tensorflow 数据集 文章分类 Java 后端开发

开发环境 ·

软件版本信息：

Windows10 64位Tensorflow1.15Tensorflow object detection API 1.xPython3.6.5VS2015 VC++CUDA10.0

硬件：

CPUi7GPU 1050ti

如何安装tensorflow object detection API框架，看这里：

Tensorflow Object Detection API 终于支持tensorflow1.x与tensorflow2.x了

数据集处理与生成

首先需要下载数据集，下载地址为：

https://pan.baidu.com/s/1UbFkGm4EppdAU660Vu7SdQ

总计7581张图像，基于Pascal VOC2012完成标注。分为两个类别，分别是安全帽与人(hat与person)，json格式如下：

item {  id: 1  name: 'hat'}item {  id: 2  name: 'person'}

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_图像特征匹配 opencv4

数据集下载之后，并不能被tensorflow object detection API框架中的脚本转换为tfrecord，主要是有几个XML跟JPEG图像格式错误，本人经过一番磨难之后把它们全部修正了。修正之后的数据运行下面两个脚本即可生成训练集与验证集的tfrecord数据，命令行如下：

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_tensorflow_02

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_OpenCV_03

这里需要注意的是create_pascal_tf_record.py 脚本的165行把

'aeroplane_' + FLAGS.set + '.txt')

修改为：

FLAGS.set + '.txt')

原因是这里的数据集没有做分类train/val。所以需要修改一下，修改完成之后保存。运行上述的命令行，就可以正确生成tfrecord，否则会遇到错误。

模型训练

基于faster_rcnn_inception_v2_coco对象检测模型实现迁移学习，首先需要配置迁移学习的config文件，对应的配置文件可以从:

research\object_detection\samples\configs

中发现，发现文件:

faster_rcnn_inception_v2_coco.config

之后，修改配置文件的中相关部分，关于如何修改，修改什么，可以看这里：

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_tensorflow_04

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_图像特征匹配 opencv4_05

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_图像特征匹配 opencv4_06

修完完成之后，在D盘下新建好几个目录之后，执行下面的命令行参数：

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_数据集_07

就会开始训练，总计训练40000 step。训练过程中可以通过tensorboard查看训练结果：

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_tensorflow_08

模型导出

完成了40000 step训练之后，就可以看到对应的检查点文件，借助tensorflow object detection API框架提供的模型导出脚本，可以把检查点文件导出为冻结图格式的PB文件。相关的命令行参数如下：

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_OpenCV_09

得到pb文件之后，使用OpenCV4.x中的tf_text_graph_faster_rcnn.py脚本，转换生成graph.pbtxt配置文件。最终得到：

- frozen_inference_graph.pb- frozen_inference_graph.pbtxt

如何导出PB模型到OpenCV DNN支持看这里：

干货 | tensorflow模型导出与OpenCV DNN中使用

使用OpenCV DNN调用模型

在OpenCV DNN中直接调用训练出来的模型完成自定义对象检测，这里需要特别说明一下的，因为在训练阶段我们选择了模型支持600~1024保持比率的图像输入。所以在推理预测阶段，我们可以直接使用输入图像的真实大小，模型的输出格式依然是1x1xNx7，按照格式解析即可得到预测框与对应的类别。最终的代码实现如下：

1import cv2 as cv
 2
 3labels = ['hat', 'person']
 4model = "D:/safehat_train/models/train/frozen_inference_graph.pb"
 5config = "D:/safehat_train/models/train/frozen_inference_graph.pbtxt"
 6
 7# 读取测试图像
 8image = cv.imread("D:/123.jpg")
 9h, w = image.shape[:2]
10cv.imshow("input", image)
11
12# 加载模型，执行推理
13net = cv.dnn.readNetFromTensorflow(model, config)
14blob = cv.dnn.blobFromImage(cv.resize(image, (w, h)), swapRB=True, crop=False)
15net.setInput(blob)
16detectOut = net.forward()
17
18# 解析输出
19classIds = []
20confidences = []
21boxes = []
22for detection in detectOut[0,0,:,:]:
23    score = detection[2]
24    if score > 0.4:
25        left = detection[3]*w
26        top = detection[4]*h
27        right = detection[5]*w
28        bottom = detection[6]*h
29        classId = int(detection[1]) + 1
30        classIds.append(classId)
31        boxes.append([int(left), int(top), int(right), int(bottom)])
32        confidences.append(float(score))
33
34# 非最大抑制
35nms_indices = cv.dnn.NMSBoxes(boxes, confidences, 0.4, 0.4)
36for i in range(len(nms_indices)):
37    index = nms_indices[i][0]
38    box = boxes[index]
39    cid = classIds[index]
40    if cid == 1:
41        cv.rectangle(image, (box[0], box[1]), (box[2],

一些测试图像的运行结果如下：

Java OpenCV如何训练特征分类器文件 opencv4特征点检测与匹配_tensorflow_10