【Opencv综合应用】自制训练集的人脸识别3——用csv文件生成xml文件
- 说明
- 一,环境准备
- 二,主要步骤
- 三,全部代码
- 四,结果
说明
本文参考自 由于参考博客中的Opencv版本很老了,并且其中有漏写的地方,我的版本为Opencv4.1.0,导致运行代码后有多处报错,我对其中错误进行修改后汇总如下:
原代码中模型训练部分createEngenFaceRecognize(); createFisherFaceRecognizer(); createLBPHFaceRecognizer();
需要更改为EigenFaceRecognize::create(); FisherFaceRecognizer::create(); LBPHFaceRecognizer::create();
model2对应的训练缺少了,需要在模型训练部分增加
Ptr<FaceRecognizer> model2 = LBPHFaceRecognizer::create();
model2->train(images, labels);
model2->save("MyFaceLBPHModel.xml");
包含头文件#include< face/face.hpp >
命名空间using namespace cv::face;
一,环境准备
我的环境为win10+opencv4.1.0+VS2017。因为人脸模型训练模块在opencv-contrib模块中,而官方的OpenCV安装包中是不带opencv-contrib的,所以需自行下载opencv-contrib-4.1.0模块,然后将opencv4.1.0和opencv-contrib-4.1.0一起进行重新编译。需要注意opencv-contrib的版本必须要和opencv的版本相一致,不然程序无法运行。
二,主要步骤
创建一个自己的新VS项目,由于上一篇中我们写进att.txt的地址是相对地址,故需要将上一篇中已经生成的att.txt文件放到新建项目文件夹中可执行文件目录下(就是与文件后缀带cpp的同一目录),然后把ORL人脸库的att文件夹也放到同一目录下(这里很重要,因为写入的是相对地址,不连着文件夹一起移动是读不到图片的,当然要是一开始写入att.txt中的是绝对地址那就不用移动ORL人脸库文件了)
1.创建了一个特征脸模型用于人脸识别
2.通过CSV文件att.txt读取的图像和标签训练它
3.创建一个PCA人脸分类器,T这里是一个完整的PCA变换
4.调用其中的成员函数train()来完成分类器的训练
通过CSV文件att.txt去读图像和标签,主要使用stringstream和getline方法
/*****************
函数:static void read_csv(const string& filename,vector<Mat>images, vector<int> labels,int CountMax,int CountMin, char separator=';')
功能:读取csv文件的图像路径和标签。主要使用stringstream和getline()
参数说明:
filename--要读取的csv文件
images----读取的图片(向量)
labels----读取的图片对应标签 (向量)
CountMax,int CountMin--读取的每一类别的图片下标的最大值和最小值(默认每个类别共10张照片)
separator-分隔符,起控制读取的作用。可自定义为逗号空格等,(此程序中)默认为分号
返回值:空
*****************/
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';')
{
std::ifstream file(filename.c_str(), ifstream::in);//c_str()函数可用可不用,无需返回一个标准C类型的字符串
if (!file)
{
string error_message = "No valid input file was given, please check the given filename.";
//CV_Error(CV_StsBadArg, error_message);这里注释掉是由于会报错
}
string line, path, classlabel;
while (getline(file, line)) //从文本文件中读取一行字符,未指定限定符默认限定符为“/n”
{
stringstream liness(line);
getline(liness, path, separator); //这里采用stringstream主要作用是做字符串的分割
getline(liness, classlabel); //读入图片文件路径以分好作为限定符
if (!path.empty() && !classlabel.empty())
{
images.push_back(imread(path, 0));
labels.push_back(atoi(classlabel.c_str()));//如果读取成功,则将图片和对应标签压入对应容器中
}
}
}
我们在代码里面用到了Facerecognizer类,opencv中所有的人脸识别模型都是来源于这个类。以下是opencv-contrib库中带着的三个人脸识别算法:EigenFace,FisherFace ,LBPHFace,这里我们不深究它们的原理,直接调用就行了
Ptr<FaceRecognizer> model0 = EigenFaceRecognizer::create();
model0->train(images, labels);
model0->save("MyEigenFaces.xml");//将训练模型保存到MyEigenFaces.xml
Ptr<FaceRecognizer> model1 = FisherFaceRecognizer::create();
model1->train(images, labels);
model1->save("MyFaceModel.xml");//将训练模型保存到MyFacePcaModel.xml
Ptr<FaceRecognizer> model2 = LBPHFaceRecognizer::create();
model2->train(images, labels);
model2->save("MyFaceLBPHModel.xml");//将训练模型保存到MyFaceLBPHModel.xml
下面这部分是从人脸数据集中取出最后一张图片,对模型的准确度进行测试
//下面的几行代码仅仅是从你的数据集中移除最后一张图片,作为测试图片
//自然这里需要根据自己的需要修改,这里简化了很多问题
Mat testSample = images[images.size() - 1];
int testLabel = labels[labels.size() - 1];
images.pop_back(); //删除最后一张照片,此照片作为测试图片
labels.pop_back(); //删除最有一张照片的labels
...
...中间省略一些代码
...
//对csv文件中的位于最后的一张图片进行预测,Predicted class是预测的图片组号,
//Actual class是该图片真实的组号,两个值相同说明人脸模型预测成功
int predictedLabel0 = model0->predict(testSample);
int predictedLabel1 = model1->predict(testSample);
int predictedLabel2 = model2->predict(testSample);
string result_message0 = format("Predicted class = %d / Actual class = %d.", predictedLabel0, testLabel);
string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);
string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);
cout << result_message0 << endl;
cout << result_message1 << endl;
cout << result_message2 << endl;
三,全部代码
#include <opencv2/opencv.hpp>
#include <opencv2/core/core.hpp>
#include "opencv2/face/facerec.hpp"
#include "opencv2/face.hpp"
#include "opencv2/core.hpp"
#include "opencv2/highgui.hpp"
#include "opencv2/imgproc.hpp"
#include <iostream>
#include <fstream>
#include <sstream>
#include <math.h>
using namespace cv;
using namespace cv::face;
using namespace std;
static Mat norm_0_255(InputArray _src)
{
Mat src = _src.getMat();
// 创建和返回一个归一化后的图像矩阵:
Mat dst;
switch (src.channels())
{
case 1:
cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC1);
break;
case 3:
cv::normalize(_src, dst, 0, 255, NORM_MINMAX, CV_8UC3);
break;
default:
src.copyTo(dst);
break;
}
return dst;
}
/*******************************************
使用CSV文件去读图像和标签,主要使用stringstream和getline方法
函数:static void read_csv(const string& filename,vector<Mat>images, vector<int> labels,int CountMax,int CountMin, char separator=';')
功能:读取csv文件的图像路径和标签。主要使用stringstream和getline()
参数说明:
filename--要读取的csv文件
images----读取的图片(向量)
labels----读取的图片对应标签 (向量)
CountMax,int CountMin--读取的每一类别的图片下标的最大值和最小值(默认每个类别共10张照片)
separator-分隔符,起控制读取的作用。可自定义为逗号空格等,(此程序中)默认为分号
返回值:空
*******************************************/
static void read_csv(const string& filename, vector<Mat>& images, vector<int>& labels, char separator = ';')
{
std::ifstream file(filename.c_str(), ifstream::in);//c_str()函数可用可不用,无需返回一个标准C类型的字符串
if (!file)
{
string error_message = "No valid input file was given, please check the given filename.";
//CV_Error(CV_StsBadArg, error_message);注释掉是因为会报错
}
string line, path, classlabel;
while (getline(file, line)) //从文本文件中读取一行字符,未指定限定符默认限定符为“/n”
{
stringstream liness(line);
getline(liness, path, separator); //这里采用stringstream主要作用是做字符串的分割
getline(liness, classlabel); //读入图片文件路径以分好作为限定符
if (!path.empty() && !classlabel.empty())
{
images.push_back(imread(path, 0));
labels.push_back(atoi(classlabel.c_str()));//如果读取成功,则将图片和对应标签压入对应容器中
}
}
}
int main()
{
//读取你的CSV文件路径.
string fn_csv = "att.txt";
// 2个容器来存放图像数据和对应的标签
vector<Mat> images;
vector<int> labels;
// 读取数据. 如果文件不合法就会出错
try
{
read_csv(fn_csv, images, labels);
}
catch (cv::Exception& e)
{
cerr << "Error opening file \"" << fn_csv << "\".Reason: " << e.msg << endl;
exit(1);
}
// 如果没有读取到足够图片,也退出.
if (images.size() <= 1)
{
string error_message = " Please add more images to your data set!";
//CV_Error(CV_StsError, error_message);注释掉是因为会报错
}
for (int i = 0; i < images.size(); i++)
{
if (images[i].size() != Size(92, 112))
{
cout << i << endl;
cout << images[i].size() << endl;
}
}
//下面的几行代码仅仅是从你的数据集中移除最后一张图片,作为测试图片
//自然这里需要根据自己的需要修改,这里简化了很多问题
Mat testSample = images[images.size() - 1];
int testLabel = labels[labels.size() - 1];
images.pop_back(); //删除最后一张照片,此照片作为测试图片
labels.pop_back(); //删除最有一张照片的labels
/*****模型训练*******
创建了一个特征脸模型用于人脸识别,
通过CSV文件读取的图像和标签训练它。
T这里是一个完整的PCA变换
创建一个PCA人脸分类器,
调用其中的成员函数train()来完成分类器的训练
*******************/
Ptr<FaceRecognizer> model0 = EigenFaceRecognizer::create();
model0->train(images, labels);
model0->save("MyEigenFaces.xml");//将训练模型保存到MyEigenFaces.xml
Ptr<FaceRecognizer> model1 = FisherFaceRecognizer::create();
model1->train(images, labels);
model1->save("MyFaceModel.xml");//将训练模型保存到MyFacePcaModel.xml
Ptr<FaceRecognizer> model2 = LBPHFaceRecognizer::create();
model2->train(images, labels);
model2->save("MyFaceLBPHModel.xml");//将训练模型保存到MyFaceLBPHModel.xml
// 还有一种调用方式,可以获取结果同时得到阈值:
// int predictedLabel = -1;
// double confidence = 0.0;
// model->predict(testSample, predictedLabel, confidence);
//对csv文件中的位于最后的一张图片进行预测,Predicted class是预测的图片组号,
//Actual class是该图片真实的组号,两个值相同说明人脸模型预测成功
int predictedLabel0 = model0->predict(testSample);
int predictedLabel1 = model1->predict(testSample);
int predictedLabel2 = model2->predict(testSample);
string result_message0 = format("Predicted class = %d / Actual class = %d.", predictedLabel0, testLabel);
string result_message1 = format("Predicted class = %d / Actual class = %d.", predictedLabel1, testLabel);
string result_message2 = format("Predicted class = %d / Actual class = %d.", predictedLabel2, testLabel);
cout << result_message0 << endl;
cout << result_message1 << endl;
cout << result_message2 << endl;
waitKey(0);
return 0;
}
四,结果
由于人脸数据比较多,计算量比较大,计算机需要跑一段时间才会出结果,千万不要以为是程序卡死了,我是跑了1分多钟才出结果的。
这里的Predicted class就是上面说的最后一个图片的预测组别,Actual class就是该图片的真实组别,当预测的组别等于真实组别就说明这个人脸预测模型正确了。至于为什么是9,我们把之前写入了csv形式的att.txt文件打开,看到文件最后的路径是att/s9/9.pgm;9,这说明了取的最后一张图片是第9组的图片,这就对了。
接下来看看我们的可执行文件目录下生成了什么吧
可以看到已经生成三个xml训练集文件了,分别就是模型训练部分的三段代码生成的。我们再用记事本打开其中一个看看生成好的数据长什么样
之后的人脸识别用其中任意一个训练集就都可以在众多的人中识别出自己了,只不过越大的训练集电脑运行起来速度就越慢,所以我下一篇就选最小的MyFaceModel.xml来识别了。