1.原理简介
对于每一个像素(x,y)在它的blockSizeblockSize邻域内,计算22梯度的协方差矩阵M(x,y),计算dst(x,y)=detM(x,y)-k*(trM(x,y))2找到局部最大值即角点,这是Harris角点的原始定义。对于goodFeaturesToTrack中的Shi-Tomasi角点,则比较两个特征值中的较小者与最小阈值的关系,大于的话就是强角点。
2.代码解析
void cv::goodFeaturesToTrack( InputArray _image, OutputArray _corners,
int maxCorners, double qualityLevel, double minDistance,
InputArray _mask, int blockSize,
bool useHarrisDetector, double harrisK )
/****************参数*********************
_image:8位或32位浮点型单通道输入图像
_corners:保存检测出的角点的输出向量
maxCorners:角点数目最大值,如果实际检测的角点超过此值,则只返回前maxCorners个强角点
qualityLevel:角点检测可以接受的最小特征值。实际采用的是该值与图像中最大特征值的乘积。它通常不超过1,常用0.01或0.10
minDistance:角点之间的最小距离,不低于minDistance个像素
_mask:可选参数。指定感兴趣区域,默认noArray().参数必须是CV_8UC1类型,而且和第一个参数image有相同的尺寸
blockSize:计算协方差矩阵时的窗口大小,默认值是3
useHarrisDetector:指示是否使用Harris角点检测,如不指定,则计算shi-tomasi角点,默认是false
harrisK:用于设置Hessian自相关矩阵行列式的相对权重的权重系数,默认值是0.04,Harris角点检测需要的k值
*/
{
CV_INSTRUMENT_REGION()
//规范参数符合特定要求
CV_Assert( qualityLevel > 0 && minDistance >= 0 && maxCorners >= 0 );
CV_Assert( _mask.empty() || (_mask.type() == CV_8UC1 && _mask.sameSize(_image)) );
CV_OCL_RUN(_image.dims() <= 2 && _image.isUMat(),
ocl_goodFeaturesToTrack(_image, _corners, maxCorners, qualityLevel, minDistance,
_mask, blockSize, useHarrisDetector, harrisK))
Mat image = _image.getMat(), eig, tmp;//eig存储每个像素协方差矩阵的最小特征值,tmp用来保存经膨胀后的eig
if (image.empty())
{
_corners.release();
return;
}
// Disabled due to bad accuracy
CV_OVX_RUN(false && useHarrisDetector && _mask.empty() &&
!ovx::skipSmallImages<VX_KERNEL_HARRIS_CORNERS>(image.cols, image.rows),
openvx_harris(image, _corners, maxCorners, qualityLevel, minDistance, blockSize, harrisK))
//Harrir角点检测判断
if( useHarrisDetector )
cornerHarris( image, eig, blockSize, 3, harrisK );//对于每一个像素(x,y)计算blockSize*blockSize邻域内的2*2梯度的协方差矩阵M(x,y),
//计算dst(x,y)=detM^(x,y)^-k*(trM^(x,y)^)^2^是计算2*2协方差矩阵的窗口大小,sobel算子孔径大小为3,harrisK是计算Harris角点时需要的值
else
cornerMinEigenVal( image, eig, blockSize, 3 );
double maxVal = 0;
minMaxLoc( eig, 0, &maxVal, 0, 0, _mask );//maxVal保存了eig的最大值
threshold( eig, eig, maxVal*qualityLevel, 0, THRESH_TOZERO );//阈值设置为maxVal乘以qualityLevel,
//大于此阈值的保持不变,小于此阈值的都设为0
//默认用3*3的核膨胀,膨胀之后,除了局部最大值点和原来相同,其它非局部最大值点被
//3*3邻域内的最大值点取代,如不理解,可看一下灰度图像的膨胀原理
dilate( eig, tmp, Mat());//tmp中保存了膨胀之后的eig
Size imgsize = image.size();
std::vector<const float*> tmpCorners;//存放粗选出的角点地址
// collect list of pointers to features - put them into temporary image
Mat mask = _mask.getMat();
for( int y = 1; y < imgsize.height - 1; y++ )
{
const float* eig_data = (const float*)eig.ptr(y); //获得eig第y行的首地址
const float* tmp_data = (const float*)tmp.ptr(y);
const uchar* mask_data = mask.data ? mask.ptr(y) : 0;
for( int x = 1; x < imgsize.width - 1; x++ )
{
float val = eig_data[x];
if( val != 0 && val == tmp_data[x] && (!mask_data || mask_data[x]) )//val == tmp_data[x]说明这是局部极大值
tmpCorners.push_back(eig_data + x);//保存其位置
}
}
//-----------此分割线以上是根据特征值粗选出的角点,我们称之为弱角点----------//
//-----------此分割线以下还要根据minDistance进一步筛选角点,仍然能存活下来的我们称之为强角点----------//
std::vector<Point2f> corners;
size_t i, j, total = tmpCorners.size(), ncorners = 0;
if (total == 0)
{
_corners.release();
return;
}
std::sort( tmpCorners.begin(), tmpCorners.end(), greaterThanPtr() );//按特征值降序排列,注意这一步很重要,
//后面的很多编程思路都是建立在这个降序排列的基础上
vector<Point2f> corners;
if (minDistance >= 1)
{
// Partition the image into larger grids
int w = image.cols;
int h = image.rows;
const int cell_size = cvRound(minDistance);//向最近的整数取整
//这里根据cell_size构建了一个矩形窗口grid(虽然下面的grid定义的是vector<vector>,
//而并不是我们这里说的矩形窗口,但为了便于理解,还是将grid想象成一个grid_width * grid_height的矩形窗口比较好),
//除以cell_size说明grid窗口里相差一个像素相当于_image里相差minDistance个像素,至于为什么加上cell_size - 1后面会讲
const int grid_width = (w + cell_size - 1) / cell_size;
const int grid_height = (h + cell_size - 1) / cell_size;
std::vector<std::vector<Point2f> > grid(grid_width*grid_height);); //vector里面是vector,grid用来保存获得的强角点坐标
minDistance *= minDistance; //平方,方面后面计算,省的开根号
for( i = 0; i < total; i++ )// 刚刚粗选的弱角点,都要到这里来接收新一轮的考验
{
int ofs = (int)((const uchar*)tmpCorners[i] - eig.ptr());//tmpCorners中保存了角点的地址,eig.data返回eig内存块的首地址
int y = (int)(ofs / eig.step);//角点在原图像中的行
int x = (int)((ofs - y*eig.step)/sizeof(float));//在原图像中的列
bool good = true;//先认为当前角点能接收考验,即能被保留下来
int x_cell = x / cell_size;//x_cell,y_cell是角点(y,x)在grid中的对应坐标
int y_cell = y / cell_size;
int x1 = x_cell - 1;// (y_cell,x_cell)的4邻域像素
int y1 = y_cell - 1;//前面加上cell_size - 1,这是为了使得(y,x)在grid中的4邻域像素都存在,
//也就是说(y_cell,x_cell)不会成为边界像素
int x2 = x_cell + 1;
int y2 = y_cell + 1;
// boundary check,再次确认x1,y1,x2或y2不会超出grid边界
x1 = std::max(0, x1);//比较0和x1的大小
y1 = std::max(0, y1);
x2 = std::min(grid_width-1, x2);
y2 = std::min(grid_height-1, y2);
//记住grid中相差一个像素,相当于_image中相差了minDistance个像素
for( int yy = y1; yy <= y2; yy++ )// 行
{
for( int xx = x1; xx <= x2; xx++ )//列
{
std::vector <Point2f> &m = grid[yy*grid_width + xx];//引用
if( m.size() ) //如果(y_cell,x_cell)的4邻域像素,也就是(y,x)的minDistance邻域像素中已有被保留的强角点
{
for(j = 0; j < m.size(); j++)//当前角点周围的强角点都拉出来跟当前角点比一比
{
float dx = x - m[j].x;
float dy = y - m[j].y;
//注意如果(y,x)的minDistance邻域像素中已有被保留的强角点,则说明该强角点是在(y,x)之前就被测试过的,
//又因为tmpCorners中已按照特征值降序排列(特征值越大说明角点越好),这说明先测试的一定是更好的角点,
//也就是已保存的强角点一定好于当前角点,所以这里只要比较距离,如果距离满足条件,可以立马扔掉当前测试的角点
if( dx*dx + dy*dy < minDistance )
{
good = false;
goto break_out;
}
}
}
}
}
break_out:
if (good)
{
grid[y_cell*grid_width + x_cell].push_back(Point2f((float)x, (float)y));
corners.push_back(Point2f((float)x, (float)y));
++ncorners;
if( maxCorners > 0 && (int)ncorners == maxCorners )//由于前面已按降序排列,
//当ncorners超过maxCorners的时候跳出循环直接忽略tmpCorners中剩下的角点,反正剩下的角点越来越弱
break;
}
}
}
else//除了像素本身,没有哪个邻域像素能与当前像素满足minDistance < 1,因此直接保存粗选的角点
{
for( i = 0; i < total; i++ )
{
int ofs = (int)((const uchar*)tmpCorners[i] - eig.ptr());
int y = (int)(ofs / eig.step);//粗选的角点在原图像中的行
int x = (int)((ofs - y*eig.step)/sizeof(float));//粗选的角点在原图像中的列
corners.push_back(Point2f((float)x, (float)y));
++ncorners;
if( maxCorners > 0 && (int)ncorners == maxCorners )
break;
}
}
Mat(corners).convertTo(_corners, _corners.fixedType() ? _corners.type() : CV_32F);
}
参考书籍:《OpenCV3编程入门》 毛星云,等