OpenCV自学笔记27. Hough变换：检测直线和圆

原创

mb6304a73bed12a 2022-08-23 20:18:32 博主文章分类：OpenCV ©著作权

文章标签 hough变换参数空间像素点 文章分类 OpenStack 云计算

©著作权归作者所有：来自51CTO博客作者mb6304a73bed12a的原创作品，请联系作者获取转载授权，否则将追究法律责任

Hough变换：检测直线和圆

前言：Hough变换是一种在图像中寻找直线和圆的方法。我在实际的项目中，使用到了Hough变换检测圆，效果不错，所以写一篇文章，学习Hough变换的原理，并阅读Hough变换的源码，看看OpenCV是如何实现Hough变换的。Hough变换比较难理解，尤其是圆变换的部分，另外我写的也未必清楚，所以记录下来仅做学习、参考之用。

本文的结构如下：

1、Hough变换如何检测出直线
2、Hough变换如何检测出圆
3、Hough变换 OpenCV源码分析
4、实战：Python Hough变换的小例子

1、Hough变换如何检测出直线

我们要解决的问题

在进一步理解Hough变换之前，首先要明确，我们要解决的问题是什么。假设在一个平面上，或者说在一张图片内，存在很多很多的像素点，一些像素点构成了明显的直线，这样的直线可能有多条，我们要做的就是找到这些直线，并将这些直线画出来。比如下图中，房子的屋檐、门窗就包含特征明显的直线，Hough变换算法就是要检测出这些直线。首先来看看Hough变换的数学基础。

OpenCV自学笔记27. Hough变换：检测直线和圆_像素点

Hough变换的数学原理：

Hough变换检测直线的核心是直角坐标系到极坐标系的转换。在平面中，我们往往使用直角坐标系表示一条直线，比如直线：y = kx + b，就是在直角坐标系下给出的。

同样的一条直线，在极坐标系下也能被表示，如下图所示，直线a 也可以被(ρ,θ)表示出来。

OpenCV自学笔记27. Hough变换：检测直线和圆_hough变换_02

当(ρ,θ)是一个确定的值时，直线是确定的，也就是说，当(ρ,θ)是一个确定的值时，比如(10, 30)，它所表示出的直线在平面内是唯一的。同样，当直线确定时，(ρ,θ)也是个确定值。

对于直线a上的点P1和P2，通过P1的直线有多条：【a、b、c、d】；通过P2的直线也有多条：【a、e、f】。我们把这些直线统统用(ρ,θ)来表示，看看能发现什么规律。

OpenCV自学笔记27. Hough变换：检测直线和圆_hough变换_03

我们发现，存在一组相等的(ρ,θ)值：（10，30°）。由该值所确定的直线a，正是P1、P2所共线的直线a。如果两个点共线，那么一定它们会有相同的(ρ,θ)值。反过来讲，如果一个(ρ,θ)值被多个点拥有（或者说出现的次数多），那么这些点一定是共线的，并且这条直线一定是由这个(ρ,θ)值唯一确定的。

理解了上面的内容，就好办了。对于平面内的多个点，我们把通过它们的直线都求出来，然后计算出所有直线的(ρ,θ)，如果发现有一个(ρ,θ)出现的次数很多，那么由这个(ρ,θ)确定的直线，一定被多个点共线。通过统计(ρ,θ)出现的次数，就能找到平面内的直线。

如果在直角坐标系内找直线，我们需要做大量的计算，比如计算斜率，求直线方程等等。但是通过极坐标系，我们仅需要统计(ρ,θ)的数量，就能确定出直线了。因此可以说，Hough变换将大量的计算，转化为了计数问题，这正是它的巧妙之处。

2、Hough变换如何检测出圆

我们要解决的问题

与检测直线类似，在平面内，存在了大量的点。其中，一些点可能共圆，我们要尽可能多的找出这些圆。比如在下面的图像中，我们找到了一个大圆。

OpenCV自学笔记27. Hough变换：检测直线和圆_像素点_04

Hough圆变换的数学原理：

在平面直角坐标系中，圆的公式是：(x－a)²+(y－b)²=r²，有三个参数a、b、r，圆心坐标为（a，b），半径为r。

假设有一点N (xn, yn)，我们知道通过N的圆有无穷多个，比如下图中，我画出了4个通过N的圆。对于所有通过点N的圆来讲，势必满足公式：(xn－a)²+(yn－b)²=r²成立。其中，因为N是已知的，所以xn，yn是定值。而那些通过N的圆，有无穷多种，圆心、半径都是不一定的，所以a，b，r都是变量。

OpenCV自学笔记27. Hough变换：检测直线和圆_hough变换_05

既然，a、b、r都是变量，我们可以用一个坐标系表示出a、b、r来，姑且叫它参数空间吧。那么，通过N点的所有圆，在这个参数空间中如何表示出来呢？首先来看：

当r = 0时，根据公式(xn－a)²+(yn－b)²=r² ，能够计算出 a = xn，b = yn，此时（a、b、r）就是参数空间中的一个点。
当r = 1时，我们又能计算出一组(a、b)值，这些(a、b)值均满足公式(xn－a)²+(yn－b)²=r²，在参数空间中刚好构成一个圆。
同理，当r等于2、3、4、… ∞时，我们都能求出一组(a、b)值。把r从1到∞得到的所有的（a、b），在参数空间出画出来，就是一个圆锥面。

OpenCV自学笔记27. Hough变换：检测直线和圆_参数空间_06

这只是仅有一个点N的情况，在参数空间中构成了一个圆锥面。

假设现在又有多了一个点M（xm，ym），在参数空间中又构成了另一个圆锥面。如果这两个圆锥面之间有一个交点P(ap, bp，rp)。说明点M、N共圆(ap、bp、rp)。论证如下：

P(ap,bp,rp)在N构成的圆锥面上，则有(xn－ap)²+(yn－bp)²=rp²;
P(ap,bp,rp)在M构成的圆锥面上，则有(xm－ap)²+(ym－bp)²=rp²;
根据上面两个公式可知，存在一个圆，它的圆心是(ap，bp)，半径是rp，圆上刚好有两个点N、M，满足该圆的方程：(x－ap)²+(y－bp)²=rp²。N（xn，yn）、M（xm，ym）刚好是这个方程的两个解。

当有多个点时，在参数空间中就会有多个圆锥面。多个圆锥面之间会有多个交点，只要我们找到那些交点，就能找到多个点之间的共圆。

对比检测直线和检测圆，我们发现hough变换的实质是坐标系的转换，将计算问题转化为计数问题，这是它最巧妙，也是最有趣的地方。

。。两者对比。。

hough变换检测直线	hough变换检测圆
直角坐标映射到极坐标	直角坐标映射到参数空间
统计(ρ,θ)出现的次数	统计(a，b，r)出现的次数
相同的(ρ,θ)说明两个点共线	相同的(a，b，r)说明两个点共圆
找到出现次数最多的(ρ,θ)，说明这条直线上的点最多	找到出现次数最多的(a，b，r), 说明这个圆上的点最多

3、Hough变换 OpenCV源码分析

了解了Hough变换的原理，现在来看看OpenCV是如何实现这么复杂的算法的。

OpenCV2.4.9中，Hough变换的代码实现有1000多行，在这里不能一句一句分析。就把一些比较重要的函数拿出来读读。阅读大佬们的代码，也是一个我自提高的过程。

在OpenCV中，Hough变换的源码在opencv_imgproc/Src/hough.cpp中。在源码中，主要有三个函数：

void cv::HoughLines( … ); // 标准Hough变换检测直线，调用icvHoughLinesStandard( … )函数
void cv::HoughLinesP( … ); // Hough变换的优化版，通过分析点的子集，并估计这些点属于一条直线概率。
void cv::HoughCircles( … ); // Hough变换检测圆

其中，有关HoughLinesP( … )的内容，本文没有涉及，所以在此不作分析。我们只看标准Hough变换检测直线，和检测圆的函数。

1、icvHoughLinesStandard( … )函数的核心部分

// stage 1. fill accumulator，计算(ρ,θ),这里面用(r,θ)来表示。
for( i = 0; i < height; i++ ) 
{
    for( j = 0; j < width; j++ )
    {
        if( image[i * step + j] != 0 )
            for(int n = 0; n < numangle; n++ )
            {
                // 根据公式：ρ = xcosθ + ysinθ
                // cvRound()函数：四舍五入
                int r = cvRound( j * tabCos[n] + i * tabSin[n] ); 
                r += (numrho - 1) / 2; // numrho是ρ的最大值，或者说最大取值范围
                accum[(n+1) * (numrho+2) + r+1]++;  // 计数器累加，把(ρ,θ)二维空间用一维数组存储
            }
    }
}


// stage 2. find local maximums，找极大值
for(int r = 0; r < numrho; r++ ) // 遍历(ρ,θ)空间
{
    for(int n = 0; n < numangle; n++ )
    {
        int base = (n+1) * (numrho+2) + r + 1; // 得到计数值，并以它为基准，看看它是不是局部极大值
        if( accum[base] > threshold &&
            accum[base] > accum[base - 1] && 
            accum[base] >= accum[base + 1] &&
            accum[base] > accum[base - numrho - 2] && 
            accum[base] >= accum[base + numrho + 2]) // 看看是不是上、下、左、右邻域内的极大值
            sort_buf[total++] = base;
    }

}


// stage 3. sort the detected lines by accumulator value
icvHoughSortDescent32s( sort_buf, total, accum ); // 排序

// stage 4. store the first min(total,linesMax) lines to the output buffer，输出直线
linesMax = MIN(linesMax, total); // linesMax是输入参数，表示最多输出几条直线
scale = 1./(numrho+2);
for( i = 0; i < linesMax; i++ )
{
    CvLinePolar line;  // CvLinePolar 直线的数据结构
    int idx = sort_buf[i]; // 找到索引（下标）
    int n = cvFloor(idx*scale) - 1; // 向下取整
    int r = idx - (n+1)*(numrho+2) - 1;
    line.rho = (r - (numrho - 1)*0.5f) * rho;
    line.angle = n * theta;
    cvSeqPush( lines, &line ); // 用序列存放多条直线

2、icvHoughCirclesGradient( … )函数的核心部分

// Accumulate circle evidence for each edge pixel
    // 为每个边缘像素（因为是边缘图，所以边缘像素就是非零点）累加值
    for( y = 0; y < rows; y++ )
    {
        const uchar* edges_row = edges->data.ptr + y*edges->step;
        const short* dx_row = (const short*)(dx->data.ptr + y*dx->step); // dx是对图像在x方向进行sobel求导的结果矩阵
        const short* dy_row = (const short*)(dy->data.ptr + y*dy->step); // dy是对图像在y方向进行sobel求导的结果矩阵

        for( x = 0; x < cols; x++ )
        {
            float vx, vy;
            int sx, sy, x0, y0, x1, y1, r;
            CvPoint pt;

            vx = dx_row[x]; // x方向的梯度导数
            vy = dy_row[x]; // y方向的梯度导数

            // 如果不是边缘像素，或者x方向 y方向的导数为0
            if( !edges_row[x] || (vx == 0 && vy == 0) ) 
                continue;

            float mag = sqrt(vx*vx+vy*vy); // 使用公式计算：G = sqrt（dx*dx + dy * dy）梯度导数
            assert( mag >= 1 ); // 断言
            sx = cvRound((vx*idp)*ONE/mag);  // x方向的位移量
            sy = cvRound((vy*idp)*ONE/mag);  // y方向的位移量

            x0 = cvRound((x*idp)*ONE); // dp分辨率，idp分辨率的倒数，ONE = 1 << 10
            y0 = cvRound((y*idp)*ONE); // 把像素点的位置，转换到累加器的坐标系中
            // Step from min_radius to max_radius in both directions of the gradient
            // 对x方向和y方向，分别从最小的半径一步一步位移到最大半径，计算累加值 
            for(int k1 = 0; k1 < 2; k1++ )
            {
                x1 = x0 + min_radius * sx;
                y1 = y0 + min_radius * sy;

                for( r = min_radius; r <= max_radius; x1 += sx, y1 += sy, r++ )
                {
                    int x2 = x1 >> SHIFT, y2 = y1 >> SHIFT;
                    // 如果位移后的点，超过累加器的范围，则跳过
                    if( (unsigned)x2 >= (unsigned)acols ||
                        (unsigned)y2 >= (unsigned)arows ) // aclos、arows表示累加器的列、行
                        break;
                    adata[y2*astep + x2]++; // 累加器累加
                }
                sx = -sx; sy = -sy;
            }
            pt.x = x; pt.y = y;
            cvSeqPush( nz, &pt ); // 存到圆周序列中
        }
    }

    nz_count = nz->total;
    if( !nz_count ) // 如果没有检测到圆，退出
        return;
    //Find possible circle centers，找到可能存在的圆心
    for( y = 1; y < arows - 1; y++ )
    {
        for( x = 1; x < acols - 1; x++ )
        {
            int base = y*(acols+2) + x;// 得到计数值，并以它为基准，看看它是不是局部极大值
            if( adata[base] > acc_threshold &&
                adata[base] > adata[base-1] && 
                adata[base] > adata[base+1] &&
                adata[base] > adata[base-acols-2] && 
                adata[base] > adata[base+acols+2] ) // 判断是不是上下左右的局部极大值
                cvSeqPush(centers, &base); // 存入圆心序列中
        }
    }

    center_count = centers->total;
    if( !center_count )  // 如果没有检测到圆，退出
        return;

    sort_buf.resize( MAX(center_count,nz_count) ); // 重定义sort_buf的大小，sort_buf是一个vector
    cvCvtSeqToArray( centers, &sort_buf[0] ); // 把圆心存入sort_buf中


    // 从大到小排序 : adata[sort_buf[0]] -> adata[sort_buf[center_count-1]]
    icvHoughSortDescent32s( &sort_buf[0], center_count, adata ); 

    // 清空原来的圆心序列，然后把排序后的圆心，存入到圆心序列中
    cvClearSeq( centers );
    cvSeqPushMulti( centers, &sort_buf[0], center_count );

    dist_buf = cvCreateMat( 1, nz_count, CV_32FC1 ); // 创建距离矩阵
    ddata = dist_buf->data.fl;

    dr = dp; // 半径的分辨率，相当于是一个阈值
    min_dist = MAX( min_dist, dp ); // 定义圆心间的最小距离
    min_dist *= min_dist;
    // For each found possible center 
    // Estimate radius and check support 对每一个可能的圆，估计半径
    for( i = 0; i < centers->total; i++ )
    {
        int ofs = *(int*)cvGetSeqElem( centers, i ); // 累加器中圆心的偏移量
        y = ofs/(acols+2); // 累加器中圆心的y
        x = ofs - (y)*(acols+2); // 累加器中圆心的x
        //Calculate circle's center in pixels，计算圆心在图像中的坐标
        float cx = (float)((x + 0.5f)*dp), cy = (float)(( y + 0.5f )*dp);
        float start_dist, dist_sum;
        float r_best = 0;
        int max_count = 0;
        // Check distance with previously detected circles
        // 检测当前圆心和其他圆心的距离，如果离得很近，说明两个圆心太接近了，很可能同属于一个圆
        for( j = 0; j < circles->total; j++ )
        {
            float* c = (float*)cvGetSeqElem( circles, j );
            if( (c[0] - cx)*(c[0] - cx) + (c[1] - cy)*(c[1] - cy) < min_dist )
                break;
        }

        // 如果j < circles->total，说明上一个for循环执行break了，也就是说两个圆心太近了
        if( j < circles->total ) 
            continue;

        // Estimate best radius 对当前的圆心，估计它的最佳半径
        cvStartReadSeq( nz, &reader ); // 读取圆周序列
        for( j = k = 0; j < nz_count; j++ )
        {
            CvPoint pt;
            float _dx, _dy, _r2;
            CV_READ_SEQ_ELEM( pt, reader ); // 读取序列
            _dx = cx - pt.x; _dy = cy - pt.y; // 圆周上的点的坐标
            _r2 = _dx*_dx + _dy*_dy; // 计算半径（的平方）
            if(min_radius2 <= _r2 && _r2 <= max_radius2 ) // 如果半径在最小最大值之间
            {
                ddata[k] = _r2;
                sort_buf[k] = k; // 存到sort_buf中
                k++; // k用于累计圆周上点的个数
            }
        }

        int nz_count1 = k, start_idx = nz_count1 - 1;
        if( nz_count1 == 0 ) // 相当于k等于0
            continue;
        dist_buf->cols = nz_count1; // 圆周上点的数量
        cvPow( dist_buf, dist_buf, 0.5 ); // 求平方根
        icvHoughSortDescent32s( &sort_buf[0], nz_count1, (int*)ddata ); // 对半径排序

        dist_sum = start_dist = ddata[sort_buf[nz_count1-1]]; 
        for( j = nz_count1 - 2; j >= 0; j-- )
        {
            float d = ddata[sort_buf[j]]; // 当前的半径（从小半径开始计算）

            if( d > max_radius ) // 大于最大值，跳出
                break;

            if( d - start_dist > dr ) // 如果两次半径之差大于半径阈值（分辨率），说明不是同一个圆
            {
                float r_cur = ddata[sort_buf[(j + start_idx)/2]]; // 当前半径
                if( (start_idx - j)*r_best >= max_count*r_cur ||
                    (r_best < FLT_EPSILON && start_idx - j >= max_count) )
                {
                    r_best = r_cur; // 最佳半径设置为当前半径
                    max_count = start_idx - j; // 最大值
                }
                start_dist = d;
                start_idx = j;
                dist_sum = 0;
            }
            dist_sum += d;
        }
        // Check if the circle has enough support
        if( max_count > acc_threshold )
        {
            float c[3];
            c[0] = cx;
            c[1] = cy;
            c[2] = (float)r_best;
            cvSeqPush( circles, c );
            if( circles->total > circles_max )
                return;
        }
    }