目录

0 原理         1 OpenCV中的霍夫变换


0 原理

 霍夫变换在检测各种形状的的技术中非常流行,如果你要检测的形状可以用数学表达式写出,你就可以是使用霍夫变换检测它。及时要检测的形状存在一点破坏或者扭曲也可以使用。我们下面就看看如何使用霍夫变换检测直线。

首先将一条直线用一个点表示,这样用一个点表示直线上所有的点,一开始人们使用斜截式y=kx+q中的(k,q)来表示一条直线。

opencv 查找存在文字的区域 java opencv查找直线_HoughLines

变换后的空间成为霍夫空间。即:笛卡尔坐标系中一条直线,对应霍夫空间的一个点。

反过来同样成立(霍夫空间的一条直线,对应笛卡尔坐标系的一个点):

opencv 查找存在文字的区域 java opencv查找直线_opencv_02

再来看看A、B两个点,对应霍夫空间的情形:

opencv 查找存在文字的区域 java opencv查找直线_HoughLines_03

一步步来,再看一下三个点共线的情况:

opencv 查找存在文字的区域 java opencv查找直线_opencv_04

可以看出如果笛卡尔坐标系的点共线,这些点在霍夫空间对应的直线交于一点:这也是必然,共线只有一种取值可能。

如果不止一条直线呢?再看看多个点的情况(有两条直线):

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_05

其实(3,2)与(4,1)也可以组成直线,只不过它有两个点确定,而图中A、B两点是由三条直线汇成,这也是霍夫变换的后处理的基本方式:选择由尽可能多直线汇成的点。

看看,霍夫空间:选择由三条交汇直线确定的点(中间图),对应的笛卡尔坐标系的直线(右图)。

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_06

 到这里问题似乎解决了,已经完成了霍夫变换的求解,但是如果像下图这种情况呢?

但这样做会有一个弊端,那就是当直线趋近于垂直时,斜率a会趋近于无穷大。这一困难的解决方法之一就是使用法线来表示直线。

opencv 查找存在文字的区域 java opencv查找直线_opencv_07

opencv 查找存在文字的区域 java opencv查找直线_opencv_08

 

在极坐标系下,其实是一样的:极坐标的点→霍夫空间的正弦线,这条正弦线上的所有点都过极坐标中的那个点。

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_09

 

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_10

简单来说就是每个点在霍夫空间的弦线与其他点的弦线交一次,就会在累加器的ρθ平面中累加一次。下面的动画很好的演示了这个过程

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_11

 

1 OpenCV中的霍夫变换

上面介绍的整个过程在OpenCV中都被封装进了一个函数:cv2.HoughLines()。返回值就是极坐标表示的直线(ρ, θ)。ρ 的单位是像素,θ 的单位是弧度。

cv2.HoughLines(image, rho, theta, threshold, lines, sen, stn, min_theta, max_theta)

  • image:输入图像,8-bit灰度图像
  • rho:生成极坐标时候的像素扫描步长
  • theta:生成极坐标时候的角度步长
  • threshold:阈值,只有获得足够交点的极坐标点才被看成是直线
  • lines:返回值,极坐标表示的直线(ρ, θ)
  • sen:是否应用多尺度的霍夫变换,如果不是设置0表示经典霍夫变换
  • stn:是否应用多尺度的霍夫变换,如果不是设置0表示经典霍夫变换
  • min_theta:表示角度扫描范围最小值
  • max_theta:表示角度扫描范围最大值

这种方法仅仅是一条直线都需要两个参数,这需要大量的计算。Probabilistic_Hough_Transform 是对霍夫变换的一种优化。它 不会对每一个点都进行计算,而是从一幅图像中随机选取(是不是也可以使用 图像金字塔呢?)一个点集进行计算,对于直线检测来说这已经足够了。但是 使用这种变换我们必须要降低阈值(总的点数都少了,阈值肯定也要小呀!)。

函数如下:

cv2.HoughLinesP(image, rho, theta, threshold, lines, minLineLength, maxLineGap)

  • src:输入图像,必须8-bit的灰度图像
  • rho:生成极坐标时候的像素扫描步长
  • theta:生成极坐标时候的角度步长
  • threshold:阈值,只有获得足够交点的极坐标点才被看成是直线
  • lines:输出的极坐标来表示直线
  • minLineLength:最小直线长度,比这个短的线都会被忽略。
  • maxLineGap:最大间隔,如果小于此值,这两条直线 就被看成是一条直线。

举个例子:

import cv2
import numpy as np

img = cv2.imread('test19.jpg')
img1 = img.copy()
img2 = img.copy()
img = cv2.GaussianBlur(img, (3, 3), 0)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150, apertureSize=3)
lines = cv2.HoughLines(edges, 1, np.pi/180, 110)

for line in lines:
    rho = line[0][0]
    theta = line[0][1]
    a = np.cos(theta)
    b = np.sin(theta)
    x0 = a*rho
    y0 = b*rho
    x1 = int(x0 + 1000*(-b))
    y1 = int(y0 + 1000*(a))
    x2 = int(x0 - 1000*(-b))
    y2 = int(y0 - 1000*(a))

    cv2.line(img1, (x1, y1), (x2, y2), (0, 0, 255), 2)

lines = cv2.HoughLinesP(edges, 1, np.pi/180, 30, 300, 5)

for line in lines:
    x1 = line[0][0]
    y1 = line[0][1]
    x2 = line[0][2]
    y2 = line[0][3]
    cv2.line(img2, (x1, y1), (x2, y2), (0, 255, 0), 2)

cv2.imshow('houghlines3', img1)
cv2.imshow('edges', img2)
cv2.waitKey(0)
print(lines)

结果如下:

opencv 查找存在文字的区域 java opencv查找直线_滑动条_12

 带有滑动条,用于调节HoughLines的参数

import cv2
import numpy as np
from matplotlib import pyplot as plt
 

def nothing(x):  # 滑动条的回调函数
    pass
 

src = cv2.imread('test19.jpg')
srcBlur = cv2.GaussianBlur(src, (3, 3), 0)
gray = cv2.cvtColor(srcBlur, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150, apertureSize=3)
WindowName = 'Approx'  # 窗口名
cv2.namedWindow(WindowName, cv2.WINDOW_AUTOSIZE)  # 建立空窗口
 
cv2.createTrackbar('threshold', WindowName, 0, 60, nothing)  # 创建滑动条
 
while(1):
    img = src.copy()
    threshold = 100 + 2 * cv2.getTrackbarPos('threshold', WindowName)  # 获取滑动条值

    lines = cv2.HoughLines(edges, 1, np.pi/180, threshold)

    for line in lines:
        rho = line[0][0]
        theta = line[0][1]
        a = np.cos(theta)
        b = np.sin(theta)
        x0 = a*rho
        y0 = b*rho
        x1 = int(x0 + 1000*(-b))
        y1 = int(y0 + 1000*(a))
        x2 = int(x0 - 1000*(-b))
        y2 = int(y0 - 1000*(a))

        cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2)
 
    cv2.imshow(WindowName, img)
    k = cv2.waitKey(1) & 0xFF
    if k == 27:
        break
cv2.destroyAllWindows()

结果如下:

     

opencv 查找存在文字的区域 java opencv查找直线_HoughLines_13

             

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_14

 带有滑动条,用于调节HoughLinesP的参数

import cv2
import numpy as np
from matplotlib import pyplot as plt
 

def nothing(x):  # 滑动条的回调函数
    pass
 

src = cv2.imread('test19.jpg')
srcBlur = cv2.GaussianBlur(src, (3, 3), 0)
gray = cv2.cvtColor(srcBlur, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150, apertureSize=3)
WindowName = 'Approx'  # 窗口名
cv2.namedWindow(WindowName, cv2.WINDOW_AUTOSIZE)  # 建立空窗口
 
cv2.createTrackbar('threshold', WindowName, 0, 100, nothing)  # 创建滑动条
cv2.createTrackbar('minLineLength', WindowName, 0, 100, nothing)  # 创建滑动条
cv2.createTrackbar('maxLineGap', WindowName, 0, 100, nothing)  # 创建滑动条
 
while(1):
    img = src.copy()
    threshold = cv2.getTrackbarPos('threshold', WindowName)  # 获取滑动条值
    minLineLength = 2 * cv2.getTrackbarPos('minLineLength', WindowName)  # 获取滑动条值
    maxLineGap = cv2.getTrackbarPos('maxLineGap', WindowName)  # 获取滑动条值

    lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold, minLineLength, maxLineGap)

    for line in lines:
        x1 = line[0][0]
        y1 = line[0][1]
        x2 = line[0][2]
        y2 = line[0][3]
        cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2)
 
    cv2.imshow(WindowName, img)
    k = cv2.waitKey(1) & 0xFF
    if k == 27:
        break
cv2.destroyAllWindows()

结果如下:

      

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_15

      

opencv 查找存在文字的区域 java opencv查找直线_直线检测_16