opencv 查找存在文字的区域 java opencv查找直线

转载

mob64ca14031c97 2024-02-27 10:41:35

文章标签 霍夫变换直线检测 opencv HoughLines 滑动条 文章分类 Java 后端开发

0 原理 1 OpenCV中的霍夫变换

0 原理

霍夫变换在检测各种形状的的技术中非常流行，如果你要检测的形状可以用数学表达式写出，你就可以是使用霍夫变换检测它。及时要检测的形状存在一点破坏或者扭曲也可以使用。我们下面就看看如何使用霍夫变换检测直线。

首先将一条直线用一个点表示，这样用一个点表示直线上所有的点，一开始人们使用斜截式y=kx+q中的（k，q）来表示一条直线。

opencv 查找存在文字的区域 java opencv查找直线_HoughLines

变换后的空间成为霍夫空间。即：笛卡尔坐标系中一条直线，对应霍夫空间的一个点。

反过来同样成立（霍夫空间的一条直线，对应笛卡尔坐标系的一个点）：

opencv 查找存在文字的区域 java opencv查找直线_opencv_02

再来看看A、B两个点，对应霍夫空间的情形：

opencv 查找存在文字的区域 java opencv查找直线_HoughLines_03

一步步来，再看一下三个点共线的情况：

opencv 查找存在文字的区域 java opencv查找直线_opencv_04

可以看出如果笛卡尔坐标系的点共线，这些点在霍夫空间对应的直线交于一点：这也是必然，共线只有一种取值可能。

如果不止一条直线呢？再看看多个点的情况（有两条直线）：

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_05

其实（3，2）与（4，1）也可以组成直线，只不过它有两个点确定，而图中A、B两点是由三条直线汇成，这也是霍夫变换的后处理的基本方式：选择由尽可能多直线汇成的点。

看看，霍夫空间：选择由三条交汇直线确定的点（中间图），对应的笛卡尔坐标系的直线（右图）。

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_06

到这里问题似乎解决了，已经完成了霍夫变换的求解，但是如果像下图这种情况呢？

但这样做会有一个弊端，那就是当直线趋近于垂直时，斜率a会趋近于无穷大。这一困难的解决方法之一就是使用法线来表示直线。

opencv 查找存在文字的区域 java opencv查找直线_opencv_07

opencv 查找存在文字的区域 java opencv查找直线_opencv_08

在极坐标系下，其实是一样的：极坐标的点→霍夫空间的正弦线，这条正弦线上的所有点都过极坐标中的那个点。

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_09

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_10

简单来说就是每个点在霍夫空间的弦线与其他点的弦线交一次，就会在累加器的ρθ平面中累加一次。下面的动画很好的演示了这个过程

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_11

1 OpenCV中的霍夫变换

上面介绍的整个过程在OpenCV中都被封装进了一个函数：cv2.HoughLines()。返回值就是极坐标表示的直线（ρ, θ）。ρ 的单位是像素，θ 的单位是弧度。

cv2.HoughLines(image, rho, theta, threshold, lines, sen, stn, min_theta, max_theta)

image：输入图像，8-bit灰度图像
rho：生成极坐标时候的像素扫描步长
theta：生成极坐标时候的角度步长
threshold：阈值，只有获得足够交点的极坐标点才被看成是直线
lines：返回值，极坐标表示的直线（ρ, θ）
sen：是否应用多尺度的霍夫变换，如果不是设置0表示经典霍夫变换
stn：是否应用多尺度的霍夫变换，如果不是设置0表示经典霍夫变换
min_theta：表示角度扫描范围最小值
max_theta：表示角度扫描范围最大值

这种方法仅仅是一条直线都需要两个参数，这需要大量的计算。Probabilistic_Hough_Transform 是对霍夫变换的一种优化。它不会对每一个点都进行计算，而是从一幅图像中随机选取（是不是也可以使用图像金字塔呢？）一个点集进行计算，对于直线检测来说这已经足够了。但是使用这种变换我们必须要降低阈值（总的点数都少了，阈值肯定也要小呀！）。

函数如下：

cv2.HoughLinesP(image, rho, theta, threshold, lines, minLineLength, maxLineGap)

src：输入图像，必须8-bit的灰度图像
rho：生成极坐标时候的像素扫描步长
theta：生成极坐标时候的角度步长
threshold：阈值，只有获得足够交点的极坐标点才被看成是直线
lines：输出的极坐标来表示直线
minLineLength：最小直线长度，比这个短的线都会被忽略。
maxLineGap：最大间隔，如果小于此值，这两条直线就被看成是一条直线。

举个例子：

import cv2
import numpy as np

img = cv2.imread('test19.jpg')
img1 = img.copy()
img2 = img.copy()
img = cv2.GaussianBlur(img, (3, 3), 0)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150, apertureSize=3)
lines = cv2.HoughLines(edges, 1, np.pi/180, 110)

for line in lines:
    rho = line[0][0]
    theta = line[0][1]
    a = np.cos(theta)
    b = np.sin(theta)
    x0 = a*rho
    y0 = b*rho
    x1 = int(x0 + 1000*(-b))
    y1 = int(y0 + 1000*(a))
    x2 = int(x0 - 1000*(-b))
    y2 = int(y0 - 1000*(a))

    cv2.line(img1, (x1, y1), (x2, y2), (0, 0, 255), 2)

lines = cv2.HoughLinesP(edges, 1, np.pi/180, 30, 300, 5)

for line in lines:
    x1 = line[0][0]
    y1 = line[0][1]
    x2 = line[0][2]
    y2 = line[0][3]
    cv2.line(img2, (x1, y1), (x2, y2), (0, 255, 0), 2)

cv2.imshow('houghlines3', img1)
cv2.imshow('edges', img2)
cv2.waitKey(0)
print(lines)

结果如下：

opencv 查找存在文字的区域 java opencv查找直线_滑动条_12

带有滑动条，用于调节HoughLines的参数

import cv2
import numpy as np
from matplotlib import pyplot as plt
 

def nothing(x):  # 滑动条的回调函数
    pass
 

src = cv2.imread('test19.jpg')
srcBlur = cv2.GaussianBlur(src, (3, 3), 0)
gray = cv2.cvtColor(srcBlur, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150, apertureSize=3)
WindowName = 'Approx'  # 窗口名
cv2.namedWindow(WindowName, cv2.WINDOW_AUTOSIZE)  # 建立空窗口
 
cv2.createTrackbar('threshold', WindowName, 0, 60, nothing)  # 创建滑动条
 
while(1):
    img = src.copy()
    threshold = 100 + 2 * cv2.getTrackbarPos('threshold', WindowName)  # 获取滑动条值

    lines = cv2.HoughLines(edges, 1, np.pi/180, threshold)

    for line in lines:
        rho = line[0][0]
        theta = line[0][1]
        a = np.cos(theta)
        b = np.sin(theta)
        x0 = a*rho
        y0 = b*rho
        x1 = int(x0 + 1000*(-b))
        y1 = int(y0 + 1000*(a))
        x2 = int(x0 - 1000*(-b))
        y2 = int(y0 - 1000*(a))

        cv2.line(img, (x1, y1), (x2, y2), (0, 0, 255), 2)
 
    cv2.imshow(WindowName, img)
    k = cv2.waitKey(1) & 0xFF
    if k == 27:
        break
cv2.destroyAllWindows()

结果如下：

opencv 查找存在文字的区域 java opencv查找直线_HoughLines_13

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_14

带有滑动条，用于调节HoughLinesP的参数

import cv2
import numpy as np
from matplotlib import pyplot as plt
 

def nothing(x):  # 滑动条的回调函数
    pass
 

src = cv2.imread('test19.jpg')
srcBlur = cv2.GaussianBlur(src, (3, 3), 0)
gray = cv2.cvtColor(srcBlur, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 50, 150, apertureSize=3)
WindowName = 'Approx'  # 窗口名
cv2.namedWindow(WindowName, cv2.WINDOW_AUTOSIZE)  # 建立空窗口
 
cv2.createTrackbar('threshold', WindowName, 0, 100, nothing)  # 创建滑动条
cv2.createTrackbar('minLineLength', WindowName, 0, 100, nothing)  # 创建滑动条
cv2.createTrackbar('maxLineGap', WindowName, 0, 100, nothing)  # 创建滑动条
 
while(1):
    img = src.copy()
    threshold = cv2.getTrackbarPos('threshold', WindowName)  # 获取滑动条值
    minLineLength = 2 * cv2.getTrackbarPos('minLineLength', WindowName)  # 获取滑动条值
    maxLineGap = cv2.getTrackbarPos('maxLineGap', WindowName)  # 获取滑动条值

    lines = cv2.HoughLinesP(edges, 1, np.pi/180, threshold, minLineLength, maxLineGap)

    for line in lines:
        x1 = line[0][0]
        y1 = line[0][1]
        x2 = line[0][2]
        y2 = line[0][3]
        cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2)
 
    cv2.imshow(WindowName, img)
    k = cv2.waitKey(1) & 0xFF
    if k == 27:
        break
cv2.destroyAllWindows()

结果如下：

opencv 查找存在文字的区域 java opencv查找直线_霍夫变换_15