opencvs 寻找边界 opencv边缘匹配

转载

mob6454cc7a88c0 2024-02-28 11:43:34

文章标签 opencvs 寻找边界搜索图模板匹配边缘检测 文章分类 计算机视觉人工智能

opencvs 寻找边界 opencv边缘匹配_模板匹配

1、介绍

模板匹配是一个当被搜索图像中对象的姿态 $opencvs 寻找边界 opencv边缘匹配_模板匹配_02$

2、背景

模板匹配由于它的速度和可靠性问题，在本质上是一个棘手的问题。当物体是部分可见或者混合其他对象时，解决方法应该对亮度变化具有鲁棒性，更重要的是，算法应该具有计算效率。解决这一问题的方法主要有基于灰度值的匹配（或基于区域匹配）和基于特征的匹配（非基于区域的匹配）。OpenCV中自带的模板匹配，完全是基于像素的模板匹配，很容易受光照的影响。

基于灰度值的方法:

在基于灰度值的匹配中，归一化互相关(Normalized Cross Correlation，NCC)算法由来已久。这通常是通过每一步减去均值然后除以标准差来完成的。模板 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_03$ 与子图像 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_04$ 的互相关为:
$opencvs 寻找边界 opencv边缘匹配_边缘检测_05$
其中， $opencvs 寻找边界 opencv边缘匹配_边缘检测_06$ 是 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_03$ 和 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_04$

虽然这个方法对于现行光照具有较强的鲁棒性，但是当对象部分可见或与其他对象混合时，算法就是失效。此外，该方法需要计算模板图像中所有像素与搜索图像之间的相关性，因此计算成本较高。

基于特征的方法:

基于特征的模板匹配方法在图像处理领域得到了广泛的应用。就像基于边缘的对象识别，其中对象边缘是匹配的特征，在广义霍夫变换中，将使用对象的几何特征进行匹配。

这里实现了一种算法，该算法使用对象的边缘信息来识别搜索图像的对象。这个实现使用OpenCV( the Open-Source Computer Vision library)作为平台。

3、算法

解释一个基于边缘的模板匹配技术。边缘可以定义为数字图像中亮度急剧变化或存在不连续的点。从技术上讲，它是一个离散的微分运算，计算出图像强度函数的梯度近似值。

边缘检测的方法有很多种，但大多可以分为基于搜索和基于零交叉两大类。基于搜索的边缘检测方法首先计算边缘强度，通常是梯度大小等一阶导数表达式，然后通过计算边缘的局部方向估计(通常是梯度方向)来寻找梯度大小的局部方向最大值。这里我们使用的是Sobel实现的边缘检测方法。这种操作是计算每个点的图像强度梯度，给出从亮到暗的最大可能增加的方法和该方法的变化率。

我们用 $opencvs 寻找边界 opencv边缘匹配_搜索图_09$ 方向和 $opencvs 寻找边界 opencv边缘匹配_模板匹配_10$ 方向上的梯度或导数来匹配。

这个算法包括两个步骤。首先，我们需要创建一个基于模板图像模型，然后使用这个模型在搜索图像中进行搜索。

(1)、创建基于边缘的模板模型

我们首先从模板图像的边缘创建一个数据集或模板模型，用于在搜索图像中查找该对象的姿态。这里我们使用了一种变异的Canny边缘检测方法来找到边缘。对于边缘提取，Canny使用以下步骤:

Step 1： 查找图像的强度梯度

对模板图像使用Sobel滤波器，它在 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_11$ 和 $opencvs 寻找边界 opencv边缘匹配_搜索图_12$ 方向上返回梯度。从这个梯度上，我们将使用以下公式返回边缘大小和方向
$opencvs 寻找边界 opencv边缘匹配_边缘检测_13$
$opencvs 寻找边界 opencv边缘匹配_搜索图_14$

我们使用OpenCV函数来查找这些值。

gx = cv2.Sobel(src, cv2.CV_32F, 1, 0, 3)
gy = cv2.Sobel(src, cv2.CV_32F, 0, 1, 3)

for i in range(1, Ssize[1]-1):
    for j in range(1, Ssize[0]-1):
        fdx = gx[i][j]  # 读x, y的导数值
        fdy = gy[i][j]

        MagG = (float(fdx*fdx) + float(fdy * fdy))**(1/2.0)  # Magnitude = Sqrt(gx^2 +gy^2)
        direction = cv2.fastAtan2(float(fdy), float(fdx))  # Direction = invtan (Gy / Gx)
        magMat[i][j] = MagG

        if MagG > MaxGradient:
            MaxGradient = MagG  # 获得最大梯度值进行归一化。

        # 从0,45,90,135得到最近的角
        if (direction > 0 and direction < 22.5) or (direction > 157.5 and direction < 202.5) or (direction > 337.5 and direction < 360):
            direction = 0
        elif (direction > 22.5 and direction < 67.5) or (direction >202.5 and direction <247.5):
            direction = 45
        elif (direction >67.5 and direction < 112.5) or (direction>247.5 and direction<292.5):
            direction = 90
        elif (direction >112.5 and direction < 157.5) or (direction>292.5 and direction<337.5):
            direction = 135
        else:
            direction = 0

        orients.append(int(direction))

一旦找到边缘方向，下一步就是关联图像中可以跟踪的边缘方向。有四个可能的方向来描述周围的像素:0度、45度、90度和135度。我们把所有的方向都分配给这些角。

Step 2： 查找图像的强度梯度

在找到边缘方向后，我们将做一个非最大抑制算法。非最大抑制沿边缘方向跟踪左、右像素，当当前像素大小小于左、右像素大小时则抑制当前像素大小。这将导致一个薄的图像。

for i in range(1, Ssize[1]-1):
    for j in range(1, Ssize[0] - 1):
        if orients[count] == 0:
            leftPixel = magMat[i][j- 1]
            rightPixel = magMat[i][j+1]
        elif orients[count] == 45:
            leftPixel = magMat[i - 1][j + 1]
            rightPixel = magMat[i+1][j - 1]
        elif orients[count] == 90:
            leftPixel = magMat[i - 1][j]
            rightPixel = magMat[i+1][j]
        elif orients[count] == 135:
            leftPixel = magMat[i - 1][j-1]
            rightPixel = magMat[i+1][j+1]

        if (magMat[i][j] < leftPixel) or (magMat[i][j] < rightPixel):
            nmsEdges[i][j] = 0
        else:
            nmsEdges[i][j] = int(magMat[i][j]/MaxGradient*255)
        count = count + 1

Step 3： 做滞后阈值

使用滞后阈值需要两个阈值:高阈值和低阈值。我们应用一个高阈值来标记那些我们可以相当肯定是真品的边缘。从这些开始，使用前面得到的方向信息，可以通过图像跟踪其他边缘。在跟踪边缘时，我们应用较低的阈值，只要找到一个起始点，就可以跟踪边缘的模糊部分。

RSum = 0
CSum = 0
flag = 1
# 做滞后阈值
for i in range(1, Ssize[1]-1):
    for j in range(1, Ssize[0]-1):
        fdx = gx[i][j]
        fdy = gy[i][j]
        MagG = (fdx*fdx + fdy*fdy)**(1/2)   # Magnitude = Sqrt(gx^2 +gy^2)
        DirG = cv2.fastAtan2(float(fdy), float(fdx))  # Direction = tan(y/x)

        flag = 1
        if float(nmsEdges[i][j]) < maxContrast:
            if float(nmsEdges[i][j]) < minContrast:
                nmsEdges[i][j] = 0
                flag = 0
            else: # 如果8个相邻像素中的任何一个不大于maxContrast，则从边缘删除
                if float(nmsEdges[i-1][j-1]) < maxContrast and \
                    float(nmsEdges[i-1][j]) < maxContrast and \
                    float(nmsEdges[i-1][j+1]) < maxContrast and \
                    float(nmsEdges[i][j-1]) < maxContrast and \
                    float(nmsEdges[i][j+1]) < maxContrast and \
                    float(nmsEdges[i+1][j-1]) < maxContrast and \
                    float(nmsEdges[i+1][j]) < maxContrast and \
                    float(nmsEdges[i+1][j+1]) < maxContrast:
                    nmsEdges[i][j] = 0
                    flag = 0

Step 4： 保存数据集

提取出边后，将所选边的X、Y导数以及坐标信息保存为模板模型。这些坐标将被重新排列，以反映作为重心的起始点。

(2)、找到基于边缘的模板模型

算法的下一个任务是使用模板模型在搜索图像中找到目标。我们可以看到我们从包含一组点 $opencvs 寻找边界 opencv边缘匹配_搜索图_15$ 的模板映像创建的模型和它的在X和Y方向上的梯度 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_16$ , 其中 $opencvs 寻找边界 opencv边缘匹配_边缘检测_17$ 是模板(T)数据集中元素的数量。

我们还可以在搜索图像（S）中找到梯度 $opencvs 寻找边界 opencv边缘匹配_搜索图_18$ , 其中 $opencvs 寻找边界 opencv边缘匹配_搜索图_19$ (搜索图像的高)， $opencvs 寻找边界 opencv边缘匹配_边缘检测_20$ (搜索图像的宽)。

在匹配过程中，模板模型应使用相似性度量与搜索图像在所有位置进行比较。相似度度量的思想是取模板图像梯度向量的所有归一化点积的和，并在模型数据集中的所有点上搜索图像。这将在搜索图像的每个点上得到一个分数。其公式如下:
$opencvs 寻找边界 opencv边缘匹配_边缘检测_21$

如果模板模型和搜索图像完全匹配，这个函数将返回1。该分数对应于搜索图像中可见对象的部分。如果该对象不在搜索图像中，则得分为0。

Sdx = cv2.Sobel(src, cv2.CV_32F, 1, 0, 3)  # 找到X导数
Sdy = cv2.Sobel(src, cv2.CV_32F, 0, 1, 3)  # 找到Y导数

for i in range(0, height):
    for j in range(0, wight):
        partialSum = 0  # 初始化partialSum
        for m in range(0, Nof):
            curX = i + self.cordinates[m][0]  # 模板X坐标
            curY = j + self.cordinates[m][1]  # 模板Y坐标
            iTx = self.edgeDerivativeX[m]  # 模板X的导数
            iTy = self.edgeDerivativeY[m]  # 模板Y的导数

            if curX < 0 or curY < 0 or curX > Ssize[1] - 1 or curY > Ssize[0] - 1:
                continue

            iSx = Sdx[curX][curY]  # 从源图像得到相应的X导数
            iSy = Sdy[curX][curY]  # 从源图像得到相应的Y导数

            if (iSx != 0 or iSy != 0) and (iTx != 0 or iTy != 0):
                # //partial Sum  = Sum of(((Source X derivative* Template X drivative) + Source Y derivative * Template Y derivative)) / Edge magnitude of(Template)* edge magnitude of(Source))
                partialSum = partialSum + ((iSx*iTx)+(iSy*iTy))*(self.edgeMagnitude[m] * matGradMag[curX][curY])

在实际情况下，我们需要加快搜索过程。这可以通过各种方法来实现。第一种方法是利用平均的性质。在寻找相似度度量时，如果我们可以为相似度度量设置一个最小值 $opencvs 寻找边界 opencv边缘匹配_模板匹配_22$ ，那么我们就不需要对模板模型中的所有点进行评估。为了检验在特定点 $opencvs 寻找边界 opencv边缘匹配_边缘检测_23$ 处的部分分数 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_24$ ，我们需要找到部分和 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_25$ 。点 $opencvs 寻找边界 opencv边缘匹配_模板匹配_26$ 处的 $opencvs 寻找边界 opencv边缘匹配_opencvs 寻找边界_25$ 可定义为:

$opencvs 寻找边界 opencv边缘匹配_搜索图_28$

显然，和的其余项都小于或等于1。因此如果 $opencvs 寻找边界 opencv边缘匹配_模板匹配_29$ ，我们可以停止评估。

另一个标准是，任何点的部分分数都应该大于最小值，即 $opencvs 寻找边界 opencv边缘匹配_模板匹配_30$ ,当使用此条件时，匹配将非常快。但问题是，如果首先检查对象的缺失部分，那么部分和就会很低。在这种情况下，对象的实例将不被视为匹配。我们可以用另一个标准来修改它，我们用一个安全的停止标准来检查模板模型的第一部分，用一个硬标准来检查剩下的部分 $opencvs 寻找边界 opencv边缘匹配_模板匹配_31$ 。用户可以指定一个贪婪参数 $opencvs 寻找边界 opencv边缘匹配_边缘检测_32$ ，其中使用硬标准检查模板模型的分数。因此，如果g=1，则用硬标准检查模板模型中的所有点，如果g=0，所有的点都将只使用安全标准进行检查。我们可以把这个过程写成如下形式。

部分分数的评定可停在:
$opencvs 寻找边界 opencv边缘匹配_搜索图_33$

normMinScore = minScore/ self.noOfCordinates  # 预计算minScore
normGreediness = ((1- greediness*minScore)/(1-greediness)) / self.noOfCordinates  # 预计算greediness

sumOfCoords = m+1
partialScore = partialSum/sumOfCoords
# 检查终止条件
# 如果部分得分小于该位置所需的得分
# 在那个坐标中断serching。
if partialScore < min((minScore - 1) + normGreediness*sumOfCoords, normMinScore*sumOfCoords):
    break

这种相似性度量有以下几个优点：由于所有梯度向量都是归一化的，所以相似性测度对非线性光照变化是不变的。由于没有对边缘滤波进行分割，因此在光照变化时，边缘滤波能显示出真实的不变性。更重要的是，当对象部分可见或与其他对象混合时，这种相似性度量是可靠的。