Python代码实现Canny算法——图像边缘轮廓提取

一、Canny算法主要思路:

1.通过高斯核进行滤波,去除噪声点,使图像平滑

2.通过求取偏导,使用梯度强度和方向来提取边缘轮廓

3.采用非极大值抑制的方法,将提取到的粗犷的边缘轮廓细化

4.采用双阈值来进一步过滤噪声即过滤掉不想要的线条,同时保证轮廓的连续性

1.高斯核滤波

众所周知,正态分布又叫做高斯分布,高斯核滤波其实就是正态分布的一个应用。

高斯分布:(和标准的二维正态分布有点差别)

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_轮廓线


我们假设一个3*3的高斯核:(我用Excel画的)

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_卷积_02


设高斯核中小格子的坐标为(x,y), 高斯核中间的小格子为(0,0),左上角的小格子为(-1,-1),以此类推。

将高斯核中每个小格子的坐标带入到高斯分布公式中,就可以得到每个小格子的值。

高斯核中的所有值得核应该为1,因此需要进行归一化处理,即求出每个小格子占所有小格子总和的权重。

高斯核的应用——卷积

图像是以像素值来表示的。

如图为一个36*36的灰度图像,每个小格子中都有一个像素值,将高斯核覆盖到图像上,如图红色和黑色格子。计算图像和高斯核对应格子的值,并求其总和,即为黑色格子进行高斯卷积之后所对应的像素值。理论上计算时,通常会对高斯核进行上下镜像,之后再进行计算,但实际应用中通常不考虑该镜像操作。

以此类推,可计算整个图像中所有格子进行卷积后的值。再将这些值输出,即可得到进行高斯卷积之后的图像。

高斯卷积会使得图像丢失最外围的像素。因此通常会在卷积之前,在图像的周围填充一些像素,来保证图像卷积后大小不变。

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_python_03

2.偏导和梯度

为什么要求偏导或者梯度?

图像的边缘是由于像素值的突变引起的,因此我们需要通过求偏导或者梯度来获取到突变值发生的位置,提取轮廓。

(公式不好打,上图吧)

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_卷积_04


求偏导或者梯度函数,其本质上还是和高斯卷积是类似的。

常用的几个求偏导和梯度的模板:

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_轮廓线_05

3.非极大值抑制法

由于图像的像素是逐渐进行过渡的,因此我们通过上述过程提取到的边缘会很粗,我们想要得到的图像的边缘应该只有一个像素的粗细。因此我们要提取突变最大的地方作为图像的边缘。

非极大值抑制法,即沿梯度方向,选取梯度强度最大的一个像素块进行保留,将其余像素块舍弃的方法。

比较方法通常为:沿梯度方向,取一像素点,和该像素点前后各一像素的像素点,进行比较,保留最大值。

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_卷积_06


如图,假设该3*3的核的每一个格子均在所提出的轮廓线上。

假设梯度方向是沿x轴方向的,我们需要比较点(-1,0)和点(0,0)两处的梯度强度,若点(0,0)的梯度强度大于(-1,0),则比较(0,0)和(1,0)的梯度强度,若(0,0)小于(1,0),则继续比较(1,0)和(2,0),若(0,0)大于(-1,0)且大于(1,0)则(0,0)最大,可保留,其余的均丢弃,即像素值设为0.

然而实际应用中,梯度方向和边垂直,并不都是水平或者垂直的,因此我们可以选取其所靠近的值,采用不同的权重来计算该点的梯度强度。

如下图。

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_计算机视觉_07

4.双阈值滤波

双阈值滤波是基于如下的假设进行的:

假设,所有噪声所产生的线条与图像的轮廓是不发生连接的。

这样,我们就可以设置两个阈值,一个高阈值,一个低阈值。低阈值用来过滤噪声和突变不明显的线条,高阈值用来保留轮廓线。在低阈值和高阈值之间,且和轮廓线相邻的线条可保留,否则舍弃。

二、代码实现

(代码仅供学习参考使用,尚有不足和待优化之处)

import math
import numpy as np
import matplotlib.pyplot as plt


# 生成高斯核
def gaussian_create():
    sigma1 = sigma2 = 1
    gaussian_sum = 0
    g = np.zeros([3, 3])
    for i in range(3):
        for j in range(3):
            g[i, j] = math.exp(-1 / 2 * (np.square(i - 1) / np.square(sigma1)
                                         + (np.square(j - 1) / np.square(sigma2)))) / (
                              2 * math.pi * sigma1 * sigma2)
            gaussian_sum = gaussian_sum + g[i, j]
    g = g / gaussian_sum  # 归一化
    return g


# 产生灰度图
def gray_fuc(rgb):
    return np.dot(rgb[..., :3], [0.299, 0.587, 0.114])


# 高斯卷积
def gaussian_blur(gray_img, g):
	'''
	gray_img:灰度图
	g:高斯核
	'''
    gray_img = np.pad(gray_img, ((1, 1), (1, 1)), constant_values=0)  # 填充
    h, w = gray_img.shape
    new_gray_img = np.zeros([h - 2, w - 2])
    for i in range(h - 2):
        for j in range(w - 2):
            new_gray_img[i, j] = np.sum(gray_img[i:i + 3, j:j + 3] * g)
    return new_gray_img


# 求高斯偏导
def partial_derivative(new_gray_img):
	'''
	new_gray_img:高斯卷积后的灰度图
	'''
    new_gray_img = np.pad(new_gray_img, ((0, 1), (0, 1)), constant_values=0)  # 填充
    h, w = new_gray_img.shape
    dx_gray = np.zeros([h - 1, w - 1])  # 用来存储x方向偏导
    dy_gray = np.zeros([h - 1, w - 1])  # 用来存储y方向偏导
    df_gray = np.zeros([h - 1, w - 1])  # 用来存储梯度强度
    for i in range(h - 1):
        for j in range(w - 1):
            dx_gray[i, j] = new_gray_img[i, j + 1] - new_gray_img[i, j]
            dy_gray[i, j] = new_gray_img[i + 1, j] - new_gray_img[i, j]
            df_gray[i, j] = np.sqrt(np.square(dx_gray[i, j]) + np.square(dy_gray[i, j]))
    return dx_gray, dy_gray, df_gray


# 非极大值抑制
def non_maximum_suppression(dx_gray, dy_gray, df_gray):
	'''
	dx_gray:x方向梯度矩阵
	dy_gray:y方向梯度矩阵
	df_gray:梯度强度矩阵
	'''
    df_gray = np.pad(df_gray, ((1, 1), (1, 1)), constant_values=0)  # 填充
    h, w = df_gray.shape
    for i in range(1, h - 1):
        for j in range(1, w - 1):
            if df_gray[i, j] != 0:
                gx = math.fabs(dx_gray[i - 1, j - 1])
                gy = math.fabs(dy_gray[i - 1, j - 1])
                if gx > gy:
                    weight = gy / gx
                    grad1 = df_gray[i + 1, j]
                    grad2 = df_gray[i - 1, j]
                    if gx * gy > 0:
                        grad3 = df_gray[i + 1, j + 1]
                        grad4 = df_gray[i - 1, j - 1]
                    else:
                        grad3 = df_gray[i + 1, j - 1]
                        grad4 = df_gray[i - 1, j + 1]
                else:
                    weight = gx / gy
                    grad1 = df_gray[i, j + 1]
                    grad2 = df_gray[i, j - 1]
                    if gx * gy > 0:
                        grad3 = df_gray[i + 1, j + 1]
                        grad4 = df_gray[i - 1, j - 1]
                    else:
                        grad3 = df_gray[i + 1, j - 1]
                        grad4 = df_gray[i - 1, j + 1]
                t1 = weight * grad1 + (1 - weight) * grad3
                t2 = weight * grad2 + (1 - weight) * grad4
                if df_gray[i, j] > t1 and df_gray[i, j] > t2:
                    df_gray[i, j] = df_gray[i, j]
                else:
                    df_gray[i, j] = 0
    return df_gray


# 双阈值过滤
def double_threshold(df_gray, low, high):
	'''
	df_gray:梯度强度矩阵
	low:低阈值
	high:高阈值
	'''
    h, w = df_gray.shape
    for i in range(1, h - 1):
        for j in range(1, w - 1):
            if df_gray[i, j] < low:
                df_gray[i, j] = 0
            elif df_gray[i, j] > high:
                df_gray[i, j] = 1
            elif (df_gray[i, j - 1] > high) or (df_gray[i - 1, j - 1] > high) or (
                    df_gray[i + 1, j - 1] > high) or (df_gray[i - 1, j] > high) or (df_gray[i + 1, j] > high) or (
                    df_gray[i - 1, j + 1] > high) or (df_gray[i, j + 1] > high) or (df_gray[i + 1, j + 1] > high):
                df_gray[i, j] = 1
            else:
                df_gray[i, j] = 0
    return df_gray


if __name__ == '__main__':
    # 读取图像
    img = plt.imread('C:/Users/Administrator/Desktop/zhongqiu.jpg')
    # 生成高斯核
    gaussian = gaussian_create()
    # 生成灰度图
    gray = gray_fuc(img)
    # 高斯卷积
    new_gray = gaussian_blur(gray, gaussian)
    # 求偏导
    d = partial_derivative(new_gray)
    dx = d[0]
    dy = d[1]
    df = d[2]
    # 非极大值抑制
    new_df = non_maximum_suppression(dx, dy, df)
    # 双阈值过滤,并将图像转换成转化二值图
    low_threshold = 0.15 * np.max(new_df)
    high_threshold = 0.2 * np.max(new_df)
    result = double_threshold(new_df, low_threshold, high_threshold)
    # 输出图像
    plt.imshow(result, cmap="gray")
    plt.axis("off")
    plt.show()

运行结果

(不晓得为啥上次上传的图片显示违规。。。换了张图)上图为原图,下图为提取到的轮廓。运行时间大约44s

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_python_08


更换图片,则要根据需要调整双阈值滤波的高低阈值大小,来获得满意的输出。

代码改进

上述代码中采用的双阈值过滤函数,是判断弱边周围是否存在强边,来进而确定该弱边是否是我们所需要的边,是否进行滤除。该方法的缺陷:

强边为H,其上有一点a与弱边相连。该弱边为L,其上有一点b和一点c,b点和a点相连。
如果,在判断弱边是否滤除的时候,先判断b点,后判断c点,得知b点和a点相连,b点设为1值保留,c点和b点相连,因此c点也设为1值保留
如果,先判断c点,后判断b点,那么得出的结论是:c点周围没有1值,丢弃。这将导致我们丢失掉我们想要的点

因此改变双阈值过滤函数的算法思想,判断强边周围是否存在弱边,即通过强边延伸弱边。这样可以使我们提取到的边更加的完整。

# 双阈值过滤
def double_threshold(dx_gray, dy_gray, df_gray, low, high):
	'''
	dx_gray:x方向梯度矩阵
	dy_gray:y方向梯度矩阵
	df_gray:梯度强度矩阵
	low:低阈值
	high:高阈值
	'''
    h, w = df_gray.shape
    for i in range(1, h - 1):
        for j in range(1, w - 1):
            if df_gray[i, j] < low:
                df_gray[i, j] = 0
            elif df_gray[i, j] >= high:
                df_gray[i, j] = 1
                if dy_gray[i-1, j-1] * dx_gray[i-1, j-1] > 0:  # dx,dy同向
                    if df_gray[i - 1, j + 1] > low:
                        df_gray[i - 1, j + 1] = high
                    if df_gray[i + 1, j - 1] > low:
                        df_gray[i + 1, j - 1] = high
                    if dy_gray[i-1, j-1] > dx_gray[i-1, j-1]:
                        if df_gray[i, j + 1] > low:
                            df_gray[i, j + 1] = high
                        if df_gray[i, j - 1] > low:
                            df_gray[i, j - 1] = high
                    else:
                        if df_gray[i - 1, j] > low:
                            df_gray[i - 1, j] = high
                        if df_gray[i + 1, j] > low:
                            df_gray[i + 1, j] = high
                else:
                    if df_gray[i - 1, j - 1] > low:
                        df_gray[i - 1, j - 1] = high
                    if df_gray[i + 1, j + 1] > low:
                        df_gray[i + 1, j + 1] = high
                    if math.fabs(dy_gray[i-1, j-1]) > math.fabs(dx_gray[i-1, j-1]):
                        if df_gray[i, j + 1] > low:
                            df_gray[i, j + 1] = high
                        if df_gray[i, j - 1] > low:
                            df_gray[i, j - 1] = high
                    else:
                        if df_gray[i - 1, j] > low:
                            df_gray[i - 1, j] = high
                        if df_gray[i + 1, j] > low:
                            df_gray[i + 1, j] = high
            else:
                df_gray[i, j] = 0
    return df_gray

优化结果:

优化后,运行时间增加了 ̄□ ̄||,为46s,不过值得一提是,提取的轮廓质量更好了。原先想要的但是没能够输出的边,竟然输出了! 而且花瓣的轮廓提取更加连续了。

如下上图为未优化前提取的轮廓,下图为优化后提取的轮廓。效果还是不错的。

python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_轮廓线_09


python提取图像轮廓线并绘制在黑色图像上 python提取轮廓中心线_正态分布_10

总结:

基本实现了图像轮廓的提取,但是运行时间较长,代码还需要优化。

参考资料:

canny 算子python实现