文章目录

  • 文献名:
  • 主要创新思想
  • 主要原理剖析及说明
  • 主要实验结果(现有原文章中的)


文献名:

Fu R , Xu H , Wang Z , et al. Enhanced Intelligent Identification of Concrete Cracks Using Multi-Layered Image Preprocessing-Aided Convolutional Neural Networks[J]. Sensors, 2020, 20(7):2021.

主要创新思想

在不同的智能算法中,卷积神经网络(CNN)已被证明是一种有前途的工具,能够通过自适应地从大量混凝土表面图像中识别裂缝特征来有效地识别混凝土裂缝的存在和发展。然而,由于混凝土表面图像的背景中所包含的噪声的影响,常规CNN在裂纹识别中的准确性以及通用性受到很大限制。噪声源自高度多样化的来源,例如光斑,模糊,表面粗糙度/磨损/污点。为了提高基于CNN的裂纹识别方法的准确性,抗噪性和多功能性,基于常规CNN与多层图像预处理策略(MLP)的混合利用。
基于CNN的混合利用和多层图像预处理(MLP)策略(定义为MLP–CNN框架),从混凝土表面图像中进行裂缝识别,其主要成分是同态滤波和Otsu阈值化方法。MLP–CNN框架除了可以显着提高检测准确性和抗噪性外,还能够增强裂纹识别的多功能性,这意味着可以使用统一的框架来处理不同类型和水平的背景噪声。具体而言,基于由许多混凝土裂缝图像组成的数据集,裂缝位置检测(CPD)和裂缝类型识别(CTI)网络均已构建,训练和测试。通过比较使用和不使用MLP策略的裂缝检测结果,检查了开发框架的有效性和效率。研究了不同来源和噪声影响水平下的裂纹识别精度。

主要原理剖析及说明

第一层是MLP中的关键组件之一,是同态滤波,用于处理频域中的混凝土表面图像。对于图像处理,同态滤波能够抑制低频分量(例如与照明变化相关的分量),同时突出显示与局部细节(例如裂纹边缘)相关的高频分量。考虑到频域滤波会导致输出图像中的灰度振荡,这被称为振铃效果,同态滤波中滤波器类型的选择直接影响降噪效果。通常用于同态滤波的三个高通滤波器是高斯滤波器,巴特沃思滤波器和理想的高通滤波器。如可在可见图中 B,高斯滤波产生最佳去噪效果,通过显示具有最小振铃效应的显著裂纹特征,裂纹特征大部分被淹没在背景中。由巴特沃思滤波器处理过的,被可能与振铃效应有关的高频噪声严重污染了;经过理想的高通滤波器处理后,在裂缝和背景的颜色中对比度太弱。这些不令人满意的结果归因于滤波器的特性,例如滤波器功能中梯度的急剧变化。因此,采用高斯滤波器进行同态滤波。

RNN 图片预处理 cnn图像预处理_计算机视觉


该结构主要由三层组成,即输入层,特征提取层和最终层,其中可以考虑实际情况重复特征提取层中的子层(即L2,L3,L4和L5)需要。对于特定的裂缝检测目标,构建了两种具有类似结构的网络类型,分别定义为裂缝位置检测(CPD)和裂缝类型识别(CTI)网络。

特征提取层由多个卷积层(CONV)和池化层组成。CONV具有卷积内核与输入图像的像素矩阵之间的稀疏连接的特性,从而可以利用相对较少的网络参数来实现有效的网络训练。此外,由于CONV的权重共享,可以减少用于计算的内存使用量。L2中卷积核的初始权重和偏差是随机生成的。激活函数(L3)被用来将非线性特性引入网络。非线性函数示例如所示。可以看出,在0到1之间的S型函数显示出小的梯度,这会导致收敛速度慢,并且在CNN训练过程中梯度消失的问题。介于-1和1之间的双曲正切(tanh)显示出比S形曲线更大的梯度,因此更易于优化。简单的数学形式的整流线性单位(ReLU)具有最大的梯度,可以提高CNN的训练效率和准确性。因此,在以下研究中,ReLU被选为激活功能,位于L3所示的CONV之后。

RNN 图片预处理 cnn图像预处理_RNN 图片预处理_02


最后一层通常包含多个完全连接的层(FC),激活功能和softmax层。还可以包括脱落层以提高准确性。通过在CNN训练过程中将完全连接层的权重或输出部分随机重置为零,Dropout减少了节点之间的相互依赖性,从而可以防止过拟合的问题。降层往往在最终的层之间的FC。

主要实验结果(现有原文章中的)

RNN 图片预处理 cnn图像预处理_计算机视觉_03


与原始的CNN网络(即CPD和CTI)相比,MLP-CNN框架被证明能够改善裂纹识别。具体而言,在中等噪声水平下,使用MLP–CNN可以将CPD的准确性提高3.1%。但是,CTI的改善尚不清楚。然后引入了严重的噪声影响,其来源包括光斑,模糊或表面异常。观察到明显的裂纹识别增强:(a)受光斑和模糊的噪声影响,使用原始CPD会大量误解大部分裂纹信息,而MLP–CNN可以准确地识别裂纹,保留了大多数破解信息。对于CTI,在光斑和模糊的影响下,MLP–CNN分别将识别准确率提高了2.8%和5.4%。(b)受表面异常(特别是表面不平整,裂纹和背景之间的颜色收缩程度低以及污渍)的噪声影响,原始CPD遇到缺少裂纹信息以及对背景区域发出错误警报的问题。通过应用MLP-CNN,可以很好地解决这两个缺点。对于CTI,MLP–CNN将识别准确率提高了4.7%。