杨紫艳 马龙博 邓 凌 史有玉
(东北林业大学土木工程学院,黑龙江 哈尔滨 150040)
桥梁在役期间受环境等因素的影响,其自身各部分结构会产生不同程度的损伤和劣化。常见的桥体结构病害特征有裂缝、剥蚀、钢筋锈蚀、混凝土碳化等,而桥梁裂缝作为一种主要的桥体结构病害特征,对桥梁健康状态综合评定结果有重要影响[1]。
传统的人工检测方法,在检测效率、检测精度上、劳动强度、成本等方面存在很多不足[2]。近年来,无人机被广泛地应用在施工和工程质量检测工作中,大量学者研究基于无人机的桥梁裂缝自动化检测技术:基于无人机采集图像和相关数据,利用图传技术收集桥梁外观信息,研究图像识别算法,实现桥梁裂缝的自动化检测识别,其技术的核心问题和研究重点是图像识别算法。传统的图像处理算法在裂缝识别效果上无法满足桥梁检测工作的要求。卷积神经网络的出现,很大程度上提升了图像识别的准确率[3-5],应用该算法实现图像识别的效果已经得到大量学者的验证。
本文以卷积神经网络为基础,提出一种基于无人机的桥梁裂缝识别的技术,该技术为实现桥梁自动化检测提供一定帮助。
卷积神经网络的研究最早开始于20世纪80年代,一些学者开展了卷积神经网络(CNN)的相关科研工作,并在手写数字识别中取得了良好的图像自动化识别效果[6]。然而受计算机性能等因素限制,此时卷积神经网络无法很好地对大规模的数据进行识别分析。2012年AlexNet网络的出现说明卷积神经网络在大数据分析上存在更多的可能性。此后,更多更深的卷积神经网络模型被提出。如今,轻量型的卷积神经网受到更多人的认可。纵观卷积神经网络的发展史,卷积神经网络模型经历了从简到繁再到简的过程。
近年来,国外对基于卷积神经网络的图像识别技术的应用进行了深入研究。基于CNN的图像识别技术不仅被应用在工程建设领域,在医学上也可用于实现医学影像的识别分析。国内学者对卷积神经网络的研究也取得了一定的进展,如温作林等[7]设计了一种名为CrackNet的深度卷积神经网络架构用于提取图像特征,较好地实现了桥梁裂缝的检测识别与定位,通过模型训练结果分析,该模型表现出较强的鲁棒性和高效性。
卷积神经网络,在训练速度上优于其他机器学习算法,其可通过局部感知、权值共享和池化等方法大大减少层间的连接和所需要的参数,加快神经网络训练的速度。卷积神经网络架构一般由以下五层构成:输入层、卷积层、池化层、激活层、全连接层。
输入层用于数据预处理,可通过数据标准化、归一化、去均值等方式处理用作训练的数据。卷积层主要用于图像特征的提取,卷积核以一定的步长以滑动窗口的形式与图像矩阵做数乘法后求和。池化可聚合卷积操作提取的特征,降维减少运算量。卷积后的特征图有相当多的冗余信息,池化的目的就是去除冗余信息,同时保留图片最重要的信息,常见的池化方式有平均池化、最大池化、求和池化。模型采用最大池化方式进行特征的聚合。激活层利用激活函数解决了部分图像数据非线性可分的问题,可提高深层神经网络的表达能力。全连接层则整合局部信息,同时将输出的值送给分类器。
选择合适的桥梁作为调查对象,利用无人机搭载摄像头近距离提取桥梁外观影像数据。处理实地调研收集到的图片数据和从网络资源中搜集到的桥梁部位图片作为原始样本集。鉴于数据集的大小对算法的准确率会产生一定的影响,可通过扩大数据集的方式解决模型的过拟合问题。将处理好的原始图片通过原始裁剪、平移变换、旋转变换等增加训练数据。然后,将处理好的每一副图片进行编号,将其标记为裂缝或非裂缝,用于模型的训练、测试和验证。取样本集中的部分图片预览如图1所示。
边缘检测是图像预处理中常用的处理原始图像样本的方法。边缘检测主要检测的是图片颜色变化比较明显的地方。原始样本图片的边缘检测预处理对于卷积神经网络特征的提取具有重要的意义,在一定程度上能提高模型训练的准确率。本文采用Roberts算子进行边缘检测,该算子对于低噪声的图像具有良好的处理效果。经过Roberts算子边缘检测处理后的效果如图2,图3所示。
由于拍摄环境的不同,图片的灰度、曝光度存在差异,对模型权值更新将产生一定影响。对训练集图片数据进行标准化处理可在一定程度上增强模型的泛化能力,模型采用z-score数据标准化方式,具体公式为:
其中,μ为原始图像数据的均值;x为图像矩阵;σ为原始数据的标准方差。
该模型以两组卷积核和池化层为基础,通过两层全连接层连接特征,采用Softmax分类器输出在每个可能的类标签上的概率分布,然后分析类标签上的概率分布对图像进行分类。卷积神经网络架构如表1所示。
表1 卷积神经网络架构
激活函数又称激励函数,sigmoid,tanh,Relu,ELU,Maxout等是常见的几种激活函数。通常激活函数具有以下部分特性:非线性、连续可微、单调性、范围最好不饱和、在原点近似线性。需要注意的是,目前没有一种激活函数能满足以上全部性质。本文采用非饱和激活函数Relu:
f(x)=max(0,x)。
Relu函数图像如图4所示,由图4可知,相较于其他激活函数,Relu函数只需要判断输入是否大于0,因此在训练速度上Relu函数要快很多。
无人机拍摄的桥梁外观图片存在亮度不均的问题,为了削弱图片不同亮度对桥梁裂缝检测的影响,添加局部响应归一化层用于构建卷积神经网络的局部侧抑制机制。局部响应归一化(LRN)可将不同卷积核Relu后的特征归一化,提高深度学习准确度、增强模型的响应能力。批量归一化(BN)同样可增强模型的泛化能力,与局部响应归一化(LRN)侧抑制机理不同,批量归一化(BN)则通过减少内部协变量转移实现数据的归一化处理。
LRN首次由Alexnet提出:
卷积层在提取图像局部特征的过程中,图像随着卷积操作的进行逐渐变小,容易导致图像边界信息的丢失,但边界信息对特征的提取同样发挥着一定的作用。为减少边界信息特征的损失,模型对图像进行边界填充处理。
利用经过数据预处理的训练集训练搭建好的卷积神经网络模型,并利用优化器不断更新和计算网络参数值,使损失函数最小化(或最大化)。在神经网络模型训练中,常见的优化器有SGDM,Adam,Adagrad等,模型采用自适应估计Adam作为优化器,对权重、偏置项和学习率进行修正,设置基础学习率为0.000 1,训练步数为6 000。
模型经过训练后可得出多个不同的模型,之后,用验证集验证各个模型的性能和分类能力。此时,同一参数的不同取值可拟合出不同的分类器。
模型经过训练集和测试集训练后各项参数达到较优值。最后,利用测试集预测模型的正确率、损失率等各项指标。同时,检验模型识别裂缝图片的准确率,实验结果显示该模型具有良好的识别效果。
1)本文证实了无人机在桥梁外观检测工作中的应用价值:利用无人机代替人工巡检,通过记录航空摄影采集桥梁结构图片数据,并进行高精度定位,同时可对桥梁外观易损结构进行重点检测,有利于提高桥梁养护工作效率,消除人工检测的弊端,推进土木工程领域的智能化水平。
2)本文将无人机和基于卷积神经网络的图像识别技术结合在一起,实现了桥梁裂缝的自动化检测:整理无人机获取的桥梁外观图片,并对其进行预处理。搭建卷积神经网络模型训练处理好的桥梁样本数据集,利用训练好的模型识别桥梁裂缝图片和完好图片,实验结果表明该方法在识别效果上优于传统的图像处理技术。通过该例子可证明基于卷积神经网络的图像识别技术在桥梁裂缝识别中的实用性和可行性。该技术还可用于道路、房屋建筑等裂缝的识别,能有效减少建筑物安全巡检的人力、物力,在道路桥梁等建筑物的养护上具有广泛的用途。