贾睿 JIA Rui;武旭娟 WU Xu-juan;赵红岩 ZHAO Hong-yan
(①辽宁省交通高等专科学校,沈阳 110122;②辽宁省交通规划设计院有限责任公司公路养护技术研发中心,沈阳 110111)
近几十年来,我国隧道建设有了很大的进展,在总里程和使用面积上有了很大飞跃,隧道交通工程正由“建设为主”向“建养并重”转变。[1]国内外的调查研究表明,在隧道的日常使用过程中,由于各种外部环境的影响,隧道出现不同程度的裂缝、渗漏水、涂层脱落等常见病害,这些病害会威胁到隧道结构的安全性、稳定性及耐久性,严重影响交通质量[2]。因此,高效的隧道病害检测方法可以为养护部门提供有力的技术支撑,是交通安全领域中重要的研究方向,具有重要的研究价值。根据隧道裂缝检测技术的不同,目前方法主要分为:基于图像处理的方法和基于深度学习的方法[3]。
基于图像处理的裂缝检测方法简单高效,包括边缘和轮廓检测、形态学处理等,但这些方法多采用人工设计的裂缝特征算子,易受光照、阴影和路面障碍等因素影响,检测准确率不高,难以应对场景复杂多变的不同裂缝病害。
基于深度学习的裂缝检测方法自动提取输入图像的浅层局部特征信息及高层全局特征信息,两者结合能定位物体边界和识别物体分类,有效解决了传统方法对于人工特征工程的依赖。目前将深度学习应用于隧道裂缝检测的主要方式有:裂缝图像分类、裂缝区域检测、裂缝语义分割[4]。其中图像分割技术更加符合隧道裂缝检测业务需求,能够适应裂缝尺寸变化多样性,识别裂缝区域轮廓,获取裂缝定量评估信息。
近年来,随着人工智能和深度神经网络的高速发展,相关技术在交通巡检养护领域中也得到了广泛应用。Yang[5]使用FCN 网络模型进行裂缝检测,采用反卷积层进行上采样,但FCN 网络缺少底层细节信息,导致检测结果准确率不高。刘凡提出了一种高效的裂缝检测方法[6],通过建立多尺度空洞卷积模块来获取裂缝的上下文信息,并在此基础上引入一种注意力机制,进一步提取高层特征,为解决裂缝与周围路面对比度低的问题。韩晓健[7]提出基于卷积神经网络的裂缝自动检测模型,使用三段线性变换算法和双边滤波算法进行预处理,利用改进的边缘梯度法来实现裂缝最大宽度的定位和裂缝最大宽度的自动获取。翟军治提出了一种多尺度特征增强的路面裂缝检测网络MFENet,实现端到端的路面裂缝图像检测、分类和分割处理[8]。杨泽提出一种改进网络Self-Attention-Unet[9]对路面裂缝区域进行高精度分割,引入自注意力机制增强模型裂缝特征提取能力,提高分割精度。
本文针对隧道衬砌裂缝病害检测存在的准确率低、检测速度慢、抗干扰能力差等问题,提出基于多层级特征融合的隧道衬砌裂缝检测模型CS-Net(Crack Segmentation Network)。该模型采用轻量级特征提取骨干网络,设计不同语义层级特征融合模块,实现低层细节特征与高层语义特征的有机融合,并利用金字塔池化模块对高层语义特征进行多尺度聚合处理。在特征提取时嵌入通道注意力模块,使模型更加关注信息量最大的特征通道。CS-Net 模型主要包括特征提取骨干网、特征融合模块和分割Head,其模型网络结构如图1 所示。
图1 CS-Net 网络结构图
特征提取骨干网采用多个STDC 模块,利用多个卷积进行特征提取,第1 个卷积核尺寸为1×1,其余3 个卷积核尺寸为3×3。关注多尺度信息,浅层网络需要足够的通道来提取小感受野的细节信息,更大感受野的深层网络关注高级语义信息。因此将浅层网络通道数设置的较大使其保留更多的细节信息,深层网络的通道数设置较小来降低信息冗余。
在特征融合模块中,采用金字塔模块、空间注意力、通道注意力等对提取的裂缝图像特征进行融合处理,使模型更加关注信息量最大的特征,弱化非裂缝背景和噪声对模型带来的影响。引入金字塔模块,对骨干网最后一层特征进行多尺度融合处理。引入通道注意力模块对低层细节特征进行处理,自动学习到各个特征通道的重要程度,建模特征通道间的相关性。最后,采用空间注意力机制,在通道维度取最大值和平均值并融合,得出空间注意力权重值α,采用x*α+y*(1-α)方式融合高语义全局特征和低语义细节特征,建模不同层级特征间依赖关系,提升裂缝特征语义表达能力。分割头模块对融合后的多层次特征分别进行预测,并根据设定的权重参数,加权融合多个分割预测图,得到最终的预测结果。
本文采用裂缝数据集为CrackForest、CrackTree 和Crack500。CrackForest 包含118 张大小为480×320 的裂缝图像。CrackTree 包含206 张大小为800×600 的不同场景裂缝图像。Crack500 包含1896 张训练图像、348 张验证图像、1123 张测试图像,图片经过预处理后调整为640×360。三个裂缝数据使用随机翻转、水平翻转、垂直翻转等变换方式进行数据增强处理,并采用7:2:1 的比例进行训练、验证和测试数据划分。
考虑到裂缝数据集中存在类别分布不平衡的情况,因此本文采用平均交并比(mIoU)、类别平均精准率(mPA)来进行模型评估。平均交并比是用于评估模型对于裂缝与非裂缝的分割效果,对前景和背景类别分别计算交并比。类别平均精准率分别计算每个类被正确分类像素数的比例,然后累加求平均评价。考虑到模型性能和模型参数量,增加了Flops 和Params 两个评价指标。
为验证算法有效性,综合比较各图像分割模型对裂缝检测性能,分别在多个裂缝数据集上进行了实验,将本文提出的CS-Net 模型与FCN、BiseNetV2、PP-LiteSeg 等主流网络模型进行比较。为了解决裂缝和背景像素点不均衡的问题,采用Dice 损失作为损失函数,并在计算交并比时去除背景和噪声像素点,从而得到更准确的裂缝分割结果。
从表1 中可以看出,在三份不同裂缝数据集上,本文提出的CS-Net 裂缝检测模型的mIoU 指标明显优于其他模型,其值分别为73.53%、77.04%、82.02%,mPA 分别为99.05%、99.83%、97.67%。同时,考虑到病害图片中裂缝像素占比少,单独评估裂缝IoU 指标,其分别为48.01%、54.26%、66.49%,优于其他三种对比模型。实验数据表明CS-Net 裂缝检测模型具有很好的泛化性能,证明通过融合多层级特征可以明显提升裂缝识别模型在复杂环境下的能力。
表1 不同裂缝数据集上模型准确度/运行性能/参数量对比
图2 是裂缝检测模型的预测结果可视化对比。可以看出对于单一裂缝,四种检测模型都能很好地工作,但对于形状复杂裂缝、阴影处裂缝等,CS-Net 模型能够高效识别出裂缝边缘和形状轮廓,不易受到各种噪声影响,尤其对于裂缝边缘处理情况较理想。
图2 裂缝检测对比实验图
本文为实现隧道衬砌裂缝病害的智能检测,提出一种CS-Net 裂缝检测模型。该模型设计多层级特征融合模块,融合浅层细节特征和高层抽象语义特征,提高全局的特征表达能力,嵌入注意力模块来建模不同层级特征间依赖关系,并使用Dice 损失函数来应对像素不平衡问题,提升检测性能,增加鲁棒性。
实验结果表明,CS-Net 裂缝检测模型在CrackForest、CrackTree 和Crack500 三个数据集上的mIoU 分别为73.53%、77.04%、82.02%,mPA 分别为99.05%、99.82%、97.67%,在平均交并比和类别平均精准率两个综合评价指标上证明了该模型的能力。在多个数据集上取得很好的结果,表明此检测模型提升裂缝识别模型在复杂环境下的分割能力,具有很好的泛化性能。在后续的工作中会近一步优化裂缝特征提取与融合机制,着重提升模型运算效率,降低模型参数量。