许慧青,陈 斌,王敬飞,陈志毅,覃 健
(1.中国科学院成都计算机应用研究所,成都 610041;2.中国科学院大学,北京 101408;3.广东华路交通科技有限公司,广州 510420;4.广东交科检测有限公司,广州 510550;5.中科院广州电子技术有限公司,广州 510070)
近年来,基于深度学习目标检测的路面病害检测算法取得了长足的发展与进步。该领域的研究直接将现有的骨干网络和二阶段目标检测方法应用于路面病害检测。由于病害与通用物体之间的差异,针对细长路面病害检测直接使用现有的目标检测技术将不是最合理的选择,主要原因在于:第一,细长路面病害具有异常的几何属性,主要表现为长宽比十分悬殊,该类型病害包围框的最长边可达2 048 个像素,而其最短边可能只有50个像素,如图1的最后一列所示。第二,某些细长路面病害的前景内容只占其包围框很小的一部分,如图1(a)~(c)所示,所提取的候选区域特征大部分是图像的背景区域。第三,与通用领域的目标相比,细长路面病害表现出弱语义的特性。从图1 可以看出,细长路面病害主要由形状、边缘、纹理、轮廓及颜色等低级语义特征组成;同时,能够看到整个细长路面病害的不同感受野特征对于检测不同长度的病害同样重要。因此,有效利用骨干网络的低级语义特征和不同感受野特征可提升细长路面病害的检测性能。最后,在预测时,现有的二阶段目标检测算法按照候选区域的面积将其分配到特征金字塔网络(Feature Pyramid Network,FPN)[1]的特定层上。该类算法会把大多数细长路面病害的候选区域分配到FPN的高层上进行预测,然而,FPN的高层难以保留该类型病害的有效信息,同时对病害的边界也不敏感[2]。
图1 四种典型的细长路面病害示例Fig.1 Examples of four typical elongated pavement distress
本文根据细长路面病害的自身语义特性和几何属性,提出了一种二阶段细长路面病害检测方法Epd RCNN(Elongated pavement distress Region-based Convolutional Neural Network)。该方法主要包括以下几个方面:
1)提出了一种有效表示细长路面病害特征的骨干网络。该骨干网络通过复用低层特征并反复融合不同阶段特征,以提取符合细长路面病害语义特性的多样性特征。
2)使用有效的锚框机制增加可训练的正样本。针对细长路面病害的异常几何属性,在训练过程中按照细长路面病害长宽比和长度的分布制定有效的锚框机制生成合适的锚框。
3)在步长为4的高分辨率特征图上预测细长路面病害包围框,避免某些细长路面病害在低分辨率特征图上不可见。并利用并行级联空洞卷积模块作用于该高分辨特征图,以提取多尺度特征,缓解不使用FPN所带来的多尺度特征损失。
4)利用候选区域特征改良模块强化候选区域的前景病害特征。考虑形状各异的细长路面病害包围框以及病害与其包围框之间的关系,在提取细长路面病害候选区域特征时使用候选区域特征改良模块强化细长路面病害特征。
目前,有关路面病害的识别与研究,有以下两种方式:基于传统图像处理和基于卷积神经网络(Convolutional Neural Network,CNN)[3]的处理。
基于传统图像处理的检测方法首先提取图像的局部或低级语义特征,再利用所提取的特征实现病害的定位与检测。把原始输入图像分块,用灰度方差值描述子块图像特征,用不变矩描述图像子块模式矩阵的整体特征,训练病害检测器[4]。此外,直接使用图像处理算法实现病害检测,如使用索贝尔算子提取病害的梯度特征[5-6],统计裂缝区域的灰度信息[7-10],利用相关描绘子提取病害的局部特征[11-13]。然而,由于人工设计的局限性,在真实复杂的环境下,基于传统图像处理的病害检测算法难以取得较好的检测结果。
更进一步的,从广义上讲,人工设计的特征描绘子可由CNN 的卷积层和池化操作组成[14]。多层堆叠的CNN 可实现具有判别力和代表性特征的自动提取和表示,该技术可成功应用于路面病害检测。使用CNN 分类病害,该方式以固定滑动窗口的方式对图像分块,将图像块输入CNN 进行二分类以判断是否存在病害[15-17]。该方式难以准确定位出病害的具体位置,并且需对图像块的预测块结果进行后处理合并,增加预测病害的处理时间和难度。使用基于CNN 的分割网络对病害做像素级预测[18-20],输入较小分辨率的路面图像,以全卷积网络[21]的方式分割出病害。由于人工标注的主观性和图像分辨率的限制,像素级预测的重建结果并不可信。同时像素级预测需耗费大量的标注资源。因此,采用目标检测的方式,即以预测病害包围框的方式定位和分类出路面病害,将会取得更好的收益。基于CNN 的目标检测算法成功应用于路面病害检测,实现八种路面病害的端到端检测[22]。Wang 等[23]将通用领域经典的二阶段目标检测算法Faster RCNN[24]直接应用于路面病害检测。通过调整模型的相关参数,并使用数据增强技术,解决数据分布不均衡的问题,取得了非常有竞争力的检测结果。为提升候选区域的生成质量,将边缘检测、膨胀、腐蚀、轮廓检测等传统图像处理技术作为Fast RCNN[25]的候选区域生成方式,再以字典学习的方式训练病害分类器[26]。
Epd RCNN 的整体架构如图2 所示,该方法是以Faster RCNN 为基础构建的,主要包括用于提取多样性特征的骨干网络、并行级联空洞卷积模块和候选区域特征改良模块。如图2 所示,高清分辨率图像经过骨干网络提取特征之后,输出4 种分辨率特征图,表示为{C2,C3,C4,C5}。为避免信息损失,Epd RCNN 将C3、C4 和C5 上采样至C2 大小,再与C2做拼接,输出步长为4 的融合增强特征。并行级联空洞卷积模块作用于该融合增强特征,获取多种感受野特征。Epd RCNN 仍采用Faster RCNN 的候选区域网络(Region Proposal Network,RPN)生成候选区域。但根据数据集中病害长宽比和长度的分布,使用多尺度和多长宽比锚框机制(Multi-Scales and Aspect-Ratios Mechanism,MSAM)生成更符合病害形状的候选区域。随后在并行级联空洞卷积模块输出的高分辨率特征图上,利用候选区域特征改良模块提取候选区域特征。候选区域特征改良模块由可变形感兴趣区域池化(Region of Interest Pooling,RoI Pooling)[27]和空间注意力模块组成。针对形状各异的候选区域,首先使用可变形RoI Pooling 提取特征,缓解候选区域的不一致性。再使用空间注意力模块,突出候选区域有用的前景特征,避免所提取的候选区域特征淹没于大量的背景之中。最后,使用R14×14×256的候选区域特征实现候选区域的分类和回归。
图2 Epd RCNN的整体架构Fig.2 Overall architecture of Epd RCNN
本节提出一种能够有效保留低层细节信息和物体上下文信息的骨干网络,将其命名为HRNet++。如图3 所示,该骨干 网络在HRNet(High Resolution Network)[28]的基础上,通过添加低层特征向后传递模块改进而来。HRNet++输出的高分辨率特征图可以有效地呈现多样性的特征表示。如图3 所示,HRNet++一次性聚合子数据流块的所有卷积特征,这能有效保留低层特征并捕获不同感受野特征。在该骨干网络的不同阶段提取子数据流特征,并将不同阶段的子数据流特征以全连接的方式相互融合,从而在实现高分辨率特征图的同时保留物体细节信息并丰富感受野特征。
图3 骨干网络HRNet++Fig.3 Backbone network HRNet++
Hrnet++共包含5 个阶段,初始阶 段采用ResNet[29]的stem,输入图像经过stem 之后,输出特征图会降为原图的1/4。剩余4 个阶段如图3 所示,每个阶段包含6-r个子数据流块,r为所在阶段数。子数据流块在本阶段以串行的方式连接,在不同阶段以并行的方式连接。子数据流块由4 个卷积特征提取模块和低层特征向后传递模块(Fmix)组成。Fmix接收并拼接子数据流块的4 种不同感受野特征,再用一个1×1 的卷积融合拼接特征,其过程如式(1)所示:
其中:Fmix表示该子数据流块输出的融合特征,和θc分别表示1×1 的卷积层和其参数。数据经过不同阶段的子数据流块后,再以全连接的方式融合骨干网络的不同阶段特征。图3 详细描述了不同阶段特征相互融合的过程。以HRNet++第4 阶段的3 种分辨率特征融合为例,输入的3 种不同分辨率特征图可表示为:{,r=2,3,4}。在该阶段骨干网络输出3 种原始分辨率特征图{,r=2,3,4}和1 个额外下采样特征图。该过程可表示为:
其中:(·)为特征转换函数,其定义由输入阶段数m和输出阶段数n决定。如果m=n(·)是一个普通的3×3 卷积;如果m<n(·)是连续的n-m个步长为2 的3×3 卷积,是进行2n-m倍缩小的下采样操作;如果m>n(·)是后跟1×1 卷积的双线性插值,是放大2m-n倍的上采样和通道对齐操作。数据经过5 个阶段的流动和融合之后,骨干网络的高分辨率特征图可实现特征的多样化表征。
Epd RCNN 融合骨干网络输出的4 阶段特征,输出步长为4 的融合增强特征,如图2 所示。为缓解只在高分辨特征图上做预测所导致的多尺度特征损失,提升融合增强特征的多尺度特征表示能力,同时满足细长路面病害检测对于不同大小感受野特征的需要。对上述高分辨率融合增强特征,使用并行级联空洞卷积模块生成有效的多尺度特征表示,用于检测多种长度的病害。并行级联空洞卷积模块由4 个级联的3×3 空洞卷积Ki组成,空洞率为i∈{6,12,18,24},如图4 所示。并行级联空洞卷积模块接收高分辨率融合增强特征x,执行竖直方向的级联空洞卷积和水平方向的并行分支输出。在竖直方向上,4 个空洞率递增的级联空洞卷积可获取感受野不断增大的特征。在水平方向上,以并行的方式输出级联过程中的中间特征,保留级联过程中的多种尺度特征。最后,拼接并行级联空洞卷积模块输出的4 种感受野特征。为消除拼接特征的混叠效应,使用一个3×3 卷积再次融合该特征,实现有效的多尺度特征表示。该过程可表示为:
图4 并行级联空洞卷积模块Fig.4 Parallel cascaded dilated convolution module
其中:x表示融合增强特征,Ki为不同空洞率的卷积,yi为级联阶段的并行水平输出,y表示并行级联空洞卷积模块输出的融合多尺度特征,和θc分别表示3×3 的卷积层和其参数。
在预测候选区域时,不同于FPN 将候选区域分配到特定的层上,Epd RCNN 在并行级联空洞卷积模块输出的高分辨率特征图上提取候选区域特征并进行预测。某些细长路面病害候选区域具有形状各异以及病害只占其包围框很小一部分的特点。如果使用RoI Pooling[24]的方式提取候选区域特征,则形状各异的候选区域只会学习到固定的特征表示,难以有效保留病害的前景内容,导致不佳的候选区域特征表示。为弥补RoI Pooling 的不足,本文提出候选区域特征改良模块获取更为有效的候选区域特征,该模块包括可变形RoI Pooling[27]和空间注意力模块。首先,长的候选区域应在较大区域上编码内容,而短的候选区域所对应的特征应具有较小的范围。为适应这种几何变化,本文使用可变形RoI Pooling实现候选区域特征的自适应。可变形RoI Pooling 对候选区域的每个子区域像素,学习一个偏移量和该偏移量的权重,自适应地选取合适的位置进行池化,得到分辨率为14×14 的特征图。其次,为有效保留候选区域的前景内容,抑制无用的背景区域,使用空间注意力模块进一步优化所提取的候选区域特征,其结构如图5 所示。上述14×14 的特征图输入空间注意力模块,获取空间注意力权重Asa(x)∈R14×14×1。首先分别使用1×1 的卷积、沿通道的平均池化和最大池化生成聚合特征Ra、Ravg和Rmax∈R14×14×1,并拼接上述3 种聚合特征。再使用一个3×3 的卷积融合上述拼接特征,并通过sigmoid 函数对该融合特征进行归一化,获取候选区域特征注意力权重。该过程可表示为:
图5 空间注意力模块Fig.5 Spatial attention module
其中:σ表示sigmoid 函数,F3×3为3×3 的卷积层,“·”表示特征拼接操作。最后,候选区域特征Xsa∈R14×14×256可由式(7)计算得到:
其中“⊗”表示逐元素的乘法。
3.1.1 数据集
用于训练和评估的数据集由8 444 张分辨率为2 048×2 048 的灰度图像组成。这些图像由特制的检测车辆从中国广东省境内的高速路收集而来。图1 是数据集中4 种典型的细长路面病害,它们分别是纵向裂缝(zxlf)、横向裂缝(hxlf)、修补(xb)和修补不良(xbbl),且图1(d)出现修补不良和修补相交在一起的情况。该数据集有以下的特点:图像容易受水渍、垃圾、油斑、砾石、车道线及噪声等因素的干扰,导致背景异常复杂;病害在不同图像中形态、颜色、拓扑结构、长度存在较大的差异;有一些病害与背景十分接近,对比度差异较小;存在复合类型病害的细粒度检测,要分辨出修补与修补不良这两种十分接近的病害;成像易受天气、光照、过度曝光、曝光不足及阴影等不理想成像条件的影响,图像极易出现光照不足和光照不均的情况,进一步降低病害和路面的对比度差异。因此,从图像中自动检测出路面病害充满挑战。为进一步评估该方法在不理想成像条件下检测的鲁棒性,本文按照图像的灰度值把测试数据分成明、暗两种类型,并记录实验结果。
在图像标注的过程中,对于裂缝病害而言,按照病害包围框的长宽比来确定病害类别:如果裂缝病害包围框的长宽比大于1,则被标注为纵向裂缝;若裂缝病害包围框的长宽比小于1,则被标注为横向裂缝。由于包围框长宽比为1 的裂缝实例较少,直接将包围框长宽比为1 的裂缝实例标注为纵向裂缝。针对修补和修补不良相交的情形,不再将该形式的病害整体标注为修补不良,而是将其认为是多个相交的病害实例,并分别进行标注。所获取的原始图像数据存在着类别不均衡,主要集中于裂缝类型病害。针对数据集中存在的不均衡数据,本文采用Albumentations[30]中的水平翻转、垂直翻转、旋转以及转置等空间级变换来扩充不平衡的病害图像。表1 展示了经过图像增广之后,分别用于训练和测试每类病害的图像数量。本文随机选取7 601 张图像作为训练集用于网络训练,剩余843 张图像作为测试集用于评估检测方法的性能。
表1 训练集和测试集中的图像数Tab.1 Number of images in training set and test set
3.1.2 评估指标
平均精度(Average Precision,AP)和平均准确率均值(mean Average Precision,mAP)是目标检测任务常见的评估指标。本文采用与VOC(Pascal Visual Object Classes)[31]目标检测比赛相同,在交并比为0.5 时的AP 和mAP 作为评估指标。AP 用于评估检测方法在单个病害上的性能表现,反映检测方法在该类病害上的检测稳定性。对于多种病害检测,mAP 是所有类别AP 的均值,反映检测方法在所有病害上的性能表现。
3.1.3 数据预处理
数据集是由2 048×2 048 的高清分辨率图像组成。直接使用全分辨率图像作为训练输入需要大量的GPU 内存,从而导致训练困难。针对该情况,通常有两种做法:把图像剪切成适合的小块或缩小图像,剪切图像的方式会严重破坏病害的整体性,产生较多的误报;同时需再次融合图像小块的预测结果,增大病害检测的难度和时间。本文把图像缩放到1 024×1 024,在保留病害完整性的前提下,同时降低在训练和测试阶段对于硬件的要求。
3.1.4 网络设置
本文所有的实验均使用 MMDetection(MMLab Detection)[32]深度学习目标检测工具箱,并在显存容量为24 GB 的NVIDIA TITAN RTX 上执行。使用冲量系数为0.9 的带动量的随机梯度下降算法优化网络。采用Microsoft Common Objects in Context[33]数据集上的预训练模型,并冻结骨干网络第一阶段的参数。批次大小设置为2,共训练60 个轮次,初始学习率设置为0.01,学习率在第20 轮和40 轮分别降至0.001 和0.000 1。Epd RCNN 的RPN 采用MSAM 生成更为符合数据分布的锚框。表2 是FPN 和MASM 两种锚框机制的配置参数。
表2 训练过程中使用的两种锚框机制Tab.2 Two anchor box mechanisms used in training process
3.1.5 用于比较的方法
为验证骨干网络、MSAM 以及Epd RCNN 对于检测细长路面病害的贡献,本文比较4 种检测方法分别使用4 个骨干网络的性能表现,所比较的骨干网络和检测方法如表3所示。
表3 对比实验中的骨干网络和检测方法Tab.3 Backbone networks and detection methods in comparison experiments
ResNet101[29]:101 个卷积层的ResNet101。引入具有恒等映射的残差模块,构建出更深的网络结构,从而提取出可建立长距离依赖关系的大感受野特征。
VoVNetV2-57[34]:57 个卷积层的VoVNetV2-57。该网络一次性聚合网络中低层特征实现多样化特征提取,再使用通道注意力机制和残差连接优化网络所提取的特征。
HRNetV2-W32[28]:初始通 道数为32 的HRNetV2-W32。该骨干网络并行连接高至低分辨率的卷积信息流,以全连接的方式反复融合骨干网络的不同分辨率卷积特征图,获取语义上更为丰富、空间上更为精确的特征。
HRNet++:本文所提出的骨干网络,具体参考2.2 节。
Faster RCNN[24]:经典的二阶段目标检测方法。本文采用FPN,在不同尺度的特征图上生成候选区域预测病害。
Faster RCNN+:采用MSAM 的Faster RCNN。
Epd RCNN-:本文第2 章所介绍的病害检测方法,但未使用MSAM。
Epd RCNN:本文第2 章所介绍的病害检测方法。
表4 呈现了在测试集上本文所比较的检测方法分别使用4 种骨干网络的检测结果。
首先,表4中的mAP_B 和mAP_D 分别表示检测方法在测试集中明、暗两种图像上的mAP。表4 中的mAP 是mAP_B 和mAP_D 的综合平均,表示检测方法在测试集中所有图像上的综合mAP。本文所有实验的mAP_B 和mAP_D 十分相近,表明CNN 和二阶段目标检测方法可有效处理细长路面病害存在的光照问题,可实现在不理想成像条件下病害的鲁棒性检测。从同种骨干网络下不同检测方法的性能表现可以看出,Faster RCNN 在所有的检测方法中表现最差,特别是对于前景占比相对较少的细长病害(横向裂缝、纵向裂缝和修补不良),说明将细长路面病害的候选区域映射到FPN的高层会严重影响细长路面病害的检测性能。信息损失的FPN高层会导致细长路面病害不可见,同时也对病害的边界不敏感。在相同的骨干网络下,与Faster RCNN、Epd RCNN-相比,Faster RCNN+和Epd RCNN 的mAP均有提升,说明在训练过程中,检测方法能否生成足够的正样本对于细长路面病害检测十分重要。MSAM 能够生成高质量的正样本,覆盖细长路面病害,避免检测方法在训练的过程中只学习到图像的背景区域。相较于其他3 种检测方法,在分别使用4 个骨干网络时Epd RCNN 始终保持较好的检测性能。
其次,骨干网络能否有效利用低层细节特征和高层大感受野特征,对于提升细长路面病害的特征表达能力至关重要,决定后续检测方法的性能表现。以下的描述均是针对不同骨干网络在相同检测方法下的性能比较。ResNet101 只堆叠较深的卷积层,从而获取可建立长距离依赖关系的卷积特征,在以上的检测方法中均表现不佳。一次性聚合低层特征的VoVNetV2-57,通过保留低层特征,提取多样性特征,可取得检测结果有限的提升。反复融合不同阶段特征的HRNetV2-W32 也可获得一定的检测性能提升。但相较于HRNet++,上述3 种骨干网络均未取得理想的性能表现。与以上3 种骨干网络相比,HRNet++在不同的检测框架下均获得最优的检测结果。粗略地讲,HRNet++具有以下优点:堆叠足够的卷积层,可提取能够建立长距离依赖关系的大感受野特征;向后传递卷积神经网络所提取的低层特征;网络不同阶段特征相互融合,可让高分辨率特征图同时保留物体的细节信息和丰富的语义信息。表4 的实验结果表明,骨干网络以上的改进可提升路面病害的特征表达能力,提升细长路面病害的检测性能。
表4 在测试集上细长路面病害的检测性能比较Tab.4 Comparison of elongated pavement distress detection performance on test set
最后,使用骨干网络HRNet++的Epd RCNN 取得最优的0.899 的mAP,比基线Faster RCNN 高出0.385。对于纵向裂缝、横向裂缝、修补和修补不良,该方法分别取得0.893、0.895、0.912 和0.897 的AP,表明该方法具有良好的细长路面病害检测性能。对于此类型病害来说,该方法所获取的分类AP 和mAP 表明,在高分辨率特征图上进行细长路面包围框预测优于FPN 的多尺度预测。并行级联空洞卷积模块保留并融合级联过程中的多尺度特征,满足细长路面病害检测对于多尺度特征的需要。候选区域特征改良模块进一步优化候选区域特征,可提取有效的细长路面病害候选区域特征,从而获取更优的检测结果。
图6 是本文所比较的4 种检测方法在使用骨干网络HRNet++时,在测试集上的随机采样结果。如图6(a)、(b)所示,Faster RCNN 和Faster RCNN+均产生大量的漏报,特别是对于细微且前景内容较少的裂缝类型病害,并且预测出较低的包围框分类分数。图6 的结果表明,上述两种检测方法均难实现细长路面病害的准确预测。Epd RCNN-可做到细长路面病害的不漏检,但出现预测较大包围框的情况,不能完全贴合细长路面病害。在这4 种检测方法中可明显发现,不使用MSAM 的Faster RCNN 和Epd RCNN-更倾向于预测出长宽比较为正常、长或宽均不是很长的包围框。而使用MSAM 的Faster RCNN+和Epd RCNN可预测出更接近病害形状、特殊长宽比的细长包围框。最后,Epd RCNN 的检测结果如图6(d)所示,可以看到该方法可预测出更接近真实标注的检测结果,并且具有较高的包围框分类置信度。上述不同方法的检测结果,进一步表明Epd RCNN在细长路面病害检测的有效性。
图6 四种检测方法的细长路面病害检测结果示例Fig.6 Examples of elongated pavement distress detection results of four detection methods
Epd RCNN 在本文测试集上的检测结果采样如图7所示。图7(a)、(b)分别是该方法的正确检测结果,表明本文的检测方法可有效处理细长路面病害。图7(a)表明,当光照充足时,即使图像会受路面材质、车道线以及行车状况等因素的干扰产生复杂的背景,该方法依然可做到准确有效的预测。当图像出现光照不足、光照不均等光照问题时,该方法依然可做出鲁棒性的检测,如图7(b)所示。针对病害前景只占其包围框很少一部分的裂缝,图7(a)、(b)的前两列表明该方法可精确预测出裂缝病害的位置和类别。图7(b)的最后一列表示两个相交病害的检测结果,该方法在定位出两个病害实例的同时,可对这两种病害进行细粒度的区分。Epd RCNN 的低层特征复用、提取多尺度特征、有效的候选区域特征、符合数据集长宽比分布的锚框机制以及在高分辨率特征图上做预测,使其能够具有较好的检测性能。
该方法典型的失败检测结果如图7(c)所示。首先,图7(c)的第一列的真实标注是两段纵向裂缝,该方法预测出一个整体的纵向裂缝。出现上述裂缝漏报的主要原因是:在训练数据中由于人类的主观因素将这种两条边界不明显的裂缝标注为同一条裂缝的缘故,导致该方法更倾向于预测出一条整体裂缝。第二,Epd RCNN 对同一个病害实例同时预测出修补和修补不良。对于这种一个病害实例预测出两种结果的情况,是由于将该病害实例同时标注为修补和修不良,该方法对这种人类难以有效界定的病害,出现混淆检测。第三,图7(c)的最后两列表示将路面出现的异物误报为修补。图7(c)的最后两列分别是鞋带和施工的沥青残留,由于二者与修补十分接近,该方法做出错误的预测。对于异物误报的情形,可能是由于该方法是一种启发式的检测算法,在学习的过程中该方法未能选取有效的负样本准确覆盖相关异物。在后续的工作中,进一步明确标注数据,合理使用噪声数据,同时在训练过程中显式地加入相应的背景异物来消除上述误报。
图7 Epd RCNN在不同光照条件下正确的细长路面病害检测结果以及该方法错误的检测结果Fig.7 Correct elongated pavement distress detection results of Epd RCNN under different illumination conditions and its wrong detection results
本文从细长路面病害的弱语义特性和异常几何属性出发,提出Epd RCNN 路面病害检测方法。该方法主要包括低层特征复用和多种尺度特征反复融合的骨干网络、并行级联空洞卷积模块、MSAM,以及候选区域特征改良模块。实验结果表明,该方法优于对比的目标检测方法,可降低路面病害视觉检测任务的劳动密集程度。尽管如此,在以后的工作中将对以下内容继续展开研究。
1)加入更多种类的路面病害,如相对小的目标坑槽病害,使之能够满足日常工作的基本需要。
2)二阶段目标检测方法需大量的内存和计算资源,较难实现快速的病害实例检测,研究单阶段目标检测算法实现路面病害的实时检测。
3)HRNet++在融合不同阶段特征时,并未考虑不同尺度特征对于融合特征的贡献程度,采用注意力机制融合更为适合细长路面病害检测的特征。