基于深度学习的铁路异物检测综述

2024-11-03 00:00蔡政达陈跃邱启源
科技资讯 2024年19期

摘要:铁路异物检测对铁路安全至关重要,深度学习是铁路异物检测领域安全监测的重要技术。基于此,首先,说明了铁路接触网和铁路异物检测的基本概念,继而介绍了基于深度学习的铁路异物检测方法,将铁路异物的深度学习算法进行介绍与比较;其次,从深度学习方面对铁路异物检测现状进行综述。总结了现有模型的鲁棒性和小目标检测的问题,并提出展望。

关键词:铁路异物目标检测深度学习机器视觉

中图分类号:TP18;TP391.41;U298

AReviewofRailwayForeignBodyDetectionBasedonDeepLearning

CAIZhengdaCHENYueQIUQiyuan

XihuaUniversity,Chengdu,SichuanProvince,610039China

Abstract:Railwayforeignobjectdetectioniscrucialtorailwaysafety,anddeeplearningisanimportanttechnologyforsafetymonitoringinthefieldofrailwayforeignobjectdetection.Inthisregard,thebasicconceptsofrailwayoverheadcontactlineandrailwayforeignobjectdetectionarefirstexplained,andthentherailwayforeignobjectdetectionmethodbasedondeeplearningisintroduced,andthedeeplearningalgorithmofrailwayforeignobjectdetectionisintroducedandcompared.Then,thepresentsituationofrailwayforeignbodydetectionissummarizedfromtheaspectofdeeplearning.Theproblemsofrobustnessandsmalltargetdetectionof&d1259bd8aeaf3de20b72aae2d44e7efcnbsp;existingmodelsaresummarized,andprospectsarepresented.

Keywords:Railwayforeignmatter;Targetdetection;Deeplearning;Machinevision

高铁是我国主要交通运输方式之一。随着中国铁路的发展,有关于高速铁路接触网的安全问题日益突出。其中,由于铁路周围异物而引起的关于接触网安全事故频频发生。铁路系统一旦出现故障,则有可能影响到整条线路铁路运输安全,所以必须要对铁路接触网进行监测。铁路异物入侵检测方法主要包括接触式和非接触式两类,接触式检测方法在铁路异物入侵检测中依赖物理接触或电气互动,仅能在物体接触时有效,对于一些非接触型入侵情况无法提供有效检测,且受到检测范围和设备依赖的限制,容易产生误报和漏报,增加了系统运营成本和复杂性。随着机器视觉的高速发展,使用基于深度学习的非接触式检测方法已然成为一种新的检测趋势。

1深度学习算法介绍

铁路异物检测的自动检测算法在近年来备受关注。深度学习在铁路异物识别方面已显现出强大的功能和灵活性。在视觉检测领域,目前目标检测算法主要分为两种类型。

1.1two-stage两步检测法

two-stage两步检测法,如候选区加卷积神经网络结合(Region-basedConvolutionalNeuralNetwork,R-CNN)系算法,其基本原理是先生成一组较稀疏的候选框,然后对这些候选框进行分类与回归,两步检测法的优势是精度高,但相较于一步法检测速度较慢。

1.2one-stage一步检测法

one-stage一步检测法,如Yolo(YouOnlyLookOnce)和SSD(SingleShotMultiBoxDetector)算法,其核心思路是在图像的各个位置进行密集采样,然后通过卷积神经网络(ConvolutionalNeuralNetwork,CNN)提取特征,直接进行分类和回归。由于整个过程只需一步完成,所以这种方法的优势在于速度快,能够直接预测目标的位置和种类。然而,密集采样的一个主要缺点是训练较为困难。接下来,将主要以SSD算法为例,介绍并比较铁路异物目标检测算法。

2铁路异物目标检测算法介绍与比较

2.1FasterR-CNN存在的问题

在对异物的检测研究中,当目标离相机较远时会产生小目标样本;FasterR-CNN在样本中存在小目标时检测效果很差(只在最后一个特征层预测,这个特征层是已经过很多卷积层之后的,图像抽象的层次比较高,图像的细节信息保留较少,小目标效果较差,要在相对低层次上的特征来进行预测)并且模型大,检测速度慢(两次预测,twostages方法的通病)。图1为FasterR-CNN的整体框架图。

2.2SSD算法介绍

SSD算法,全称SingleShotMultiBoxDetector,是应用于铁路异物检测的主要检测框架之一;SSD算法相较于FasterRCNN算法,它的测速优势非常明显,相比YOLO算法又有明显的mAP优势。

2.3SSD算法结构介绍

深度神经网络(DeepNeuralNetwork,DNN)是目前解决图像识别问题最有效的算法,它一经出现到现在一直是机器学习领域的主流处理算法。DNN算法的识别率和分类率比之前的图像处理算法有着显著提升。而目前异物检测主要使用的SSD是一种工程中常见的目标识别与定位算法之一,是基于生成先验框的深度学习网络算法。它的主要优势是比FasterRCNN网络更快,又比YOLO网络识别率更准确。SSD算法是深度神经网络中一种直接预测目标类别和boundingbox(检测目标的位置参数)的多目标检测算法,该SSD算法与FasterRCNN相比,没有生成regionproposal(候选区域)的过程,经过单次检测即可直接得到最终的检测结果,极大提高了检测速度。SSD目标检测算法可在逐级卷积层中进行特征映射。它的网络结构与VGG(VisualGeometryGroup,一种深度卷积神经网络模型)前5层相似,而把比较耗费系统资源的全连接层改成卷积层[1]。

2.4SSD算法框架

SSD算法使用VGG作为基础框架,同时取消了VGG最后的两个全连接层,同时又添加了几个卷积层和一个平均的池化层来提取特征,每层通过设置卷积层的步长来实现降采样,得到不同尺寸的featuremap(特征图)。SSD算法框架以及和YOLO算法的比较如图2和图3所示。

SSD算法是在YOLO算法的基础上进行改进,其精确度能够和两阶段方法媲美,同时在模型检测时还能保持较快的运行速度。SSD在结构方面也采用了网格划分的思路,不同于FasterRCNN的是,它将所有操作整合在一个卷积网络中完成。为了检测不同尺度的目标,SSD对不同卷积层的特征图进行了滑窗扫描。在前面的卷积层输出的特征图中检测小目标,在后面的卷积层输出的特征图中检测大目标。

2.5SSD算法的优缺点

优点方面,在运行速度方面SSD算法和YOLO算法相当,在检测精度方面和FasterR-CNN算法相当,并且SSD算法的检测精度和速度在76.8mAP和22FPS超过了Faster-RCNN算法和YOLO算法。

缺点方面,需要手动设置参数,如riorbox的min-size、max-size和aspect-ratio值。

3铁路异物视觉监测现状

目前,铁路异物入侵检测网络模型的改进主要是在CNN基础上,将现有模型结构进行改进;如YOLOv5是Ultralytics公司提出的目标检测算法[2],改进YOLOv5算法的neck部分,嵌入注意力机制;替换YOLOv5的特征提取网络等;具体叙述如下。

3.1基于YOLOv5的铁路接触网异物检测

赵仲瑜等[3]通过建模实验,在基于YOLOv5模型的基础上构建了两种接触网异物检测模型:YOLOv5+坐标注意力(CA,CoordinateAttention)改进模型和YOLOv5+ConvNextBlock改进模型,具体改进方法是通过在YOLOv5模型neck部分的第一个concat嵌入CA注意力机制模块或者ConvNextBlock模块。相比YOLOv5算法,模型改进后检测小尺寸目标的能力更强。

3.2基于YOLOv3高铁接触网异物检测

蒋欣兰等人[4]先基于LSD检测算法获取鸟巢的感兴趣区域;其次利用YOLOv3网络在ImageNet上进行训练得到一个预训练权重,并使用人工标注的数据集继续训练网络直到网络收敛;最后使用训练好的网络对感兴趣区域存在的鸟巢进行检测。这种算法的特点是先使用传统视觉提取鸟窝可能存在的感兴趣区域,以便深度学习模型进行检测;再通过训练好的YOLOv3模型在感兴趣区域对目标进行精确定位和分类。优点是能够排除铁路背景复杂的问题;增加目标检测定位准确性。

3.3基于YOLOV5s的接触网鸟巢异物检测

王晓红等人[5]提出了一种轻量级ESA4-YOLOV5s网络模型,用于对鸟巢异物进行实时监控。该模型采用了EfficientNet-B4作为特征提取网络,通过特征融合,提高了模型的检测速度和精度。

3.4基于SSD算法的铁路接触网异物检测

张萌[6]提出了一种基于MobileNetV2+FPN(FeaturePyramidNetwork,特征金字塔网络)+注意力模块的SSD改进算法。将VGG-16网络替换成轻量级的MobileNetV2,为了解决小目标检测效果较差的问题引入了FPN。同时为了使网络能够提取图像中有用信息,在网络中引入混合注意力模块,使网络能够更加关注有用信息,同时抑制冗余信息对特征提取的影响,进一步提升检测精度。这种算法在减少了参数量的同时提升了检测精度,进而提高了运算速度。

3.5改进SSD算法的鸟窝检测

祁婕等人[7]为了提高模型对数据特征的提取能力,将SSD算法的前置网络VGGNet替换成了ResNet-101,并将Softmaxloss(损失函数)用Focal 9kKPPcUUv4Z3Pz51q2N7NQ==;loss(损失函数)代替以改善SSD算法中样本不平衡的问题,并利用数据增广提高数据多样性,以提高模型的鲁棒性。

4总结与展望

总体而言,应用于铁路异物的SSD和YOLO算法通过多尺度检测策略和one-stage检测策略后的模型准确度能够达到生产工业要求,但依然存在着一些尚未解决的问题,具体如下。

  1. 模型特征算子对深层语义特征的捕获问题,模型的鲁棒性待提高。模型在实际应用场景下,常常因为铁路线路的不同、树木的遮挡、光照、相机等因素导致难以提取到有效特征。
  2. 当目标在图像中占比小时YOLO类模型较难识别。由于列车上的摄像头采集的图像数据是由远到近。所以会出现小目标样本,和重复样本,所以会出现一个目标重复检测的情况。因此如何在视频中选取最优帧作为数据集图像是一个重要问题。

参考文献

  • 刘继丹,孙吉,仲天舒,等.改进SSD卷积神经网络在钢板边裂纹检测中的应用[J].冶金自动化,2020,44(4):43-47,80.
  • 张国名.基于YOLOv5算法的接触网异物识别研究[D].石家庄:石家庄铁道大学,2024.
  • 赵仲瑜,唐伟忠,张文辉,等.基于YOLOv5的铁路接触网异物检测模型初步研究[J].铁路计算机应用,2024,33(2):13-18.
  • 蒋欣兰,贾文博.高铁接触网异物侵入的机器视觉检测方法[J].计算机工程与应用,2019,55(22):250-257.
  • 王晓红,杜云飞,刘畅.基于YOLOV5s的接触网鸟巢异物检测[J].长江信息通信,2023,36(6):51-54.
  • 张萌.基于无人机的铁路接触网异物检测[D].大连:大连交通大学,2022.
  • 祁婕,焦良葆.改进SSD的输电铁塔鸟窝检测[J].计算机系统用,2020,29(5):202-208.