基于级联Faster R-CNN的高铁接触网支撑装置等电位线故障检测

2019-08-02 06:17:26李长江韩志伟钟俊平王立有刘志刚

铁道学报 2019年6期

李长江，韩志伟，钟俊平，王立有，刘志刚

(西南交通大学电气工程学院，四川成都 610031)

在高速铁路接触网支撑与悬挂装置中，等电位线起到防止烧损支持的作用，确保支持与定位零件的短路稳定性。当列车受电弓通过接触网时，定位器会存在一定抬升，从而使其与定位器支座产生间隙。在间隙产生时，如果等电位线松脱或断裂，定位器支座将承受较大的电气冲击，造成电化学腐烛，严重时导致定位器与支座连接处断裂脱离，影响行车运行安全[1]。

近年来，接触网非接触式检测由于安全、行车干扰小等优势，在接触网故障检测中获得越来越广泛的应用[2-3]。目前已有的基于图像处理技术的接触网零部件检测方法[4-7]，是基于局部特征匹配(SIFT、SURF、LBP等)和模板匹配等算法实现旋转双耳、绝缘子以及斜撑套筒等高铁接触网定位支撑装置零部件的定位，并通过灰度分布规律、小波变换等算法实现零部件故障检测。它们属于传统的图像识别算法：图像的特征提取与分类两部分是分开进行的，因此需要手工构建选择定位的目标特征，不仅增大工作量，而且在面临复杂陌生问题时，往往无法设计出足够优秀的特征；人工设计出的特征往往缺乏鲁棒性，针对于诸如梯度、颜色、纹理等某一方面的浅层特征。这就使得传统的图像识别算法有很大的局限性，性能提高空间有限。

在检测车获取的接触网支撑装置图像中，由于等电位线目标较小，故障特征不明显，如图1中方框标识所示。等电位线对于拍摄参数较为敏感，要检测其缺失、散股等不良状态存在较大困难。目前对等电位线散股问题检测研究较少。

图1 接触网装置等电位线图

针对等电位线定位、故障监测等研究的困难，提出一种基于级联Faster R-CNN等电位线目标提取与故障识别的算法，检测等电位线的不良状态。为减少其他因素影响，提高等电位线故障检测准确性，在等电位线定位识别过程中，通过第一级Faster R-CNN对等电位线所在的定位器支座进行定位；在一级对象定位的基础上利用第二级Faster R-CNN学习等电位线散股故障特征，实现正常与故障等电位线的分类，通过实验分析Faster R-CNN在不同训练样本数量、迭代次数等因素对检测时间及识别效果的影响。通过统计分析，确定故障判断阈值，作为等电位线是否发生散股故障的判据。

1 卷积神经网络

传统目标检测算法，如SIFT[8]、HOG[9]等，一般人工设计目标特征，再输入到分类器中学习分类。传统方法比较复杂、费时费力、精度不高，并且对设计者学术水平有较高要求。由于等电位线形状不固定，故障特征不明显，故采用级联Faster R-CNN提取等电位线散股故障特征以实现不良状态识别。Faster RCNN能够直接将图像数据作为输入，与图像像素进行卷积、提取图像特征，避免了图像预处理和特征抽取等复杂操作[10]。网络神经元之间采用局部连接，简化了计算量，加快了特征提取的速度，并且神经元之间能够权值共享，简化了网络模型，提高了训练效率。文献[11]采用多层网络构建深度卷积神经网络实现对行人的检测。文献[12]基于卷积神经网络和SVM分类器实现高速公路上主要三种车型的分类。表1为RCNN系列方法对比。在标准集VOC2007中，在RCNN系列深度学习算法中，Faster R-CNN在检测精度和时间上都有明显提高。因此，采用级联Faster RCNN对等电位线进行故障识别。

表1 R-CNN系列方法对比

R-CNN算法[13]核心是对图像中每个区域通过CNN提取特征，通过分类器预测区域中目标对象的置信度，转换成图像分类问题，分类器可以是独立训练的SVM[14]，也可以是简单的全连接分类。Fast R-CNN回避了R-CNN要对每个区域都使用一遍CNN，直接对全图进行卷积，获得特征图。而Faster R-CNN由特征提取+RPN(Region Proposal Networks)+Fast R-CNN构成分类器，是一种多层监督学习网络，有输入层、卷积层、下采样层、全连接层和输出层，通过反向传播优化网络结构，求解未知参数。

1．1 特征提取

通过5层深度ZF网络提取定位器支座特征。网络构建过程如图2所示[15]。

深度卷积神经网络没有一套有效理论来分析特定物体部件之间的关系，但深度网络可以非显示地计算这些特征[15]。通过深度 Faster R-CNN获得特征具有辨别性，忽略背景信息，转而提取关键信息。深度卷积神经网络从背景、颜色等低层特征开始学习，经过多层卷积，得到具有辨别性的关键特征，训练分类器。

卷积神经网络首层是输入层，由于Faster R-CNN能够主动学习二维图像的特征，故将接触网成像检测车拍摄的高铁接触网支撑悬挂装置图像经过灰度化处理作为网络输入。

网络卷积层，即为特征提取层，每个神经元的输入与输入图像的局部接受域相连，通过96个大小7×7滤波器和可加偏置(可加偏置一般设为+1)积操作，提取该局部特征。特征被提取后，其与其他特征间的位置关系也随之确定下来。不同卷积核得到不同的特征图，卷积操作示意图如图3所示。

图2 ZF网络基本框架

图3 卷积过程示意

网络下采样层，即为网络特征映射层，每个特征映射为一个平面，通过权值共享，使得平面上所有神经元的权值相等，减少了网络自由参数的个数，进而降低了网络参数选择的复杂度。通过影响函数核小的Sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。

(1)接触网成像检测车采集的接触网支撑悬挂装置图像大小为2 048×2 048。

(2)在矩阵计算中卷积核都是4维的，第一层的卷积核维度是7×7×3×96。CONV1得到的结果是110×110×96。为了能够整除，要进行填充操作，在图片周围补充像素得到卷积图像的大小。

s=(a-b+pad)/c+1 (1)式中：s为卷积得到的图像大小；a为卷积层中输入的图片尺寸；b为卷积滤波器大小；pad为填充像素；c为步长。

(3)为了降低网络参数选择复杂度，对卷积得到的结果进行下采样，得到POOL1，池化核大小为3×3，池化后图片维度为55×55×96。

(4)类似操作重复层2、3、4、5，前一层的输出作为下一层的输入。

(5)取CONV5输出的特征向量输入到区域建议网络。

ZF网络各层参数见表2。

表2 ZF网络卷积过程参数

1．2 区域建议网络

相对于 R-CNN系列其他网络，Faster R-CNN 可以看做“区域生成网络+Fast R-CNN”的系统，用区域生成网络 (RPN)代替 Fast R-CNN 中 Selective Search[16]方法，使得在精度不变的同时，速度变得更快。RPN核心思想是使用卷积神经网络直接产生区域建议，本质就是滑动窗口。RPN网络结构如图4所示[17]。假设给定600×100的输入图像，经过一系列卷积操作得到最后一层大小约为40×60的卷积特征图，最后一层卷积层共有256个卷积特征图。

图4 RPN网络示意图

在这个特征图上使用3×3滑动窗口与最后一层得到的特征图进行卷积，在这个3×3的区域上，每一个特征图上得到1个1维向量，256个特性图即可得到256维特征向量。

后边接入到两个全连接层，即分类层和回归层，分别用于分类和边框回归。分类层包含2个元素，用于判别目标和非目标的估计概率，正样本与真实区域重叠大于0．7，负样本与真实区域重叠小于0．3。回归层包含4个坐标元素(x，y，w，h)，用于确定目标位置，返回区域位置。

根据建议区域得分高低，选取前300个建议区域，作为输入进行目标检测。

2 等电位线定位与识别

在运用卷积神经网络对接触网图像提取特征对定位器支座定位过程中，分别输入50，100，150和200张高铁接触网支撑悬挂装置图像，训练等电位线识别模型。输入图片分为训练和测试两部分，其中训练图像占总数量的70%，剩下的作为测试图像，迭代次数分别为500、1 000、1 500、2 000次，学习率为0．01，表3为不同样本数量以及在不同迭代次数情况下的训练时间。

表3 不同样本数量、不同迭代次数的训练时间 s

通过输入不同训练样本数量和迭代次数组合，得到16个等电位线识别模型，通过输入600张测试图像分别检测训练得到每张图像的平均检测时间和等电位线识别模型的准确度。由表4可知，在模型训练完成之后，单张检测时间随训练数目和迭代次数的增加有所增长。

表4 不同样本数量、不同迭代次数的测试时间 s

表5 不同样本数量、不同迭代次数的准确度 s

由表5可知，在应用卷积神经网络训练模型时，需要数以万计的图像。由于接触网图像的特殊性，仅对等电位线单一物体特征提取，实行定位监测，就可以通过训练较少图像达到理想效果。

在神经网络训练过程中，迭代输出lg信息中，一般包括迭代次数、训练损失代价、测试损失代价、测试精度等。通过绘制训练曲线(图5)，不同训练图像数目训练损失代价下降幅度不同，并且都随迭代次数增加而不断下降，200张图片迭代2 000次，训练损失较小，达到较好的训练效果。

图5 训练损失代价曲线

图6为输入200张图像迭代2 000次训练得到的定位结果。图6(a)是经过第一级Faster R-CNN获得的定位结果；图6(b)是截取定位结果，用于下一步故障检测。

图6 定位器支座定位效果

3 等电位线散股故障检测

在运用卷积神经网络对上一步定位得到的接触网定位器支座图像中，200张散股故障图片分为训练和测试两部分，其中训练占总数量的70%，剩下图像作为测试图像，设其迭代次数为2 000次，学习率为0．01。

图7 等电位线散股故障分类

依据经验将等电位线散股故障分为两类：局部严重散股，如图7中标识1的方框和轻微散股，标识为2的方框。至于等电位线轻微散股故障，经过多次实验分析，设SA为等电位线的全部面积，S1，S2，…，Sk为检测故障方框面积且大小依次递减，S为所有方框面积之和，统计图像库中轻微散股图片，根据经验取值可制定如下状态判据：

(1)若S/SA≥0．072，则为等电位线轻微散股状态。

(2)若S/SA<0．072，则为正常状态。

以上判据中阈值数据均为经验取值，能够较准确地判断等电位线轻微散股故障，为维修工人提供维修依据。等电位线局部严重散股故障可直接由卷积神经网络定位得出发出预警，如图8所示，防止等电位线故障引起其他接触网问题，造成不可挽回的损失。

图8 等电位线局部严重散股故障

4 实验分析

使用上述方法对接触网成像检测车拍摄到的2 000张高铁接触网支撑悬挂装置图像进行实验检测。含有等电位线部件的图片有1 400张，其中等电位线出现散股故障的图片有100张，实验检测结果见表6。

表6 等电位线故障实验检测数据

由表6可知，算法在等电位线部件的定位提取中有较高的准确率，且检测速度可满足实时性。等电位线出现定位错误主要是由于该处接触网部件拍摄角度出现遮挡，发生遮挡重叠，如图9所示，造成定位判断错误。

图9 等电位线散股故障检测算法实现框架

5 结束语

本文基于数字图像处理技术，采用卷积神经网络Faster R-CNN实现等电位线的定位以及散股故障，成功率较高。实验结果表明，基于级联Faster R-CNN能有效定位提取等电位线部件并正确判断零件故障，相比传统的人工筛查方式具有较高的检测效率，为接触网支撑装置零部件故障判断提供了技术参考。