孙次锁,刘 军,秦 勇,张玉华
(1.北京交通大学 交通运输学院,北京 100044;2.中国铁道科学研究院集团有限公司 基础设施检测研究所,北京 100081)
超声波探伤在铁路领域有着广泛的应用[1],钢轨探伤车采用超声波检测原理对在役钢轨内部伤损进行检测,通过对检测数据进行分析以判断钢轨中是否存在伤损。目前既有探伤车检测数据分析软件(既有系统)对检测数据进行自动分析存在误报率高的问题,而且存在伤损漏报。为确保不发生伤损漏报、降低误报率,需要在既有系统分析基础上再次进行人工分析,即需对检测数据进行2次分析,存在效率太低的问题。
为提高数据分析软件对钢轨伤损识别的准确率、降低误报率,现有的方法主要是人工选取检测数据的分类特征,再设计分类器进行钢轨伤损分类。如文献[2]利用“不同类型的伤损超声回波信号中的频率成分的能量不同”特点,对超声波回波信号的频带特征进行提取,对发现的裂纹、气孔、缩松、夹渣进行分类。文献[3]提出“谱分析处理技术”的改进算法,采用非监督机器学习方法,分析每个类别的缺陷概率和假象概率,降低数据中虚假信号的影响。文献[4]采用神经网络算法对检测数据的处理进行了研究,通过通道信息、闸门信息、对象位置、对象长度、开始深度、截止深度、返回信号的幅值7个特征训练10个神经网络,以对10种钢轨缺陷类型(包括无缺陷)进行伤损识别与分类。文献[5—8]采用人工选取分类特征的方式对钢轨伤损进行分类,在这种方式中,钢轨伤损识别的效果依赖于特征选取的准确、全面程度,对认识不足的伤损特征会有遗漏,存在伤损漏判和误判率高等问题。
近年来,深度学习技术由于具有自动特征提取特性而受到越来越多的关注,如文献[9]将深度学习技术应用于铁道塞钉的自动检测,以相机获取的图像作为输入。而钢轨探伤车检测数据与传统图像特点不同,无法直接应用。
本文将检测数据视为由16个通道二进制矩阵叠加而成的图像,通过预处理,将“物体检测”问题转换为“分类”问题。设计了基于深度学习的钢轨伤损智能识别模型,并将其识别结果与钢轨探伤车既有系统识别和人工分析结果进行对比,以验证智能识别的有效性。
在钢轨探伤车每侧钢轨处设置有3个超声波探轮、共16个超声波闸门,每个闸门视为检测数据的1个通道,如图1所示。图中:闸门编号为1—16,每个闸门名称由“前/后+外/中/内/斜+角度+检测部位”组成,其中列车前进方向为“前”,前进方向的反方向为“后”,远离轨道中心线的方向为“外”,靠近轨道中心线的方向为“内”,“内”“外”之间的为“中”,倾斜安装,贯穿“中”和“内”的为“斜”;检测轨腰和轨底的超声波闸门没有“内/外”之分,仅有“前/后”。如“前外70°轨头”代表“钢轨探伤车前进方向、外侧、70°检测轨头的超声波闸门”。各闸门编号及名称说明见表1。
图1 钢轨探伤车单侧超声波闸门位置示意图
闸门编号闸门名称闸门编号闸门名称1前外70°轨头9后外70°轨头2前中70°轨头10后中70°轨头3前内70°轨头11后内70°轨头4前45°轨腰12后45°轨腰5前45°轨底13后45°轨底6前0°轨腰14后0°轨腰7前0°轨底15后0°轨底8前斜70°轨头16后斜70°轨头
以前0°轨腰闸门检测钢轨轨腰螺孔为例,其B显数据生成原理如图2所示。图2(a)中,灰色箭头表示超声波遇到轨腰螺孔后发射,反射信号被超声波传感器接收放大,与前0°轨腰闸门阈值进行比较,反射信号的电压幅值若超过前0°轨腰闸门阈值,反射信号会被记录,并显示在B显图像中。由于轨腰螺孔阻挡,前0°轨底闸门内的反射波电压幅值将小于前0°轨底闸门阈值,在钢轨底部形成底波消失,螺孔反射的前0°轨腰闸门与前0°轨底闸门B型图像如图2(c)所示,在进行人工分析时,依据此超声波B显图像进行分析。分析后的B显数据的数据格式如图2(d)所示,图中表格的“行”代表超声波回波信号在钢轨中的深度,每行高度为钢轨轨高的1/128;表格的“列”代表钢轨里程片段,每列宽度代表0.8 mm。
从图2(d)看出,在前0°轨腰闸门螺孔发射信号和前0°轨底闸门底波消失信号所在位置的数据为“1”,其他无超声反射信号位置的数据为“0”(图中未显示)。因此对于每个钢轨探伤车检测数据文件,B显数据用二进制稀疏矩阵表示,矩阵行数l为128,列数c为
(1)
式中:d为每个超声波检测文件中检测的公里数。
将每个超声波闸门看作B显图像中的1个通道,则每个钢轨探伤车检测数据文件可以看做是由16个通道的二进制矩阵叠加而成。
图2 B显数据生成原理
参照既有的钢轨探伤车检测数据分析软件中划分的钢轨伤损类别,将钢轨伤损类别分为12类,各类别依次为无伤(含正常螺孔、导线孔)、内侧轨头核伤、外侧轨头核伤、内中外轨头核伤、内中轨头核伤、中外侧轨头核伤、轨底中心区伤损、螺孔裂纹(含斜裂、水平裂)、轨头垂直劈裂、轨腰分离、轨腰裂纹、其他伤损。钢轨探伤车检测数据(简称B显数据)以B显图像的形式显示,如图3所示。其中图的横轴为检测里程,纵轴为电压幅值超过闸门阈值时超声波回波信号在钢轨中的深度。
图3 12类钢轨伤损B显图像
图3中蓝色横线代表轨面、轨鄂、轨底、轨腰轨底结合部。正常钢轨中,钢轨各部分材质均匀连续,各个超声波闸门均无反射信号,因此B显数据中各超声波闸门值均为“0”。从图3(a)看出,螺孔状态正常、无伤,由于螺孔的存在,前45°轨腰闸门、后45°轨腰闸门、前0度轨腰闸门、后0度轨腰闸门存在反射点,它们的超声波闸门值为“1”,但螺孔为有缝线路中正常结构,并非钢轨伤损;从图3 (b)—(l)看出,钢轨中均存在伤损,相应的超声波闸门值为“1”,需要报警,提示钢轨维修部门进行及时维修。各超声波闸门为便于操作员进行伤损识别,采用不同颜色、不同方向的图标表示。
B显数据可以看做16通道的B显图像,则图像大小为16×l×c,与普通图像分类相比具有如下特点。
(1) 普通图像一般为3个通道,B显图像为16个通道,图像通道数目多。
(2) 普通图像中特征会旋转、缩放,像素值随光线变化,B显图像中特征无旋转、无缩放,像素不随光线变化,但受电信号噪声影响,且噪声信号与检测速度、检测参数设置等多种因素影响,无明显规律可循。
(3) 在钢轨中的固定特征如螺孔、导线孔等,仅从单幅图像无法识别,需要从图像与图像间距(在钢轨中的距离特征)中寻找规律。
(4) 受超声传感器安装位置影响,B显图像各通道间相对距离与具体传感器安装位置相关,会影响钢轨伤损识别。
(5) 图像识别中训练集和预训练的网络模型可免费下载使用,B显图像中钢轨伤损识别需要自行建立扩展训练集。
从上述特点来看,B显图像识别并不是简化了的普通图像识别,B显图像独特的特点使普通图像识别算法无法直接应用。
深度学习因其可以自动对特征进行逐层抽象学习的特点而受到越来越多的关注,下文将深度卷积神经网络应用于B显图像的伤损识别,设计了伤损识别网络架构,并针对该架构进行训练和精调。
基于AlexNet卷积神经网络架构,针对B显图像特点进行修改设计,得到的钢轨伤损智能识别网络架构如图4所示。
图4 钢轨伤损智能识别网络架构(单位:像素)
钢轨伤损智能识别网络架构共10层,包括1个输入层,3个卷积层,3个池化层,2个全连接层, 1个输出层。在该网络架构中,进行了如下改进。
(1) 输入图片为从整个检测文件中滑动取出,大小为128×128×16像素,滑动步长为42像素,该大小可确保单个超声波回波群都能够完整输入到伤损识别网络架构中。
(2) C1卷积层通道数为50个通道,其中有48个通道为全连接通道。第49个通道为部分连接通道,由输入层的前0°轨腰、前0°轨底、后0°轨腰、后0°轨底闸门共4个输入通道卷积而成,此4个通道实际为对钢轨进行了2次检测,数据具有强相关性;第50个通道为部分连接通道,由输入层的前45°轨腰、后45°轨腰共2个通道卷积而成;这2个通道在轨头接缝由于接头原因而相互转换。
(3) 池化层采用均值池化方法,均值池化方法可以有效消除由于耦合不良造成的超声波杂散点。
(4) 输出层输出钢轨伤损类别,除无伤外,其他钢轨伤损类别均需使用方框将B显图像中相关像素框出,并在钢轨下方显示类别符号。
(5) 分类输出采用softmax函数进行输出得分的归一化。softmax函数为
(2)
式中:pi为输入B显图像属于第i类的预测概率;ai为输入B显图像属于第i类的得分;aj为输入B显图像属于第j类的得分。
钢轨伤损智能识别可看作是“物体检测”问题,即在给定的B显示数据中精确找到钢轨伤损所在位置,并标注出钢轨伤损的类型。在1张B显图像中,可能在不同位置存在多个类型的钢轨伤损。
B显数据预处理包括噪声预处理和通道预处理。检测中的噪声来源主要为耦合不良、电子电路干扰噪声、钢轨中粗大晶粒等,在B显图像上噪声表现为单点杂波或与超声波传感器角度不符的多点连续图形。在钢轨伤损检测中,对于少于3个反射回波点的小伤损可以忽略,采用“8邻域点连续性判断”方法可以将单点杂波、与超声传感器角度不符的多点连续波形、可能为小伤损的B显图像中的噪声等进行屏蔽。
钢轨探伤采用不同的超声波闸门检测不同类型的伤损,因此,将不相关的超声波闸门可以进行通道预处理,将相关联的超声波闸门信号进行提取,不相关联的超声波闸门信号进行屏蔽,B显数据通道预处理如图5所示。图中处理前后的数据均为128×128像素。由图5看出,可将1幅16个通道的B显图像依照相关性处理为4幅16个通道的B显图像,并针对每1幅处理后B显图像中的邻域点进行超声波回波信号群划分,确保预处理后的每1幅B显图像中仅含有1种伤损类型,伤损数量为1个, 通过B显图像通道预处理,将“物体检测”问题转换为“分类”问题。
图5 B显数据通道预处理(单位:像素)
基于钢轨伤损智能识别的网络架构建立深度卷积网络模型,其训练采用深度学习框架TensorFlow实现,硬件环境为i5-6500 CPU(频率为3.20GHz),64位操作系统,NVIDIA GeForce GTX780Ti台式机,安装了CUDA9.0和cuDnn8.4.0系统。
训练B显图像采用钢轨探伤车在某地的人工伤损标定线上的检测得到的B显数据作为训练样本集。人工伤损标定线单侧钢轨中,人工伤损布置如图6中红色图形所示。该人工伤损标定线依照标准GB/T 28426—2012 《大型超声波钢轨探伤车》[10]要求,设置人工伤损24处,每侧12处。
图6 某地人工伤损标定线单侧钢轨人工伤损布置
图6中的人工伤损标定线也作为钢轨探伤车年检标定线使用,因此积累了不同钢轨探伤车标定时采集到的大量B显数据。同时,对每个B显数据样本中伤损回波数据在横向方向位置移动扩充样本数据,得到螺孔裂纹类B显数据样本共79 200个,轨头核伤B显数据样本数92 400个,轨底中心伤B显数据样本数42 240个,其他伤损B显数据样本数13 200个,其他无伤B显数据样本数92 400个。因为每类B显数据样本数不均衡,采用smote算法进行过采样,使任意两类B显数据样本数比例接近1∶1。
将各类B显数据样本集随机选取80%作为训练集,剩余20%作为测试集。训练过程中采取Early Stopping和dropout方法防止过拟合。在训练集上训练每5轮后计算验证集的准确性,连续15轮后准确性不再提高则停止迭代。在Fc1和Fc2全连接层采用dropout方法,在训练过程中全连接层的某些神经元按50%的概率进行关闭连接。
每种类别下都可得到测试样本为该类的得分值,可绘制出12条受试者工作特征曲线(ROC曲线),最后对12条ROC曲线取均值,经过对钢轨伤损智能识别模型的参数进行精调,选择了曲线下面积(AUC)为0.927的ROC曲线代表的模型作为最终模型,最终模型的ROC曲线如图7所示。
图7 深度卷积网络模型ROC曲线
为进一步验证深度卷积网络模型的分类性能,在设置于另一地点的人工伤损试验线连续采集了10次检测数据。人工伤损试验线上每侧钢轨设置6段,各段人工伤损布置如图8中红色图形所示。每段钢轨长6.25 m,均钻标准螺孔,共加工轨头、轨腰、轨底各类人工伤损数量106个,两侧钢轨人工伤损数量合计212个。对该线路连续进行10次检测,人工伤损数量共2120个。深度卷积网络模型识别出的螺孔裂纹类伤损识别结果如图9所示,图中用红色矩形框框出部分为1个螺孔裂纹类伤损,两侧钢轨各识别出10处螺孔裂纹类伤损。
图8 人工伤损试验线各段钢轨人工伤损布置图
图9 深度卷积网络模型钢轨伤损识别结果
结果统计中,深度卷积网络模型对检出的人工伤损分类正确,视为“伤损识别”; 对检出的人工伤损分类错误,视为“伤损误报”。钢轨伤损识别率TP和误报率FP分别为
(3)
(4)
式中:nr为第r类人工伤损中系统识别且分类正确的伤损数量,r=1,2,…,12;N为人工伤损试验线路上的人工伤损总数;fr为人工伤损试验线路上的第r类人工伤损中系统分类错误伤损数量;f0为人工伤损试验线路上的识别出的非人工伤损数量。
采用既有系统、设计的深度卷积网络模型、人工识别3种方式对伤损试验线检测得到的B显数据进行识别,各类钢轨伤损识别准确率与误报率对比结果如图10、图11所示。由图10和图11看出,设计的深度卷积网络模型在伤损准确率指标、误报率指标上总体识别结果优于既有系统,与人工判别结果接近,仅通过模型识别即接近既有系统分析后再进行人工分析的结果,提高了检测数据分析效率,具有实用性。
图10 12类伤损的准确率
图11 12类伤损的误报率
通过分析B显图像识别与传统图像识别的特点,将超声波B显图像看作是16个通道图像,并通过B显图像通道预处理,将“物体检测”问题转化为“分类”问题,设计了基于AlexNet框架的深度卷积网络架构,并依照B显图像特点,确定了各层深度卷积网络的具体参数组成;建立了B显图像训练样本库和验证样本库,采用Early Stopping和dropout方法对深度卷积网络架构进行训练精调,建立了深度卷积网络模型;并将基于该模型的伤损识别与人工判别、既有系统识别进行对比。结果表明,基于深度学习的钢轨伤损智能识别模型在准确率、误报率指标上均优于既有系统,达到人工分析的指标,验证了提出的深度卷积网络模型的有效性。