卢 皎,禹建丽,黄春雷,陈洪根
(1.郑州航空工业管理学院 管理工程学院,河南 郑州 450046;2.黑龙江瑞兴科技股份有限公司,黑龙江 哈尔滨 150030)
我国铁路建设高速发展,极大地方便了人们的出行,同时推动了国民经济的发展。铁路运输的安全性是实现铁路整体高效运行的基本保证[1]。铁路区间广泛铺设的ZPW-2000系列无绝缘移频轨道电路是列车运行控制系统的基础设备,主要用于实现对区间的占用检查、断轨检查以及地车通讯。轨道电路的正常工作是列车安全运行的重要保障。轨道电路室外设备易受温度、湿度等复杂环境因素影响,同时也因系统各个部件运行状况等,使得轨道电路故障时有发生[2],其结果会影响铁路运营效率甚至行车安全[3]。
目前,ZPW-2000R轨道电路发生故障时,现场人员主要依赖工作经验,对设备相关部位进行数据测试,或利用微机监测数据,根据系统应用逻辑分析、电路的电气特性等对故障位置进行定位[4]。当遇到较为罕见的故障模式,故障特征较为复杂时,仅依据已有经验难以进行准确的快速故障诊断。
为了摆脱轨道电路故障诊断对人的依赖,提高故障诊断效率,增加轨道电路信号系统的安全性和可靠性,很多学者进行了轨道电路故障自动诊断方法研究。胡永杰等[5]将ZPW-2000A信号设备作为研究对象,对常见故障类型和故障原理进行分析。张振海等[6]将图论与粗糙集应用于铁路故障诊断,减少了模型的复杂度,提高了准确性。随着大数据、人工智能的发展,机器学习在故障诊断中的应用越来越广泛,如人工神经网络(artificial neural network,ANN)、支持向量机((support vector machines, SVM)、随机森林(random forest, RF)等在故障诊断中都有广泛应用[7-9]。卷积神经网络作为深度学习算法之一,解决了误差反向传播(back propagation, BP)神经网络等传统网络容易过拟合,提取特征缺失等缺陷,可有效减少网络的复杂度,具有更为强大的分类能力[10],广泛应用于信号和信息处理中[11]。许多学者尝试在故障诊断领域应用卷积神经网络,并取得了较高的诊断精度。Zhang等[12]将卷积神经网络用于高铁转向架的故障诊断中,可快速诊断转向架常见故障,对高速铁路的安全运行具有重要意义。卷积神经网络具有较强的泛化能力,Zhu等[13]用一种改进的卷积神经网络研究飞机发动机的超音速燃烧器,解决复杂的超音速燃烧器燃烧模式问题。赵冰等[14]、周雯等[15]应用卷积神经网络解决铁路关键部位缺陷检查及行车安全检查,提高了缺陷检测的准确率。
ZPW-2000R型轨道电路铺设在全国数千公里的铁路线上,工作环境复杂,故障类型、数目多,实现快速准确的故障智能诊断难度大。鉴于卷积神经网络在特征提取与模式识别方面的独特优势,本文将其应用于ZPW-2000R型轨道电路故障智能诊断研究,提出一种基于卷积神经网络模型的故障诊断方法。利用维护机监测的轨道电路实时数据对包括室内、室外设备的29种故障类型进行快速智能诊断。
卷 积 神 经 网 络(convolutional neural network,CNN),是受哺乳动物的视觉皮层细胞启发而提出的前馈性神经网络,目前广泛应用于图像识别领域[16]。CNN基本结构如图1所示,包括输入层、卷积层、池化层、全连接层和输出层。
图1 卷积神经网络结构图Figure 1 Structure of convolutional neural network
卷积层相当于图像处理中的“滤波器运算”,当图像输入到卷积神经网络后通过卷积层不断提取特征。卷积层的计算公式为
池化层即下采样,通常采用最大值池化和平均值池化,通过池化稀疏参数简化网络结构。池化层的计算公式为
其中,down为池化函数;β为第l层的网络乘性偏置。
全连接层与传统神经网络的全连接方式相同,输出为其中,f为激活函数;WT为全连接层的权值矩阵。通常在全连接层之后连接softmax、adam、optimizer等分类函数。将数值转化为对应类别的概率,softmax的输出为
其中, xn为 输出节点个数,即分类数; xm为第m个节点的输出值; Pm为网络预测出的结果,属于第m类的概率值。
本文所使用的一维卷积神经网络方法与卷积神经网络原理相似,具体操作过程如图2所示。
图2 一维卷积神经网络具体操作图Figure 2 Operation of 1D convolution neural network
根据神经网络具有监督学习的特点,将轨道电路诊断主机的实时变化数据作为神经网络的输入,将实际使用中常见的故障类型作为输出,建立输入与输出之间的映射关系。模型分为训练阶段和故障诊断阶段,如图3所示。首先,将训练数据集的实时监测数据作为输入,故障类型作为输出,训练网络的参数,不断调整网络结构,寻找最优参数。然后,将测试集的监测变量输入训练好的卷积神经网络,以此来判断网络性能。和图像处理不同,本文对ZPW-2000R的29种故障类型进行故障诊断用的是诊断主机实时监测的变量数据,用一维卷积神经网络处理更为合理。一维卷积神经网络是处理一维序列数据的一种卷积神经网络,与卷积神经网络结构相似,包括卷积层、池化层和全连接层[17]。当一维序列 X=[x1,x2,···,xn]T作为输入传入卷积层时,输出为
图3 基于CNN的轨道电路故障诊断模型图Figure 3 Fault diagnosis model of track circuit based on CNN
池化层通常选用最大池化(max-pooling)将序列长减小。
其中,p为池化层的层数。
全连接层与传统神经网络一样,有多个隐含层,传递函数可选择sigmoid函数
最后,经过softmax分类器后得到故障类型。
ZPW-2000R型无绝缘移频轨道电路结构如图4所示。ZPW-2000R主要由钢轨、室外设备和室内设备组成。ZPW-2000R无绝缘移频轨道电路发送器通过移频信号的形式向钢轨传输前方区段的车辆占用情况。当其无列车占用时,接收器接收到足够强度的轨道信号,轨道继电器吸起,相应设备显示该区段空闲。当列车进入轨道电路区间时,列车轮对起到分路轨道信号作用,接收器接收的轨道信号幅值低于轨道继电器下落门限,轨道继电器落下,相应设备显示该区段占用[18],ZPW-2000R轨道电路系统通过诊断主机等设备对每个轨道电路区段的各项主要电压、电流信号等38个变量进行实时监测。
图4 ZPW-2000R型轨道电路拓扑结构图Figure 4 Topological structure of ZPW-2000R track circuit
实验装置如图5所示,由ZPW-2000R型移频自闭系统模拟道床组成,通过模拟29种不同的故障,监测发送器、接收器、发送端变压器、发送端调谐单元、接收端变压器、接收端调谐单元等15个单元器材以及钢轨附近的电压电流共38个变量(记为[Z1,Z2,···,Z38]),由诊断主机读取并记录数据。在实际列车运行中,区段长度、载频、电缆长度以及道砟电阻的不同,都会对各个单元器材的监测变量产生影响。因此,根据不同的影响因素,选择6种不同的实用场景进行故障模拟仿真实验,采集对应的监测变量。
图5 ZPW-2000R型移频自闭系统模拟道床Figure 5 Simulation track bed of ZPW-2000R frequency shift self closing system
通过监测设备的功出电压、功出电流、发送电缆电压电流等共38个变量,得到正常状态的数据和29种故障类型的数据。各种故障类型名称如表1所示。用故障名称序号表示各类故障。通过整理得到数据集5 820组,其中,4 074组作为训练和K折验证组;1 746组作为测试组。将数据集划分为网络训练样本和测试样本,见表2。
表1 ZPW-2000R型移频轨道电路常见29种故障类型Table 1 29 Common fault types of ZPW-2000R frequency shift track circuit
表2 网络训练样本与测试样本分组情况Table 2 Grouping of network training samples and test samples
将整理后的训练样本和测试样本中的各个监测变量进行归一化处理。归一化公式为
其中,x为归一化前的数据; xnorm为归一化后的数据; xmin、 xmax为原始数据的最大值和最小值。
将训练集输入已建立的卷积神经网络模型,针对模型进行超参数调整实验,通过实验确定故障诊断准确率较高的网络参数。CNN模型中的超参数包含卷积层数、卷积核的大小、池化层数、全连接层中隐层层数、不同的优化函数以及批处理数等。通过K折交叉验证的方式确定最优参数,将训练集中的数据按照K折交叉验证的方法进行实验,将数据集分成k个子集,选择其中一个子集作为评估数据集,利用剩余k-1个子集训练模型,并用预留的子集对模型作评估;重复该过程,直到所有子集被赋予作为被评估数据集的机会,据此测试模型取不同超参数下的性能,并最终确定最佳参数。
1) 针对不同的卷积神经网络模型,需要选择不同的优化器,常用的优化方法有Adam、RMSprop、SGD、Adadelta[19]等。由于该故障诊断问题所需分类数较多,因此,采用相同的样本数,并将其他参数设置一致,通过比较分类的准确率来选取合适的优化器。由于分类数目较多,用SGD法分类效果较差,Adadelta法准确率仅为65%,而RMSprop法准确率为93.25%,Adam法准确率为95.21%,故选择Adam自适应调整学习率法[20]。Adam法的优点是使梯度经过偏置校正后,每一次迭代学习率都有一个固定范围,参数比较平稳,可加快训练速度。
2) 由于输入向量是一维数据,故设置一维卷积核。通过调整卷积层的结构发现,卷积核大小为2×1时和3×1时的准确率较为接近,约为95%;而当卷积核大小为4×1时,准确率下降到93%,故选取卷积核大小为3×1,采样宽度为2×1。卷积层用Rule作为激活函数,池化层采用MaxPooling的方法。卷积层和池化层交替,可以加深网络的深度,也可以通过较少的参数来提取较全面的特征。由于输入数据为38种监测变量,输出为29种故障类型,故障诊断输出类型较多,故采用softmax分类函数得出分类结果,全连接层设置层数为30。
3) 深度学习训练的样本数较多,如果采取单个样本的方法更新参数,会陷入局部最优,影响神经网络的性能和泛化能力,因此本文采用批处理的方式训练网络。批处理的数目较少会严重影响迭代速度,同时极易陷入局部最优;而批处理数目较多会导致无法找到最优参数,本文采用相同的样本数,并将其他参数设置一致,分别采用批处理数为16、32、40、64进行实验,分类的准确率分别为95.26%、94.35%、95.31%、92.02%。因此,选择既可以保证准确率又可以提升运算速度的批处理数40。
实验环境基于Keras的深度学习库,Tensorflow为后端,采用Anaconda的Jupyter Notebook作为Python编译器,将训练集输入卷积神经网络,采用交叉验证的方法,通过K折交叉验证获得最优超参数,迭代350次后停止训练,此时回检样本准确率达98.25%,得到训练过程中损失函数变化曲线,如图6~7所示。将测试样本输入到训练好的网络,评估神经网络的准确率。
图6 网络训练过程中准确率变化曲线Figure 6 The accuracy curve during the network training procedure
图7 网络训练过程中损失率变化曲线Figure 7 The loss rate curve during the network training procedure
利用精确率、召回率、准确率和F1-score[21]4个指标进行模型的性能分析。准确率可评估出网络的总体分类性能;通过精确率、召回率和F1-score可以看出网络对每一类型故障的分类性能。具体计算如式(9)~(12)所示。其中,TP为被模型预测为正的正样本;FP为被模型预测为正的负样本;FN为被模型预测为负的正样本;TN为被模型预测为负的负样本。TP、FP、FN、TN构成混淆矩阵。
根据式(9)~(12)可得网络的准确率为96.27%。测试集中各故障类型的预测准确个数和准确率如图8~9所示。
图8 测试集诊断结果图Figure 8 Test set diagnosis results
图9 测试集诊断准确率Figure 9 Diagnostic accuracy of test set
由图8~9可以看出,一维卷积神经网络可以诊断出29种故障类型,总体故障诊断准确率较高。训练样本的回检准确率可达98.25%,检验样本的故障诊断准确率达96%。对检验样本,故障类型1、2、3、4、6、7、9、10、11、12、13、14、15、16、17、19、20、21、22、23、24、25、26、27、28、29均有非常高的准确率(90%~100%),而对故障5、8、18的诊断准确率在80%到90%之间。
将相同的样本数据输入BP神经网络调整网络层数和参数进行网络训练。实验结果表明,在设置隐层神经元个数为150时,神经网络回检准确率仅能达到80%,且神经网络泛化能力较差,不能给出相应准确率的故障类型诊断。因此,BP等传统浅层神经网络对于输出变量较少的分类问题效果较好,但ZPW-2000R轨道电路故障诊断问题输入变量和输出变量均较多,不能使用传统神经网络进行分类,故使用卷积神经网络进行轨道电路故障诊断,准确率较高,具有可行性。
深度卷积神经网络可以挖掘同类数据内在关系,使不同类别数据之间的界限得以明确,可避免传统浅层神经网络故障诊断算法存在的训练耗时,易陷入局部极小值等问题。本文利用深度卷积神经网络的优势,通过实验研究提出了一种基于一维卷积神经网络的ZPW-2000R型轨道电路故障诊断方法。实验结果表明,用训练好的一维卷积神经网络可以直接将现场监测到的电压、电流等38个变量作为神经网络的输入,快速诊断出故障类型,且对29种故障都有较高的故障诊断准确率,有助于现场维护人员排除故障,恢复铁路运输,提高轨道电路维护维修效率和智能化水平,确保现代化铁路运输的高速、高效和安全可靠。