武晓春,温昕
(兰州交通大学 自动化与电气工程学院,兰州 730070)
铁路道岔是铁路系统最重要的线路连接设备之一,包括道岔和道岔转辙设备[1].对于道岔转辙设备来说,首先是依据行车要求和联锁条件将道岔转换到正确位置;其次需要检查道岔尖轨与基本轨间是否密贴,以保证行车安全。目前,道岔转辙设备状态信息的获取主要依靠现场工作人员对信号集中监测系统中道岔电流、功率等参数的调阅分析,这种方法可能导致设备出现过维修和维修不足的问题。所以,有必要采用科学方法准确掌握道岔转辙设备的实际健康状态,保证其安全可靠工作。
目前,国内外学者在道岔转辙设备健康管理与故障诊断方面取得许多成果。文献[2]提出一种相似度函数定义法,计算样本曲线与其余曲线的相似度,从而对应出故障模式。文献[3]提出将支持向量聚类(Support vector data description,SVDD)运用在道岔健康管理方面,通过对道岔动作时异常数据的捕捉,用来评估其健康状态。文献[4]利用卷积神经网络对道岔曲线特征提取,输入到门控循环单元(Gated recurrent units,GRU)中对道岔故障进行分类。文献[5]对道岔功率曲线进行特征提取和分解,结果作为故障特征参数,利用模糊聚类进行故障诊断。文献[6-11]运用神经网络:灰色神经网络,SOM 网络,BP 网络等对道岔设备的退化状态进行分类和评估。以上研究推动了道岔转辙设备故障分类和检测的技术发展,但存在以下不足:1)由于道岔转辙设备数据量大,传统算法计算力稍显欠缺,构建的设备健康因子精度欠佳,不能准确判断道岔转辙设备的健康状态;2)道岔转辙设备预测研究多为设备寿命预测,而实际现场中道岔转辙设备有规定使用年限,到期更换,故障前健康状态预测方面研究较少,无法满足设备预防修要求。
综上,本文提出一种结合SOM 和LSTM 混合神经网络的道岔转辙设备健康状态评估及预测的方法。利用SOM 算法计算健康因子,将道岔故障前的健康状态数据化;利用LSTM 算法对道岔转辙设备退化趋势进行预测,以上过程可实现对道岔转辙设备的预防修,可直观观测设备健康状况,对设备退化趋势进行预警,为现场工作人员提供决策依据。
结合SOM-LSTM 混合神经网络的健康状态分析评估与预测方法主要包含3 部分内容(数据预处理、健康状态评估和健康状态预测),总体流程图如图1 所示。
图1 结合SOM-LSTM 混合神经网络道岔健康状态评估与预测流程Fig.1 Assessment and prediction of switch equipment health status combined with SOM-LSTM hybrid neural network algorithm
1)数据预处理:根据道岔转辙设备功率曲线数据特点,分3 段提取时域参数,得到特征参数集。
2)健康状态评估:利用SOM 神经网络中的最小量化误差算法计算道岔转辙设备的健康因子,得到表征其健康状态变化的HI 曲线。
3)健康状态预测:采用LSTM 神经网络对道岔转辙设备后续健康因子进行预测,判断其健康状态。
由于道岔正常动作一次大约可采集165 个功率数据,数据冗余且繁杂,需要对原始数据进行处理,以得到适合神经网络输入维数的数据。
针对上述问题,本文提出一种结合SOM 神经网络与LSTM 神经网络的道岔转辙设备健康评估及预测方法:利用SOM 神经网络构建设备健康因子,实现对道岔转辙设备健康状态的准确判断;预测重点移至道岔转辙设备健康状态预测方面,利用LSTM 算法对设备后期健康状态进行预测。最后使用现场某车站一个季度内实际监测的600 组功率特征数据对该方法进行验证。
道岔转辙设备的功率曲线可直观反映出道岔转换时长和曲线波动状况,常被用作评估其健康状态和退化状态的分析依据。其中道岔转换时长能够大致反映出道岔在动作过程中是否有异常状况;而分析功率曲线的波动形态可较为全面的反映出道岔在动作时受到的阻力大小。因此,选取道岔转辙设备的功率曲线作为分析依据是较为理想的选择。将功率曲线分为3 个阶段:①解锁阶段、②转换阶段、③锁闭阶段,如图2 为道岔设备标准功率曲线图。针对道岔转辙设备功率曲线的3 个区段,分别提取每个区段的8 个时域特征,这些特征可从不同角度描述原始监测数据的变化性和不对称性,进而来表征整个道岔功率曲线状态和形态。8 种时域特征包括标准差(STD)、峰度(KT)、峰峰值(P2P)、偏斜度(SK)、均方根(RMS)、波峰因子(CF)、均值(Mean)和方差(Var),具体内容如表1 所示。
表1 8 种时域特征计算公式表Tab.1 Calculation formulas for 8 types of domain features
图2 道岔转辙设备功率曲线图Fig.2 Power curve of switch equipment
对选择完的特征参数进行最大最小归一化处理,以减少数据差异性对结果的影响,表达式为
式中:x∗为 归一化后数据;xmax与xmin为数据中的最大值和最小值;x为原始样本数据。
自组织映射神经网络(Self-organizing map,SOM)是一种无监督的学习方法[12],通过对数据内部规律的把握,对网络参数与结构进行自适应的改变[13]。SOM 学习过程是一个竞争过程,在竞争过程中逐步优化网络。为研究道岔设备的实际健康状态,本文运用SOM 网络中的最小量化误差算法(Minimum quantification error,MQE)[13-15]来计算健康因子,表征系统的健康状况。利用SOM 神经网络评估道岔转辙设备健康状态过程如下:
1)构建并训练SOM 神经网络
根据数据处理结果,确定SOM 网络结构。SOM网络结构分为两层:输入层和竞争层,通常输入层节点数由输入样本维数确定,本文使用的SOM 输入层节点数24 个,竞争层结构为6*6。
在构建完成的SOM 网络上以训练集数据为输入,计算输入值与各神经元的相似度(通常使用欧式距离),距离计算公式为
当某个神经元的权重向量与输入向量的欧氏距离最小时,称该神经元为最佳匹配神经元(Best matc-hing unit,BMU)[16],根据邻域半径σ确定BMU邻域内包含的点,然后通过邻域函数计算各神经元需要更新的幅度,原理是:越靠近BMU,更新幅度越大;反之,越远离BMU,各神经元需更新的幅度越小。在优胜邻域内更新节点的权重公式为
式中: θ(u,v,s)为对更新的约束,基于离BMU 的距离,即邻域函数的返回值; α (s)为 学习率;D(t)为输入层神经元;W_v(s+1)为s+1时 刻节点v的权重;W_v(s)是节点v当前的权重。
在完成一轮迭代(迭代次数 + 1)后,然后继续输入下一个样本,直到满足设定的迭代次数,完成SOM神经网络训练。
2) HI 曲线评估健康状态
将测试集数据作为道岔转辙设备特征参数输入到训练好的SOM 网络中,确定网络权值,计算对应的MQE 值,也称为设备的HI 值。最小量化误差(MQE)是源于SOM 神经网络算法的一个概念,是指输入向量与BMU 权重向量的距离,其值的大小可以衡量道岔转辙设备的健康状况。输入向量与BMU 距离越远,HI 值越大,说明此时道岔转辙设备的健康状况离基准健康状况差距越大;反之,距离越近,说明此时道岔转辙设备的健康状况离基准健康状况越贴近,状态越好。设备的HI 值计算公式为
式中:XK为 某一时刻下的数据;WK为该数据在自组织映射神经网络中的最佳匹配神经元的权值。
道岔转辙设备的健康阈值确定为设备正常状态下HI 曲线中最大MQE,即 H IMAX值,超出阈值视为健康状况不佳,以此评估设备的健康状态。
长短时记忆神经网络(Long short term memory,LSTM)是一种递归神经网络[17-19]。其作为一种特殊的循环神经网络(Recurrent neural network,RNN 网络),弥补了传统RNN 网络只能记忆短序列的缺点。
LSTM 具有使得“门”的信息增加或删除一直达到理想细胞状态的能力,这种能力是通过被称为门限的结构来实现的。门限是一种可以让信息选择性通过的方式,由Sigmoid 神经网络层和逐点相乘器组成,LSTM 包括3 个门限:输入门、忘记门及输出门[17]。图3 为LSTM 神经网络原理图,每个时间点对应一个状态Ct,此状态记录了之前的状态信息,每个时间点的Ct都可通过控制权重,遗忘等方式修整,神经元状态如同一个传送带,使信息在传送带上传播,状态却不会改变。
图3 LSTM 原理框图Fig.3 Block diagram for LSTM principles
利用LSTM 具有选择性记忆的优势,本文用作对道岔转辙设备健康因子曲线的预测。以SOM 神经网络得到的健康因子作为预测算法输入,去预测设备后续的健康因子。具体步骤如下:
步骤1 创建LSTM 网络结构,确定损失函数。本文采用均方误差(MSE)作为损失函数。计算公式为
式中:x1(i) 为 实际值;x(i)为 预测值;n为样本数目。
步骤2 初始化各个参数,为使模型准确率达到想要的精度,需对参数进行不断更新,直至损失函数收敛完成模型训练。本文采用Adagrad 优化算法对参数进行优化。
步骤3 利用测试数据在训练好的LSTM 上进行预测。
为验证本文方法的有效性,采用2021 年兰州站某道岔转辙设备2 月26 日-6 月10 日现场监测数据中600 组数据。依据常规神经网络训练集与测试集7∶3 原则,训练集数据确定420 组,测试集数据确定180 组。
根据数据处理结果,确定输入层神经元个数为24 个,竞争层神经元结构为6*6。设置其训练次数为1 000 次。构建的SOM 神经网络如图4 所示。道岔转辙设备的特征参数输入到SOM 神经网络的数据经过不断迭代之后会自动聚类。图5 给出了邻近神经元之间的距离分布,连接带的深浅可以看出距离的远近,距离越近颜色越浅。
图4 SOM 神经网络6*6 拓扑结构Fig.4 SOM neural network's 6 * 6 topological structure
图5 邻近神经元之间的距离分布Fig.5 Distance distribution between adjacent neurons
道岔第1 次到第180 次的道岔转辙设备健康因子曲线如图6 所示,可看出道岔动作在前期虽有小幅度波动但整体较为稳定。但在道岔动作第92 次和第97 次之间HI 曲线出现了尤为明显的波动,此时HI 值尖峰较高,凸起明显,说明此阶段设备健康状态发生突变。除去道岔第92 到第97 动异常状况下HI 曲线,得到道岔转辙设备正常状态下的HI 最大值为0.311 35,由此确定设备健康阈值为0.311 35,超出阈值视为健康状态不佳。
图6 道岔转辙设备HI 曲线图Fig.6 HI curve of switch equipment
图7 为道岔转辙设备第90 次到第100 次的功率曲线。图中表明道岔功率曲线在第92 动至第97 动的临近锁闭阶段出现小尖峰,说明此时道岔转辙设备健康状况不佳,与现场工作人员交流得知是由于道岔锁闭时遇到阻力。其余时间道岔功率曲线状态正常,无明显波动。此分析结果与图6 分析结果相符,佐证了SOM 算法对评估道岔转辙设备健康状态的有效性。
图7 道岔转辙设备功率图Fig.7 Diagram of switch equipment's power
2.2.1 算法评价标准
实验数据采用经SOM 算法得到的180 组HI数据,依据7:3 划分确定训练集数据126 组,测试集数据54 组。
为验证LSTM 算法对预测设备健康因子的准确性,利用平均相对误差(MRE),均方根误差(RMSE),决定系数(R2)这3 个评价指标对预测结果进行分析评价,其中平均相对误差及均方根误差越小,决定系数越趋近于1,说明算法预测效果越好。具体计算公式如下:
1) 平均相对误差(MRE)
2.2.2 算法预测结果及分析
选取RNN 神经网络与BP 神经网络做预测对比算法,确定RNN 与BP 学习率为0.001,迭代次数100次,RNN 神经网络激活函数使用Relu,隐藏层神经元个数依据经验公式求得,即
式中:m为 隐藏层神经元个数;p和q为输入输出层神经元个数,p=q= 1;a为常数,a= 10。
将道岔转辙设备用SOM 算法得到的健康因子数据作为LSTM、BP、RNN 神经网络输入,对应的预测数据作为输出,得到的实际健康因子曲线与预测值对比结果如图8 所示。从图8 中可看出LSTM、BP 及RNN 算法在道岔转辙设备健康因子预测方面都具有较好的预测效果,其中LSTM 神经网络预测结果对真实HI 曲线有着更好的拟合效果。
图8 LSTM、BP、RNN 预测设备HI 结果Fig.8 LSTM, BP, RNN prediction equipment's HI results
为进一步验证预测效果,通过MRE,RMSE 和决定系数这3 个指标对预测结果进行评价,指标计算结果如表2 所示。
表2 不同预测算法实验结果对比Tab.2 Comparison of experimental results of different prediction algorithms
分析可知:MRE 指标下LSTM 神经网络较BP 神经网络降低0.598%,较RNN 神经网络降低0.110%;RMSE 指标下LSTM 较BP 神经网络降低0.774%,较RNN 神经网络降低0.583%;决定系数指标下LSTM较BP 提高0.089,较RNN 神经网络提高0.116。数据结果表明LSTM 在预测道岔转辙设备健康因子的问题上有着更高的准确率,具有良好的预测性能。
本文结合目前铁路行业技术的快速发展,提出一种结合SOM 和LSTM 的方法对道岔转辙设备的健康状态进行评估及预测,得到如下结论:
1)对道岔转辙设备功率曲线分3 段提取时域特征参数,可有效表征整个功率曲线特征,并达到数据降维的效果。
2)利用SOM 神经网络计算得到的健康因子曲线可较好的反映道岔转辙设备的健康状况,健康阈值确定为0.311 35,对超出阈值的不良状态判断较为准确。
3)LSTM 神经网络预测效果相较于BP 神经网络和RNN 神经网络,预测平均相对误差分别降低0.598%和0.110%;预测均方根误差分别降低0.774%和0.583%,;预测决定系数分别提升0.089 和0.116,有效实现对道岔转辙设备健康因子的较精确预测。