庞荣,余志斌,熊维毅,李辉
(西南交通大学 电气工程学院,四川 成都 610031)
基于深度学习的高速列车转向架故障识别
庞荣,余志斌,熊维毅,李辉
(西南交通大学 电气工程学院,四川 成都 610031)
摘要:为提取高速列车转向架关键部件振动信号的特征,提出基于深度学习(Deep Learning)的高速列车转向架故障识别新方法。以转向架关键部件非全拆单工况故障信号为研究对象,对故障信号进行离散傅里叶变换,然后依据深度学习的降噪自动编解码过程对故障的频域信号进行特征学习,并以此特征作为BP神经网络的输入实现转向架故障信号的识别。实验结果表明:在不同速度下,所提方法对转向架关键部件非全拆故障识别正确率能达到100%,表明了该方法的有效性。
关键词:深度学习;离散傅里叶变换;高速列车;转向架
随着高速列车的飞速发展,列车的安全稳定运行变得尤为重要。金学松等[1]总结了引起高速列车运行安全的主要因素是关键零部件失效和重大自然灾害。转向架是高速列车走行部的重要组成部分,其机械性能的优劣对整个高速列车系统运行的可靠性和安全性都有着非常重要的影响,因此,高速列车转向架关键部件的性能检测及故障诊断方法在实际应用中有着重要的意义[2]。由于转向架发生故障的机理复杂,特征信号不明显,利用常规的信号处理方法很难有效提取故障信息及对转向架故障做出正确识别[3]。因此,随着对高速铁路安全的重视,研究出准确率高的转向架故障识别方法变得越来越迫切。黄照伟等[4]从动力学方面研究了高速列车车轮磨耗与高速列车运行性能的关系。史红梅等[5]研究了列车蛇行运动稳定性以及不同线路和速度下高速列车振动性能。这些成果对实施高速列车运行状态的跟踪监测提供了理论基础,并获得了大量的跟踪监测数据。[6]如何从振动数据中准确地分析出高速列车故障特征及分类是一个亟待研究的问题。张兵等[3,6]研究了监测数据中的均值、三阶原点距及中心距、以及自相关系数的衰减度对走行部的横向失稳。孙永奎[7]通过多重分形理论分析了转向架3种典型全拆工况故障。由于高速列车转向架工况故障的复杂性,戴津等[8]的方法均未能充分反映监测数据所包含关键部件变化时动力学的信息特征和考虑到列车实际运行情况即很少出现全拆工况故障。同时,这些方法均需要人为设计并选择转向架故障信号特征,其缺点是耗时,且工作量大。近年来,Hinton等[9-10]基于人脑学习的思想提出了一种深度学习的机器学习方法。深度学习也称深度神经网络,该方法是一种多层无监督神经网络学习法,具有多非线性映射的深层结构,可以完成复杂的函数逼近;它通过无监督训练逐层学习算法以获取输入数据的主要驱动变量和数据的分布式特征。Dahl等[11-12]分析论证了深度学习对非平稳信号特征学习的有效性,并应用于语音信号识别中,在标准TIMIT语音数据库中取得当前最好的效果。深度学习可通过深层网络自动学习有效表征关键信息的特征,以提高识别精度,并且减少了人为设计特征的缺点。因此,本文基于深度学习思想提出一种新的转向架故障工况识别方法,以期获得更高的识别精度。将该方法应用于非全拆工况故障信号特征提取并分类识别,实验结果表明了该方法的有效性。
1深度学习理论
Hinton等[13]提出的自动编码器模型如图1所示,其数学描述可表示为:
y=fθ(x)=s(Wx+b)
(1)
(2)
其中θ′={W′,b′},其中W和b′分别为W和b的转置。通过训练数据最小化互熵LIH(x,z),使重建信号z和原始输入x之间误差尽量小。
minLIH(x,z)=min{-∑j[xjlogzj+
(1-xj)log(1-zj)]}
(3)
图1 基本自动编码器模型Fig.1 Structure diagram of autoencoders
图2 图2 降噪自动编码器模型~qD(|x)(“⊗”表示置0)Fig.2 Structure diagram of denoising autoencoders
深度学习使用前馈型神经网络即是堆叠多个神经元层,并且每一层的输出作为高一层的输入,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间来学习对原输入具有更好表征的特征。如果将学习结构看作一个网络,则深度学习的核心思想可描述如下:1)无监督学习用于每一层网络的预训练;2)每次用无监督学习只训练一层,将其训练结果作为其高一层的输入;3)用无(有)监督训练来调整所有层(加上一个或者更多的用于产生预测的附加层)。
基于上述思想,对原始输入信号x,首先使用大量的无标注的数据通过无监督学习的算法来进行模型参数的初始化,称模型预训练(Pre-training)。其中Pre-training主要是通过逐层训练降噪自动编码器得到一个多层的编码器模型,然后使用较少量的标注数据,利用传统的神经网络的学习算法(如BP算法)来学习模型的参数,称模型微调Fine-tuning。当把DAE应用于分类等任务时需要在DAE的顶层添加一个与深度学习模型训练目标相关的Softmax输出层或线性回归层,形成具有初始化网络参数的深度学习(连接Softmax输出层网络参数除外,该层参数通常可随机初始化)。则Softmax输出层对应深度学习的输出目标值。该模型采用无监督逐层预训练优化网络和有监督微调整个网络构成深度学习模型称为堆叠降噪自动编码器模型(Stack Denoising Autoencoders, SDAE)如图3所示。
图3 深度学习模型Fig.3 Structure diagram for SDAE
通常对于处理连续非平稳的信号如振动信号和声音信号等,首先先对信号进行离散傅里叶变换(discrete Fourier Transforms, DFTs)得到信号的频域信号[11],然后采用无监督的预训练得到一个多层的DAE模型。最后经DAE初始化的深度学习进一步通过传统的BP算法对网络参数进行监督微调。
基于深度学习的振动信号(SDAE)算法流程图如图4所示。
图4 深度学习算法流程图Fig.4 Flow chart of deep network algorithm
2实验分析及结果
实验采用车体及转向架仿真模型如图5所示,该模型依据牵引动力国家重点实验室机车车辆整车滚动振动试验台,基于多体动力学SIMPACK软件平台,搭建的列车振动仿真模型。
(a)整车模型;(b) 转向架模型图5 高速列车仿真模型Fig.5 Simulation model of the high-speed train
仿真模型由1个车体,2个构架和4个轮对构成;列车上装有58个传感器通道,高速列车走行部主要零部件含有4个二系空气弹簧(成对)、4个横向二系减震器及8个抗蛇行减震器。仿真机车运行工况主要涉及列车正常状态和非全拆的单故障包括单个横向减振器失效、单个抗蛇行减振器失效、一对空气弹簧失气)。每种工况下运行速度按照80 ,120,140,160和200 km/h。每种速度下运行3.6 min并记录传感器数据,采样频率为243 Hz。实验数据截取2s即486个采样点为一个样本,每种工况样本数为100个,将样本随机二等分为训练样本和测试样本。由实际列车运行情况可知,当列车发生故障,单个零部件坏的可能比全部零件坏的可能性更大,因此,实验选取了所有工况单个关键部件故障作为实验对象,研究并分析单个部件失效对列车运行状态的影响,即本文主要针对分析单个故障工况在转向架上的振动信号特征,其更具有实际意义。
本文实验采用深度学习模型为SDAE,输入层的结点数为DFT变换后的特征维数,输出层结点个数为故障的分类数。其余初始化参数选取通过200次以上测试选取最优参数,参数初始化见表1。实验环境:主频为2.8 Hz的4核CPU电脑及Matlab2013b。为了确定深度神经网络的层数,采用文献[13]方法确定层数,层数和识别率之间关系如图6所示:
图6 隐含层层数与分类正确率关系Fig.6 Relationship between hidden Layer numbers and the dassification accuracy
由图6可知,对于转向架振动信号,本文将隐含层确定3层进行实验。
表1 SDAE模型参数
识别正确率定义如下:
(4)
式中:ρ表示识别正确率;N表示测试样本总数;r表示正确识别样本数。所有实验正确率均是试验10次所得平均值,振动信号时域如图7所示。7(a)表示列车正常状态;7(b)表示单个横向减振器失效;7(c)表示单个抗蛇行减振器失效;7(d)表示一对空气弹簧失气。
图7 正常状态与非全拆单个故障工况失效时域Fig.7 Time domain chart of the normal state and single fault
按照1.3节所提出的算法流程,首先对振动信号进行DFT变换,变换后信号如图8所示。由图8可看出,相对于正常状态,当转向架出现单个故障工况时,频域信号有一定差异性(b,c和d)的幅值比a的幅值略小;而单个故障工况之间的差别不大。然后对DFT变换后的信号采用深度学习进行特征学习,获得振动信号的有效特征并进行分类识别。
图8 正常状态与非全拆单个故障工况失效频域Fig.8 Spectrum of the normal state and single fault
当深度学习训练后,使用文献[14]所提的t-SNE方法(t分布的随机邻近嵌入),该方法根据两点之间的相似度为思想进行聚类分析,可用于高维数据在二维或者三维空间上的数据点位置的可视化,采用该方法可视化4种工况样本的分布图,如图9所示。
图9 正常状态与非全拆单个故障工况有效特征Fig.9 Feature map of the normal state and single fault
从图9中可以清楚地看到正常状态(a)和单个故障(b,c和d)样本之间有很大的距离,而单个故障样本之间大部分也能区分开,但有少量的样本存在交叠的情况,因单个故障振动数据之间差异性较小。将深度学习(SDAE算法)与传统的BP神经网络进行对比分析实验,实验结果见表2。
表2 通道1算法性能对比
从表2中可看出,由于传统的BP神经网络可能陷入局部极值,与深度学习方法相比,其总体平均识别率较低、算法运行耗时较长。深度学习正是克服了传统神经网络易陷入局部极值的缺点,大大提升了训练速度,同时也获得了较好效果。
对各种速度下的各种故障工况采用深度学习对特征进行自动学习并分类识别正确率如表3所示。
表3 通道1各工况识别平均正确率
表3中可看出正常状态在各种速度下都能达到100%的识别率,即采用该方法可以较准确的判断出正常和非正常状态。而对于非全拆单个故障工况之间也能达到较高的识别率,表明该方法对各种故障工况能进行有效识别。表3中还可看出,空气弹簧失气(d)识别率相对较低,因通道1为车体中部横向加速度振动信号,该通道主要检测横向的振动信号,对抗蛇行减振器故障和横向减振器故障有比较好的敏感度,而对空气弹簧失气敏感度小;而随着速度降低,空气弹簧失气(d)工况识别率有小幅度下降,因速度较低时,通道1(横向加速度振动信号特征)对垂向的空气弹簧故障敏感程度有所下降。
3结论
1)提出将深度学习算法应用于高速列车转向架故障诊断,采用深度学习逐层学习振动信号中有效表征状态信息的特征,并采用BP神经网络进行故障识别。对高速列车的4种典型的非全拆工况进行工况识别。
2)实验结果表明深度学习能够充分表征高速列车的运行状态,对非全拆故障识别正确率能达到100%。为高速列车的故障信号诊断提供了一种新的思路,对高速列车实际的运行决策有重要意义。
3)实验数据均为转向架阻尼部件非全拆故障工况数据,而实际转向架阻尼部件的故障常常是渐变的,因此下一步研究的重点和难点是在于研究探讨深度学习算法对转向架故障渐变参数。
参考文献:
[1] 金学松,郭俊,肖新标,等.高速列车安全运行研究的关键科学问题[J].工程力学,2009,12(增2):8-22,105.
JIN Xuesong, GUO Jun, XIAO Xinbiao, et al.Key scientific problems in the study on running safety of high speed train[J].Engineering Mechanics,2009,12(Suppl 2):8-22,105.
[2] 王新锐,丁勇,李国顺.铁路货车可靠性试验方法及评价标准的研究[J].中国铁道科学,2010,31(1):116-122.
WANG Xinrui, DING Yong, LI Guoshun.Study on the reliability test method and evaluation specifications of railway freight car[J].China Railway Science, 2010,31(1):116-122.
[3] 张兵.列车关键部件安全监测理论与分析研究[D].成都:西南交通大学,2008.
ZHANG Bin.Study on the theory and analysis of the key components of train safety monitoring [D].Chengdu:Journal of Southwest Jiaotong University,2008.
[4] 黄照伟,崔大宾,杜星,等.车轮偏磨对高速列车直线运行性能的影响[J].铁道学报,2013,35(2):14-20.
HUANG Zhaowei, CUI Dabin, DU Xing, et al.Simulation on wheel wear prediction of high-speed train[J].Journal of the China Railway Society, 2013,35(2):14-20.
[5] 史红梅,余祖俊,周佳亮.不同线路条件及运行速度下高速列车振动性能分析[J].北京交通大学学报,2012,36(1): 112-116.
SHI Hongmei, YU Zujun, ZHOU Jialiang.Vibration analysis of high-speed vehicles under the conditions of various speed and lines[J].Journal of Beijing Jiaotong University, 2012,36(1): 112-116.
[6] 陆啸秋,赵红卫,黄志平,等.高速列车运行安全监控技术[J].铁道机车车辆,2011,31(2):34-37,81.
LU Xiaoqiu, ZHOU Hongwei, HUANG Zhiping, et al.High-speed train running safety monitoring technology[J].Railway Locomotive & Car, 2011, 31(2):34-37,81.
[7] 孙永奎,余志斌,金炜东.基于多重分形与SVM的高速列车运行状态识别方法[J].西南交通大学学报,2015,50(1):7-12.
SUN Yongkui, YU Zhibin, JIN Weidong.Recognizing running state of high-speed train based on multifractal theory and SVM [J].Journal of Southwest Jiaotong University,2015,50(1):7-12.
[8] 戴津,刘峰,董孝卿,等.基于同一转向架历史对比与同一列车横向对比的转向架状态监测[J].铁道机车车辆,2010,30(2):26-29,37.
DAI Jin, LIU Feng, DONG Xiaoqing, et al.Bogie condition monitoring based on comparing historical date of one bogie and date of all bogies in one train[J].Railway Locomotive & Car,2010,30(2):26-29,37.
[9] Hinton G E, Salakhutdinov R.Reducing the dimensionality of data with neural networks[J].Science, 2006,313(7):504-507.
[10] Hinton G E, Osindero S, Whye Y.A fast learning algorithm for deep belief nets [J].Neural Computation, 2006(18):1527-1554.
[11] Dahl G E, DONG Yu, LI Deng, et al.Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition [J].IEEE Transactions on Audio, Speech, and Language Processing, 2012(20):30-42.
[12] Mohamed A R, Dahl G E, Hinton G E.Acoustic modeling using deep belief networks [J].IEEE Transactions on Audio, Speech & Language Processing,2012(20):1-9.
[13] Vincent P, Larochelie H, Lajoie I, et al.Stacked denoising autoencoders: learning useful representations in a deep network with a local denoising criterion[J].Journal of Machine Learning Research, 2010(11): 3371-3408.
[14] Maaten L J P, Hinton G E.Visualizing high-dimensional data using t-sne [J].Journal of Machine Learning Research, 2008(9):2579-2605.
(编辑蒋学东)
Faults recognition of high-speed train bogie based on deep learning
PANG Rong, YU Zhibin, XIONG Weiyi, LI Hui
(School of Electrical Engineering,Southwest Jiaotong University,Chengdu 610031,China)
Abstract:To extract the features of vibration signals of high-speed train bogie, a novel approach, which is based on Deep Network, was proposed to recognize the faults of high-speed train bogie.Fault signals were obtained from non-whole single fault of key components of bogie.The discrete fourier trandform was conducted to the fault signals and then a denoising autoencoders was presented to abstract features of vibration signals.Based on the deep learning concept, a deep network was build to recognize the faults of high-speed train bogie.The experimental results show that the recognition rate is 100% for non-whole fault of key components of bogie at the different speed, which verified the effectiveness of the proposed method.
Key words:deep learning; discrete fourier transforms; high-speed train; bogie
通讯作者:余志斌(1977-),男,湖南宁乡人,教授,博士,从事模式识别与人工智能研究;E-mail:zbinyy@126.com
基金项目:国家自然科学重点基金资助项目(61134002);中央高校基本科研业务费专项资金资助项目(2682014CX029)
收稿日期:2015-04-11
中图分类号:TP391
文献标志码:A
文章编号:1672-7029(2015)06-1283-06