基于LSTM的高速列车转向架故障诊断

2018-06-17 10:48熊健

科学与技术 2018年21期

熊健

摘要：近年来，城市轨道交通运营里程的快速增长和运营安全要求的提高使得城市轨道列车安全保障技术面临着巨大挑战，转向架处于异常状态往往会体现在转向架和车体的异常振动上，根据该类机械部件在整个系统中所起的作用和性能退化程度的不同，异常振动信号的体现方式也有所不同。

关键词：转向架；故障诊断；LSTM网络模型

1.研究背景

城市轨道列车走行部转向架机械部件的振动信号一直是用来分析转向架稳定性的一个重要指标。

循环神经网络（RNN）是深度学习中一种善于处理时间序列信息的网络框架，它能够结合前面时间点的信息来分析当前时间点的信息，以此来提取时序信号内部关联性特征。由于转向架振动信号是时序信号，所以利用RNN来对其进行分析是十分符合客观规律的。LSTM网络可以通过对输入数据量、记忆量及输出数据量的控制，来对信息进行一定地取舍，以此来挖掘时序信号内部的关联特征，进而提升分析效率。

城市轨道列车转向架至关重要的一个结构为二级悬挂系统，即：一系悬挂系统和二系悬挂系统。健康状况良好的二级悬挂系统在高速列车行驶时，会对列车的安全稳定运行起到充分的保障作用，因此本文研究的主要目标就是二级悬挂系统，其本身又包括：空气弹簧、横向减振器、垂向减震器、抗侧滚扭杆及一系弹簧等几个主要部件。

本实验选择对列车时速为“120km/h”的转向架振动信号进行故障诊断。其中全拆数据每种故障的数据规格为[50370，58]，即：共计50370个时间点，每个时间均有58个通道的故障数据。

2. 数据预处理与数据集划分

1. z-score标准化：为了消除训练数据之间的尺寸差距，可以更好地训练训练集中的大量数据。训练集中的所有数据都通过z-score标准化处理，以便训练集中的每个数据在处理后符合标准正态分布，即：标准差归一，其公式如公式1所示。

（1）

其中为经标准化处理后的训练集数据，为训练集原始数据，和分别为这个原始数据的均值和标准差。经处理后的数据将作为一个单纯的数值，不再受量纲的约束，更有利于去作为模型的输入数据，也更有利于实验的分析和评价。

2. One-hot编码：为了消除数据之间的间隙大小对实验结果的影响，本文采用One-hot编码的方式对标签数据进行预处理。其中N个寄存器的编码由一个N位寄存器进行处理，每个状态都有自己独立的寄存器，且在任何时候仅仅只有一个寄存器是生效的。这种编码处理可以减少不同数据格式和不同数据维度对模型训练的影响，同时也大大提高了模型训练的精度和效率，也有利于扩大样本容量，便于样本展开。

3. 数据集划分

图1 数据集划分流程图

针对七种不同工況，每种工况均有50370个采样数据，并且每个采样数据均包含58个通道，所以共有352590个实验数据。将实验数据按1：5的比例分为测试集和训练集，即：58765个测试样本和293825个训练样本。由于故障类别的数量为7，所以训练标签设定为{1，2，3，4，5，6，7}，具体的数据集划分细节见图2。

模型对未知数据的认知能力被称为泛化能力，未经特征提取的数据视为原始数据，将原始数据划分为训练集和测试集，其中训练集为：原始数据中划分出来的所占比重较大的数据，作为模型训练的主要数据。测试集为：原始数据中分出来的小部分的数据，相对于训练集，对于所训练的网络来说测试集是完全没有出现过的，所以测试集的表现结果也最能够反应网络模型好坏。

4. 网络模型的评测标准

1）识别精确度与loss函数：估量你模型的预测值与真实值的一致程度，是一个非负实值函数，识别精确度越高或loss函数越小，模型的鲁棒性就越好。

2）混淆矩阵

混淆矩阵是一个大小均为待分类别数的误差表现矩阵。混淆矩阵的列为模型预测到相应类别的样本数，混淆矩阵的行为数据中真正属于该类的样本数。通过混淆矩阵可以直观地看到有多少数据被错误分类以及错误分类为哪一类。

3）AUC值

ROC曲线又称为受试者（即网络模型）工作特征曲线，即：以假阳性概率为横轴，真阳性为纵轴所组成的坐标图，在此坐标图上绘制受试者受到刺激后产生的曲线。AUC曲线就是ROC曲线与横纵坐标轴所围区域的面积，该值越大，说明该网络模型越好。

3.基于LSTM网络的故障诊断

3.1 训练网络·

预处理后的训练集数据用作输入数据以进入LSTM网络参与训练。LSTM网络的参数设置分以下几种：学习率（lr），批量尺寸（batch_size），故障类别数（n_classes），隐藏层神经元数（n_units）以及总迭代次数（epoch）。本次试验中，LSTM网络参数的设置如表1所示。

其中，lr是一个极其重要的参数，它的大小决定着目标函数可否收敛到局部最小值以及何时可以收敛到该值。lr过小会导致网络训练速度很慢从而无法达到最小值，本次实验采用Adam优化器逐次递减的可变lr设置方法，随着训练分批进行，lr也随之递减，这样动态地设置lr可以更好地让LSTM网络挖掘到时序信号内部的有效信息。

batch_size是小批梯度下降算法中每一批的样本数量，该算法将数据分为大小相等的多个批次，分别计算其损失函数、更新权值，batch_size越小则训练速度越快，但是太小的batch_size会导致训练精度急剧降低；batch_size越大则训练速度越慢，导致训练效率极其低下，经过大量实验，本文将batch_size设置为350。

n_classes是为已知的故障类别数。训练集中所有数据均被计算过一次，叫做一个epoch，epoch不宜过大不宜过小，通常设置范围在10-50。n_units为隐藏层神经元个数，即每个隐藏层存在的神经元的个数，具体的数据设置需要按照样本数量、网络复杂度以及硬件水平来进行调整。

LSTM网络中的Dropout仅设置到非循环的隐藏层中，否则信息会因循环而逐步丢失，Dropout仅设置在虚线部分的隐藏层中，而不会加载到参与循环的部分。

LSTM网络搭建如图3所示。

3.2 实验结果

本次基于LSTM网络的高速列车转向架故障诊断实验所得识别精确度为95.6%，识别精度、loss曲线、混合矩阵分别如图3、4、5所示。

由图4和5可知，精确率随着训练的进行从0一直上升到0.956并一直保持，loss值则一直下降，代表训练误差持续减小，直到降低为0.18并趋于稳定。图中较暗的曲线是小批量训练产生的震荡效应，在训练的后期震荡效果逐步下降，趋于稳定，实验的AUC值为0.76。

参考文献

[1]王刚，徐厚广. 浅析“一带一路”倡议对中国高速铁路发展的影响[J]. 综合运输. 2017，39（09）：6-9.

[2]宿智利. 浅谈中国高速铁路的发展现状及未来展望[J]. 才智. 2013（14）：356.

（作者单位：深圳中车轨道车辆有限公司）