基于LSTM的轨道结构温度变形预测方法

2021-10-20 08:52姚逸行刘建国

铁道建筑技术 2021年9期

姚逸行刘建国

(1.同济大学道路与交通工程教育部重点实验室上海 201804；2.同济大学上海市轨道交通结构耐久与系统安全重点实验室上海 201804)

1 概述

随着我国铁路交通网的迅速发展，邻近铁路工程施工愈加频繁。为了控制线路变形，保障线路运营安全，这就要求邻近铁路工程在进行合理化设计与施工的同时[1]，加强对轨道结构变形的实时监测。而影响监测精度的重要干扰因素之一就是由温度带来的轨道结构变形。杨震等[2]通过分析合武客专无砟轨道曲线段不平顺谱，发现无论是轨向还是高低，8月份的谱线位置都明显高于其他月份的谱线，说明温度力对无缝线路变形影响显著。杨冠岭[3]利用ANAYS软件建立了有砟轨道无缝线路力学模型，考虑轨道横竖向初始不平顺矢度、横竖向初始不平顺波长、曲线半径、曲线线型、轨枕竖向位移，道床参数等因素，分析了在温度力作用下轨道位移变化规律，较其实测数据结果较为保守。对于无砟线路，文献[4－5]通过光纤光栅等位移传感器监测了桥隧过渡段的钢轨横向位移，其随着日温波动呈现周期性的变化，变化幅度在0.3 mm左右。

事实上，由于实际的轨道结构力学性质复杂，其变形情况与温度分布场之间并非是简单线性的映射关系，其变化规律难以通过传统的统计学方法包括线性回归、自回归移动平均值等进行准确描述。因此，在实际监测工作时无法针对现场情况对温度带来的结构变形进行实时预测，从而抵消温度带来的数据误差。从监测数据中实时提取轨道结构温度变形的变化特点，从而做出满足一定精度要求的预测，进而消除温度带来的轨道结构变形对邻近铁路工程轨道结构变形监测的干扰，还原由邻近铁路工程引起的真实轨道结构变形，是亟待解决的问题。

轨道结构温度变形实时预测可以视为一个非线性不稳定的时间序列问题。近年来，随着专家学者对机器学习算法的深入研究，基于大数据的人工智能神经网络算法逐渐发展成熟，包括模糊推理系统(fuzzy inference system，FIS)、人工神经网络(artificial neural network，ANN)和支持向量机(support vector machine，SVM)等，其中的循环神经网络[6](recurrent neural network，RNN)在非线性拟合方面有着良好的表现，在手写识别[7]、机器翻译[8]、文本分类[9－10]以及医学诊断[11]等方面都有广泛的应用。由于在处理复杂预测问题上表现突出，并逐渐应用于工程领域，如王增平等[12]针对短期电力负荷数据时序性特点，将GRU神经网络与DNN神经网络结合，提出了GRU-NN模型用于预测中国某地区的短期电力负荷，在兼顾时效性的同时预测精度达到97.12%。

长短期记忆网络(long short-term memory，LSTM)是在RNN基础上，为了解决时间序列学习的长期依赖问题而改进的一种特殊循环神经网络。本文提出了一种基于LSTM循环神经网络的轨道结构温度变形预测方法，以某盾构下穿既有车站工程轨道结构横向变形监测数据为算例，并将该方法与多层感知机(multi-layer perceptron，MLP)进行对比。实验证明，与MLP相比，本文提出的预测方法预测精度更高，能够满足一般监测工作的实际需要。

2 LSTM循环神经网络原理

循环神经网络(RNN)由于引入了循环单元结构，能够在学习中保留过去信息，适合处理时间序列预测问题，但其存在的长期依赖问题，即在反向传播算法中会出现梯度消失与梯度爆炸的现象，会导致循环神经网络无法掌握长时间跨度的非线性关系。

为了解决RNN的梯度消失问题，LSTM循环神经网络定义了一个新的循环单元结构，其状态由称为遗忘门、输入门以及输出门决定。遗忘门决定对前一时刻的状态信息的保留程度；输入门会根据当前时刻的输入信息以及单元状态决定信息更新程度；输出门则负责从当前时刻的单元结构中输出具体记忆。每个门都是一个单层神经网络，其参数通过模型训练学习确定，这些参数表示了遗忘、输入或输出的执行程度。

假设xi为输入，LSTM循环神经网络隐藏层的单元结构可以用以下公式表示:

式中，ft、it、t、ct、ot、ht分别代表遗忘门、输入门、候选状态、单元状态、输出门以及最终单元输出；Wf、Uf、bf、Wi、Ui、bi、Wc、Uc、bc、Wo、Uo、bo为训练参数矩阵；⊙表示哈达玛积。

之所以LSTM循环神经网络能够避免梯度消失及梯度爆炸的问题，就在于其单元状态ct的更新只涉及加法运算，而非像RNN中使用sigmoid等激活函数进行变换运算。从而在反向传播过程中，对于每一步运算只会有恒定的误差被传播回去。因此，LSTM循环神经网络能够更好地学习数据中的长期依赖关系以进行预测。

3 基于LSTM模型的轨道结构温度变形预测方法

3.1 预测模型求解

基于LSTM循环神经网络的轨道结构温度变形预测算法流程如图1所示，具体步骤如下:

利用循环的冷却水作为加湿的水源，避免湿式冷凝器直接排放冷却水所带来的水资源浪费，省去风冷式冷凝器中的轴流风机所带来的电能消耗，节约能源的同时没有增加成本。建议在空调内安装制冷剂回收箱体对多余的制冷剂进行回收，将回收的制冷剂充入前进风格栅对室内空气进行预降温，减小制冷剂蒸发温度与被冷却空气温度的差值，增大制冷效率，减少制冷剂的使用量，减少制冷剂的排放。

图1 算法流程

(1)划分数据集。记轨道结构第n个测点t时刻气温监测值为，温度变形监测值为，则T时刻的模型输入矩阵为。模型训练数据集为:

(2)数据归一化。为了避免神经网络运算求解时带来的数值问题，满足求解需要，对数据进行归一化处理。公式如下:

温度变形监测值按上述公式类似处理。

(3)模型预测。将经过归一化处理的训练数据集O作为模型输入，根据模型输出结果按照损失函数计算误差梯度，并利用Adam优化算法对预测模型中各个神经单元的状态进行更新，以上过程记作一次训练。在模型学习到设定的训练次数(epoch)后，得到预测模型参数。

(4)模型输出及数据还原。将测试数据集P作为输入，根据预测模型参数求解预测结果，并对其进行反归一化处理，得到轨道结构温度变形预测值。

3.2 预测模型结构及超参数设置

本文建立的LSTM循环神经网络包含一个隐藏层，其层数为50。一次训练的样本个数(batch_size)设置为72，窗口长度(look_back)设置为12，激活函数选用‘tanh’与‘hard_sigmoid’。在模型训练参数的迭代更新方面，采用Adam(adaptive moment estimation)优化算法代替传统的随机梯度下降算法，最终使模型的损失函数输出值降到最小，完成训练。同时，为了保证模型输出结果在维度上与实际监测值一致，在LSTM循环神经网络之后需要再添加一个1维的全连接层。

其中，损失函数采用平均绝对误差(Mean Absolute Error)，即:

式中，M为训练集样本个数；为轨道结构第n个测点t时刻温度变形实际监测值；为对应的模型预测值。

4 实验结果与分析

4.1 训练样本选择及数据预处理

本文采用了某地铁盾构下穿既有车站工程的轨道结构变形监测数据集。该工程下穿了车站中普速铁路与客运专线两条铁路。其中，该普速铁路为电气化铁路，有砟道床，混凝土轨枕，普通客运、货运段铁路，最高速度160 km/h。监测仪器采用徕卡TM30型全站仪，该型仪器角度监测精度为0.5″，距离监测精度为0.2 mm＋0.4 ppm。该监测数据集包括了2018年7月14日至2018年8月17日10道共120个测点的轨道横竖向变形数据以及气温数据，采集间隔2 h，共m＝412组数据。

针对轨道结构温度变形的预测目标，训练样本中的轨道变形监测数据应尽可能排除温度影响以外的干扰因素。同时考虑到监测设备精度，最终选取远离下穿中心点且温度变形幅值较大的普速铁路8～10道两侧共6组轨道横向变形监测数据以及相应的气温监测数据作为实验样本。实验样本划分比例取0.8，即s＝0.8 m(其中训练数据集的后25%数据作为验证集)。

为了进一步降低监测数据的噪点影响，先将实验样本数据进行适当平滑处理，以8道96号测点为例，样本数据平滑处理结果如图2所示。之后将样本数据归一化至(－1，1)之间。最后将归一化后的数据组成模型输入矩阵。

图2 监测数据平滑处理结果

4.2 实验结果评价标准

平均绝对误差(MAE)能够反映预测结果与实际值之间的绝对误差，均方根误差(RMSE)对预测结果中的误差极值反应更为敏感，而相关系数(CORR)则描述了预测结果与实际值间的相关程度。本文选取上述三项指标作为评价预测结果的精度标准，其表达式如下:

4.3 实验求解与结果分析

将预处理后的训练数据集输入模型进行训练，以8道96号测点为例，其模型训练次数(epoch)与损失函数输出值()的关系如图3所示。

图3 模型训练次数与损失函数值关系曲线

可以看出，无论是训练数据集还是测试数据集，预测模型在经过350次训练后，已经得到充分训练且损失函数输出值衰减趋于稳定，而训练次数过大或者过小会使模型产生过拟合或欠拟合的情况，影响预测精度的同时可能还会增加运算时长。因此，将350次作为该测点模型的终止训练条件。

同时，本文选择多层感知机模型(MLP)与模型预测结果进行对比用以评判算法性能优劣。为了保证科学性与有效性，两种方法的实验样本及划分比例均保持一致。

图4为8道96号测点两类模型预测结果对比图。可以看到，两类模型都能在一定程度上捕捉到轨道结构横向变形随日温变化的周期性变化趋势，但在轨道结构变形幅度的学习尤其是数据峰谷值特征的提取上，基于LSTM的轨道结构温度变形预测模型效果明显更好。

图4 8道96号测点预测结果对比

两种模型各测点的预测结果评价见表1。

表1 两种模型预测结果评价

可以看出，本文提出的基于LSTM的轨道结构温度变形预测模型相比于多层感知机模型(MLP)，在整体预测精度上表现地更好。在相关系数(CORR)、均方根误差(RMSE)以及平均绝对误差(MAE)三项指标上其均值分别提高了0.36，降低了0.34以及0.29。

5 结论

本文提出了一种基于LSTM循环神经网络模型的轨道结构温度变形预测方法，通过将往期气温及轨道结构变形监测数据作为学习样本，利用训练后的预测模型以及当前气温监测值对轨道结构温度变形作出实时预测。主要结论如下:

(1)依据某地铁盾构下穿既有车站工程的监测数据，对轨道结构温度变形作出预测，并将预测结果与多层感知机(MLP)进行对比，结果表明本文提出的预测方法可以获得更高的预测精度，其预测精度在0.2 mm以下。

(2)未来可以在学习样本中增加对轨道结构温度变形相关的影响因素如轨温等监测数据，进一步提高预测精度，使其适用于监测等级更高的高速铁路监测数据降噪当中。