马 帅,高 亮,刘秀波,蔡小培
(1.北京交通大学 土木建筑工程学院,北京 100044;2.中国铁道科学研究院集团有限公司 基础设施检测研究所,北京 100081)
我国客货共线铁路正线一般采用有砟轨道、长大隧道一般采用无砟轨道。对于客货共线无砟轨道,由于开行货运列车,运营条件和环境比客运专线无砟轨道或有砟轨道差,而在结构和力学性能上与客货共线有砟轨道也存在显著差异;即使在相同的外界环境下,4种不同条件下轨道结构的平顺状态也将呈现不同的发展规律。因此,有必要针对客货共线无砟轨道建立轨道平顺状态预测模型,为制定合理维修计划奠定基础。
国内外学者在轨道平顺状态预测方面取得了许多研究成果。早期学者通过试验和轨检车实测数据归纳分析建立了多个预测模型,如日本学者的预测公式[1-3],国际铁路联盟ORE的轨道不平顺恶化率线性模型[4],加拿大PWMIS系统的线性预测模型[5]。此外,相关学者还将多种数据分析方法用于轨道平顺状态预测,如基于卡尔曼滤波的轨检车数据预测分析方法[6]、基于轨道不平顺概率分布的特性矩阵法[7]、考虑轨道状态恶化众多影响因素的综合因子法[8]、改进型指数平滑预测模型[9]、基于平均劣化率的轨道质量短期预测模型[10]、基于灰色系统理论的非等时距GM(1,1)预测模型[11]及其修正模型[12]、灰色GM(1,1)与AR模型的组合模型[13]、灰色模型与神经网络的组合模型[14]等。这些预测模型主要针对有砟轨道,有砟轨道平顺状态发展规律通常满足分段线性、多项式或指数等具有明显趋势的形式。而研究发现,客货共线无砟轨道的轨道质量指数TQI在相当长的时间内并无明显恶化趋势,通常呈长期趋势缓慢变化并伴随平稳波动,因此以往的预测模型难以分析这种变化特征。
基于客货共线无砟轨道TQI的时间序列变化特征,结合小波分析和时间序列分析预测方法,本文提出将ARMA-BP神经网络和ARMA-SVR模型用于无砟轨道平顺状态预测。首先对TQI原始序列进行小波分解,将ARMA模型用于预测TQI序列平稳波动成分,同时利用BP神经网络和支持向量回归SVR对TQI序列的慢变趋势成分进行建模与预测,最后综合2种成分的预测值获得最终预测结果。
TQI是我国工务部门评价轨道质量和指导线路养护维修的重要参数,由200 m区段内左右高低、左右轨向、轨距、水平和三角坑共7项轨道不平顺的标准差求和得到,能够有效反映轨道平顺性。
本文数据来自包西线庆兴隧道和太中线吴堡隧道的轨检车检测数据,2条线路的设计速度均为160 km·h-1,隧道内分别铺设Ⅰ型和Ⅱ型双块式无砟轨道。轨道不平顺动态检测每月1次,数据检测时间为2014年1月至2016年12月,对每次的检测数据,每200 m区段计算1个TQI值,每个区段的连续多次TQI数据作为1个时间序列样本。对2个隧道各随机选取5个无砟轨道区段作为研究对象,TQI时间序列样本如图1所示,其中庆兴隧道样本的里程为K770+600—K770+800,吴堡隧道样本的里程为K1 192+600—K1 192+800。
图1 无砟轨道区段TQI时间序列样本
由图1可以看出:无砟轨道区段3年的TQI数值并未发生明显的趋势性变化,TQI值变化并不能用多项式或指数表示。这是因为,相比于有砟轨道,无砟轨道结构稳定,具有较好的轨道质量保持能力;处于隧道内,温度、湿度也相对稳定,不受雨雪等外界环境影响。此外,2个隧道自建成至今未进行过换轨等大修,主要的扣件维护和钢轨打磨作业对TQI影响较小,TQI值并未发生明显变化。
为了深入分析TQI时间序列是否含有趋势性成分,采用小波分解方法,利用bior4.4小波基将图1中庆兴隧道的TQI样本进行1级分解,得到低频成分和高频成分,如图2所示。由图2可以看出:低频成分具有幅值变化相对平缓的趋势项,而高频成分围绕0值均匀波动,近似满足平稳性。
图2 庆兴隧道TQI样本小波分解
经过反复试算,db6,db8,sym6,sym8和bior4.4等小波基均适用于TQI时间序列,分解结果相近,考虑双正交小波兼顾了线性相位和正交性,故选取bior4.4小波基。
对TQI时间序列高频成分是否满足平稳性需要验证时,ADF检验[15]是常用的时间序列平稳性检验方法。它以随机游走模型为检验依据,并在实际检验过程中推广为以下3个模型。
(1)
(2)
(3)
其中,
ΔXt=Xt-Xt-1
式中:Xt为时间序列;εt为白噪声;I为差分项数目;γ,β和δ为常数。
式(2)和式(3)分别考虑了常数和趋势项,每个模型的原假设都是δ=0,即不满足平稳性。检验过程从式(3)开始,然后式(2)、式(1),何时拒绝原假设何时停止检验,否则直到检验完式(1)为止。表1为对图2中高频成分在显著性水平为0.05时的平稳性检验结果。
当3个公式中差分项数I取不同值时,高频成分均拒绝原假设,这表明高频成分满足平稳性;进一步分析得知,绝大多数TQI样本的高频成分均满足平稳性。可以认为,客货共线无砟轨道TQI的时间序列包含平稳的高频成分。
表1 庆兴隧道TQI样本平稳性检验结果
由于客货共线无砟轨道TQI时间序列的不同频率成分具有不同特性,在进行预测时应该采用不同模型分别建模。考虑到TQI高频成分满足平稳性,本文采用适用于平稳时间序列建模的ARMA模型;TQI低频成分是慢变的非线性趋势项,可以采用BP神经网络和支持向量回归SVR建模。最后将ARMA子模型的预测结果分别和BP神经网络、SVR子模型的预测结果求和,得到2种轨道质量指数TQI预测模型:ARMA-BP神经网络和ARMA-SVR预测模型的建模流程如图3所示。
图3 建模流程
下文建模采用图1中庆兴隧道的TQI样本。
ARMA模型是时间序列分析中具有代表性的一类有限参数线性模型,能描述平稳时间序列内部的相关关系,适合平稳时间序列建模。ARMA模型建模过程如下。
(1)TQI时间序列高频成分的平稳性检验。ARMA模型要求时间序列满足平稳性,可以利用ADF检验方法进行检验。如果TQI时间序列高频成分不满足平稳性,可以进行差分处理使其满足平稳性,最后对预测结果进行积分处理。
(2)模型阶数选取。自回归阶数n与滑动平均阶数m一般根据贝叶斯信息准则(BIC)[16]确定。BIC准则在模型复杂度与模型对数据描述能力之间寻求最佳平衡,通过加入模型复杂度的惩罚项避免过拟合问题,是衡量模型拟合优良性的一种标准。BIC统计量为
BIC=klnM-2lnL
(4)
式中:k为模型参数个数;L为模型极大似然函数值;M为样本容量。
本文分别对n和m取不同的值,当BIC统计量最小时将对应的n和m作为模型阶数。图4为n和m取不同值时庆兴隧道TQI样本的BIC统计量的柱状分布图。由图4可知对于庆兴隧道的TQI样本应取n=2,m=3。
图4 不同自回归阶数、滑动平均阶数时庆兴隧道TQI样本的BIC统计量
(3)采用最小二乘法进行模型参数估计,得到模型参数。
BP神经网络是一种常用的前馈型神经网络,具有较强的非线性建模能力。理论上,1个3层神经网络能够逼近任一复杂的非线性系统。利用BP神经网络进行TQI时间序列低频成分建模过程如下。
(1)网络结构设计,确定各层节点数目。将神经网络层数选定为3。为了保证输入信息充足,选取输入层节点数为5,输出层节点数为1。对于关键的隐含层节点数目,分别选取节点数2~10(数目过大容易产生过拟合,降低模型泛化能力),然后随机选取不同的模型初始值,对每个隐含层节点数目的神经网络均训练100次,计算模型预测均方根误差的平均值,结果如图5所示。选取使误差最小的值作为隐含层节点数,由图5可知隐含层节点数应取9。
图5 模型误差与隐含层节点数目关系曲线
输入输出矩阵的每一行是1组输入输出数据。
(3)数据规范化。采用最小—最大规范化方法,对输入输出矩阵的每一列进行规范化,计算式为
(5)
(4)确定神经网络训练参数。神经网络隐含层和输出层的激活函数分别取Log-sigmoid函数和Purelin函数,模型训练方法为自适应学习率梯度下降算法,学习率为0.01,目标误差精度0.01,最大迭代次数105次。
(5)模型训练与预测。
支持向量回归SVR是支持向量机SVM进行回归和数值预测时的变体,具有较强的非线性建模能力。SVR基于结构风险最小化策略训练模型,不太容易过分拟合,因此具有较好的泛化能力;采用核函数代替复杂的高维空间内积运算,能够有效克服维数灾难和局部极小问题。SVR试图找到1个决策函数f(x)=ωTx+b, 其中ω和b为待定系数,使得函数值f(x)与真实值y尽可能接近。一般认为当y-f(x)=0时模型的损失才为0,而支持向量回归SVR允许y与f(x)之间存在最大偏差θ,即引进损失函数lθ(x)。
(6)
SVR的结构风险函数为
(7)
式中:‖ω‖2为模型参数绝对值的平方,描述模型的复杂程度;C为惩罚系数。
i=1, 2, …,M
(8)
s.t.
ηi≥0
式中:M为数据样本容量。
利用SVR对TQI低频成分建模的过程如下。
1)训练数据集选取与整理
选定训练数据集{(x1,y1), (x2,y2), …, (xN-p,yN-p)}∈Rp×R, 其中xi=(xi,xi+1, …,xi+p-1),yi=xi+p, 1≤i≤N-p。并采用与神经网络同样的方法整理输入输出数据的格式。
2)构造最优化问题
建立对偶形式SVR结构风险函数。
(9)
s.t.
ai≤C
式(9)的详细推导参见文献[17]。
基于大量分析对比,本文选择径向基函数作为核函数,即
K(x,y)=exp(-r|x-y|2)
(10)
式中:r为径向基核函数的参数。
3)模型参数确定
在r,C和θ这3个参数中,θ是决定模型精度的最关键参数。令θ在0.01~0.5范围内以0.01的间隔依次递增,对于每个不同的θ值,同时允许r和C在合理范围内取值,并对r和C优化使得SVR对TQI低频序列的拟合和预测均方根误差最小。图6为r和C取最优值时,θ在0.10~0.30范围内的均方根误差变化曲线。结果表明,当θ取0.23时预测误差最小,但拟合误差略大;均衡考虑拟合和预测误差,θ取0.20。
图6 SVR均方根误差与θ的关系曲线
经过初步试算,r和C相对合理的取值范围log2C为[5,15],log2r为[-15,-5]。当θ=0.20时,计算不同r和C情况下的SVR预测均方根误差,如图7所示。当预测误差最小时,r≈0.001,C≈16 000。
图7θ=0.20时,SVR均方根误差与惩罚系数C、核函数参数r的关系曲面
4)求解最优化问题
(11)
式中:φ(xi)为第i个数据样本的映射函数值。
选择1个正值拉格朗日乘子0 (12) 5)构造决策函数 (13) 为了验证模型对已知数据的拟合效果和对未知数据的预测能力,利用ARMA-BP神经网络和ARMA-SVR预测模型对图1中的样本进行拟合和预测,并与单一非线性预测模型的预测结果进行对比,其中2014年1月—2016年7月(前31个)的TQI值用于模型训练,2016年8月—2016年12月(后5个)的值用于模型预测。此外,还分别计算了2个隧道中10个无砟轨道区段的模型的准确度指标,以对比2个组合模型之间的优劣。 图8为本文预测模型和单一模型(BP神经网络和SVR)对庆兴隧道K770+600—K770+800里程区段TQI样本的拟合和预测结果。图9为吴堡隧道K1 192+600—K1 192+800里程区段TQI样本的拟合和预测结果。表2统计了各模型的拟合与预测的均方根误差。由于神经网络的输入层确定为5层,为了便于对比,SVR的输入向量维数取5维。此时,前5次数据(2014年1月—5月数据)只能作为模型的输入值,无法进行预测,故图8与图9中没有对应数据。 表2 各模型的拟合和预测均方根误差 由图8和图9可以看出:相比于本文提出的预测模型(ARMA-BP神经网络和ARMA-SVR),单一预测模型(BP神经网络和SVR)的拟合精度较高,但预测精度明显降低。这是因为,TQI时间序列不同频率成分的特性存在差异,单一非线性模型难以对具有多种成分、不同特性的复杂时间序列进行有效模拟,往往对训练数据过拟合,导致模型复杂度偏高,从而降低了泛化能力,预测误差偏高。因此,单一模型不适合TQI预测。 图8 庆兴隧道TQI样本模型预测效果对比 图9 吴堡隧道TQI样本模型预测效果对比 利用ARMA-BP神经网络和ARMA-SVR这2个模型分别对庆兴隧道和吴堡隧道共10个无砟轨道区段的TQI样本进行建模与预测,并与文献[11]中的GM(1,1)修正模型进行对比。根据文献[14]中的模型精度指标,计算3个模型的平均相对误差、均方根误差、模型精度及后验差4个指标在10个区段的平均值,结果见表3。 表3 各模型精度指标平均值 结果表明:本文提出的2个模型的预测精度等级均为1级,均可对客货共线无砟轨道TQI时间序列进行有效预测;ARMA-BP神经网络的拟合精度高于ARMA-SVR,但预测精度低于ARMA-SVR,可以认为ARMA-SVR以牺牲拟合精度获得较高的预测精度,具有更强的泛化能力。对于客货共线无砟轨道得TQI时间序列,其低频趋势成分变化缓慢,不符合分段线性或指数等形式,具有指数函数形式的GM(1,1)模型将难以适用,而BP神经网络、SVR对此依然具有较强的建模和预测能力。 (1)客货共线隧道内无砟轨道TQI时间序列特征明显,包含了缓慢变化的低频成分和平稳波动的高频成分。 (2)ARMA-BP神经网络和ARMA-SVR模型可以对具有不同特性多种成分的复杂TQI时间序列进行综合建模,预测精度明显高于BP神经网络和SVR预测模型。ARMA-BP神经网络和ARMA-SVR模型的预测精度等级均为1级,能够有效预测客货共运线路无砟轨道TQI时间序列发展。 (3)本文提出的预测模型没有考虑客货共线无砟轨道大修情况的影响。大修作业对无砟轨道TQI变化规律的影响及预测方法需要进一步研究。3 模型预测效果
4 结 论