基于轨道数据对齐的ARIMA模型的轨道不平顺预测*

2019-06-25 06:32朱洪涛陈品帮梁恒辉
振动、测试与诊断 2019年3期
关键词:原始数据平顺差分

朱洪涛, 陈品帮, 魏 晖, 梁恒辉

(1.南昌大学机电工程学院 南昌,330031) (2.江西科技学院汽车工程学院 南昌,330098) (3.广铁集团惠州工务段 惠州,516000)

引 言

轨道是保障高速铁路运行安全的重要基础。在铁路线的日常运营中,轨道将承受高速行驶下存在的冲击、列车行驶时存在的振动以及列车的载荷,其结构上的形变及位置上的偏移在所难免。而轨道不平顺的发展,将会对铁路线的运营产生巨大的影响,例如铁路运输的安全程度、列车乘客的舒适程度以及轨道的养护所需投入的人力物力等方面[1]。轨道质量指数(track quality index,简称 TQI)是利用轨检车及其相应的轨道检查系统,通过测量采集各项轨道几何尺寸数据,进而得出的一项能够全面说明该段轨道整体质量水平的指标。TQI作为评价轨道整体不平顺的重要指标,对于线路养护维修作业具有重大的指导意义。

预测轨道的TQI,一般是分析轨检车先前工作中检查得到的TQI历史数据,得出其变化规律,从而对将来的TQI数值进行预测[2]。高建敏等[3]提出将轨道下沉变形与车辆-轨道耦合振动系统相关联,用于预测轨道的不平顺状况。韩晋等[4]提出一种以构建非等时距加权灰色预测模型为基础对轨道不平顺进行预测,再引入BP神经网络模型修复其残差序列。郭然等[5]基于灰色预测模型建立了更新机制,优化了模型并且提高了预测精度。贾朝龙等[6]提出将改进的灰色GM(1,1)与自回归模型相结合,预测轨道不平顺状态。 曲建军等[7]提出将灰色GM(1,1)与马尔可夫链预测理论相结合,用于充分挖掘历史数据背后的潜在价值。国外专家对该领域也有大量研究。Kawaguchi等[8]提出轨道状态预测S式、线性以及非线性两种退化模型。Iyengar等[9]基于随机过程理论,通过平稳高斯随机过程对不平顺进行建模。对于该领域的研究,大多是基于模型驱动的方式,但对于原始数据的可参照性,没有基于实际检查情况给出有效处理,如原始数据可能存在未对齐的问题,将会影响到预测结果的真实性。

实践证明,单元区段内轨道不平顺状态,伴随着运营时间的增长,其数据表现为多阶段的、周期性的且是非线性的。笔者通过互相关函数对不同时间、同一轨道进行检查得出的大量历史数据进行互相匹配,把各组试验数据进行对齐之后得出的TQI数值作为观测值,建立ARIMA模型,从而对轨道不平顺的预测进行研究。

1 原始数据的处理

1.1 互相关函数简介

互相关函数是信号分析中的概念,表示两个序列之间的相关程度,即互相关函数是描述两个信号y1和y2在两个任意不同的x1和x2的取值之间的相关程度[10],该函数可以表达不同信号之间的相关性。而互相关系数则是互相关函数与两个函数的均方差乘积之比,其绝对值不大于1,相关程度与其成正比。

令f1(t)与f2(t)为两个独立信号,则有

(1)

1.2 原始数据的对齐

将同一被测轨道、不同时间检查得到的历史数据进行里程对齐,取广铁集团惠州工务段杭深线潮汕站4道K1317+150-K1317+350间2013-2015年度的轨道几何尺寸历史数据为样本展开研究。原始数据没有对齐通常有两种情况:a.数据表现为直接的平移关系,存在明显的相位差;b.数据表现上存在累积里程误差,里程逐渐错开。第1种情况只需将数据里程平移即可,而主要需要解决的问题是累积里程误差。此处以轨距值为例,如图1所示。

图1 数据未对齐的情况Fig.1 The situation of data misaligned

当轨道上里程够长时,数据表现可能会存在里程的丢失,数据无法对齐,从而存在里程误差。图1中表示的是两组不同时间对同一轨道检查得到的轨向数据,由于检查时里程轮的滑移或者存在振动导致里程数据不准,此时的原始数据并不是最佳观测值,必须将各项轨道几何尺寸数据进行对齐后再带入使用。采用互相关函数对多组原始数据进行分段匹配,从而将原始数据对齐。

将上述历史数据取24组,依次为y1,y2,…,y24,通过迭代求取整体样本最佳的对齐结果,其中yi与里程x的关系构成函数y(i),且y(i)中每一次迭代的步长所对应的里程段均可以拟合出y与x的多项式。方法流程如图2所示。

以互相关系数Tc的值为匹配标准,Tc越大说明两函数之间的匹配程度越高,所以当某一里程段内的y(i+1)与y(i)的迭代匹配过程中存在Tc>Tc+1且有Tc>Tc-1,此时y(i+1)中该段长为0.125a的里程段与y(i)中指定步长为X的里程段为对应段。为保证误差不被扩大,每两组数据的各段对应匹配之后,均以y(i)与被保留的y(i+1)里程段的里程均值为两函数段放大或缩小的标准,再将每个里程段进行拼接,得出新的序列作为新的y(i+1)与y(i+2)进行循环迭代。将互相关函数带入实际情况有f1(t)=y(i),f2(t+τ)=y(i+1),则有

(2)

在概率密度分布函数中,x在实际工程中表示里程,由间隔为0.125m的观测点得到,所以其概率分布为均匀分布,有pi(x)=1/X,其中X可根据工程实际需要进行取值。

同理有

其中:pi+1(x)=1/0.125a。

系数的大小反映了两段函数的相关程度,在统计学中有

图2 迭代求取最佳对齐里程Fig.2 Iteration to get the best alignment mileage

为了保证数据的严格,在迭代过程中以高度相关为原则,将大量轨道几何参数的原始数据经过迭代后,得出对齐的原始数据投入后续的使用。对齐效果如图3所示,图中仅取200m的单元里程中的波形图,图中方块所示波形为两组数据匹配后拼接得出的新数据。

图3 里程对齐示例Fig.3 Example of mileage alignment

1.3 观测值的选取

在2013—2015年间,对杭深线潮汕站4道K1317+150-K1317+350间的轨道几何形位进行了收集整理,由于轨检车检查得到的历史数据过于庞大,且鉴于需要带入的变量能够充分表达轨道的均衡性,能够全面表达轨道各种指标的综合水平,故选取轨道质量指数TQI作为观测值,用于模型的建立,来研究轨道不平顺的恶化趋势。其中,7项单项标准差(左右高低、左右轨向、轨距、水平、三角坑7项轨道几何不平顺幅值标准差)之和即为线路轨道质量指数TQI[11]

(3)

其中:σ为每项不平顺幅值标准差。

将7项指标的历史数据均进行上述的迭代处理,由数据配准之后,可以保证各项数据的幅值都是该段轨道上相应的真实幅值,整合得出的TQI数值能真实反应该段轨道的不平顺情况。将大量数据整合后,以2013—2014年度的TQI整合数据为例,如表1所示。

由于现阶段数据取得的方式均存在人为成分,且数据采集存在自然条件的影响,所以迭代后整合的数据必定会存在一定的误差。将每次检查中的多组数据求取均值,以作为该次检查的TQI最佳观测值,其中

表1 2013—2014年度杭深线潮汕站4道K1317+150-K1317+350 TQI整合数据

(4)

其中:Yi为同一次检查的第i组观测值;n为维修作业前第n次检查。

2 建立ARIMA模型预测轨道不平顺

2.1 ARIMA模型简介

时间序列模型可以在不考虑其他变量可能对目标值产生影响的情况下,只通过观测值的变化,利用外推机制来表达时间序列的变化情况。它有两种类型的随机序列:确定型随机序列具有基本的外推方法;而随机型时间序列存在不同。

预测的随机序列是由随机过程产生的,通常有以下几种。

1) 假定某个随机过程是线性的,表示为

Xt=φ1Xt-1+φ2Xt-2+…+φpXt-p

(5)

其中:φi为回归参数。

此过程称之为p阶自回归过程,记作AR(p)。

2) 假定某个随机过程是线性的,表示为

Xt=at+θ1at-1+θ2at-2+…+θqat-q

(6)

其中:θt为回归参数;at为白噪声过程。

此过程称之为q阶滑动平均模型,记作MA(q)。

3) 自回归滑动平均模型是由上述两者共同构造而成的随机过程,即两式相加而成,称之为p阶自回归q阶滑动平均模型,记作ARMA(p,q)。通常存在时间序列是不平稳序列,即非平稳的自回归滑动平均模型。

4) 通过将不平稳的时间序列进行差分,得到平稳序列再进行建模,该模型称之为ARIMA(p,d,q),其中d表示将最初的时间序列进行了d次差分后,得到平稳的时间序列。

2.2 ARIMA模型的建立

选取广铁集团惠州工务段杭深线潮汕站4道K1317+150-K1317+350间2013—2015年度的历史数据作为样本,对其进行建模。取其中第1年度的原始数据为例,经过处理后,得出最佳观测值,如表2所示。

表2 杭深线潮汕站4道K1317+150-K1317+350单元区段TQI数据

Tab.2 TQI data of Unit section in K1317+150-K1317+350 in No.4 road of Chaoshan Railway Station in Hangzhou-Shenzhen line

TQITQI12013.10.028.553132014.04.0310.93122013.10.189.016142014.04.1810.56832013.11.04 8.903152014.05.0511.02342013.11.18 9.314162014.05.1911.47252013.12.02 9.451172014.06.0212.11262013.12.17 9.563182014.06.1811.35472014.01.03 9.662192014.07.0112.18282014.01.17 9.788202014.07.1512.07192014.02.0310.263212014.08.0111.584102014.02.1710.529222014.08.1511.151112014.03.0311.182232014.09.0311.964122014.03.1711.012242014.09.1911.989

通过Eviews软件对该时间序列进行建模,得出TQI数值的变化情况,如图4所示。

图4 TQI检查结果Fig.4 TQI inspection results

2.3 模型的识别与定阶

基于原始数据,具体使用何种结构的模型,需要对其自相关系数AC与偏相关系数PAC进行分析,TQI原始数据的相关信息如表3所示,其中Prob表示显著性水平统计量。

表3 原始数据的时间序列相关统计信息

Tab.3 Relative statistics information for time series of raw data

由表3可以看出,自相关图与偏相关图均不为零且有衰减趋势,两者均表现为拖尾。为了将轨道不平顺预测进行平稳建模,而原始数据不一定是平稳的,必须先对TQI序列进行平稳性检验。用单位根检验序列是否适用于ARIMA模型,若序列表现为非平稳,则对序列进行差分。

表4中列出了TQI原始数据序列的单位根检验情况以及将其差分后的情况,从中可以看出,TQI原始数据序列的ADF检验值均大于检验水平为1%,5%,10%的临界值,所以原序列是不平稳的ARIMA(p,d,q),模型的建立需要将序列差分到平稳状态。由表4可知,将原序列差分后可以得到平稳序列,为了能使建模达到最优效果,故选取1阶差分序列进行建模,1阶差分序列的相关信息见表5。

表4 原始数据的时间序列单位根检验情况

表5 1阶差分后原始数据的时间序列相关统计信息

Tab.5 Relative statistics information for time series of raw data by first order difference

由表5可以看出,新序列的自相关函数经过1阶差分后超出了95%的置信区域,达到最大值的同时快速下降。相关函数在1阶和3阶均明显非零,由此确定建立ARIMA(1,1,3)模型用于TQI的预测。模型的相关系数及其显著性水平如表6所示。

表6 ARIMA(1,1,3)模型相关系数及显著性水平

Tab.6 Correlation coefficient and significance level of ARIMA (1,1,3) model

TProbC12.273 2801.638 8367.489 0240.000 0AR(1)0.925 2490.038 47724. 046 3200.000 0MA(1)-1.116 7790.428 671-2.605 2110.017 9MA(2)-0.688 4620.477 808-1.440 8760.166 8MA(3)-0.420 5780.479 451-0.877 2090.391 9

由建模结果的显著性水平可知ARIMA模型是平稳的,标准误差小,能够认定ARIMA(1,1,3)模型可以用于TQI预测。TQI预测多项式为

Xt=12.273 28+0.925 249Xt-1-

1.116 779ut-1-0.688 462ut-2-

0.420 578ut-3

3 ARIMA模型试验

3.1 基于已知数据预测未知数据

根据广铁集团惠州工务段杭深线潮汕站4道K1317+150-K1317+350间2013—2015年度的24组数据,对2015—2016年度第1季度的TQI检查结果进行预测,预测曲线如图5所示。

图5 ARIMA模型试验Fig.5 ARIMA model test

预测方法通常有两种:静态预测和动态预测。静态预测是滚动的进行下一步的预测,即每预测一次都是基于真实值,以真实值替代预测值,加入到估计区间,再继续下一步预测;而动态预测是根据所选择的一定区间,进行多步向前预测,每次预测都是基于之前的预测值得出新的预测值。样本范围内的序列实际值是已知的,样本外的预测通常因变量的实际观测值是未知的,所以静态预测一般适用于样本内,而对于样本外选择动态预测。

3.2 预测结果的分析

将样本内外的TQI实测值作为参考,验证ARIMA(1,1,3)模型的静态预测与动态预测的TQI估计值,以相对误差说明预测精度,如表7所示。

表7 TQI预测值与实测值对比

Tab.7 Comparison of predicted and measured values of TQI

TQI/mm/mm/%/mm/%12013.10.028.5538.895 3.9998.678 1.46122013.10.18 9.016 9.827 8.995 8.797-2.42932013.11.04 8.903 8.190-8.009 9.073 1.90942013.11.18 9.314 9.407 0.998 9.208-1.13852013.12.02 9.45110.207 7.999 9.428-0.24362013.12.17 9.563 9.371-2.008 9.618 0.57572014.01.03 9.662 9.951 2.991 9.773 1.14982014.01.17 9.788 9.494-3.00410.032 2.49392014.02.0310.26310.468 1.99710.481 2.124102014.02.1710.529 9.791-7.00910.638 1.035112014.03.0311.18211.629 3.99710.926-2.289122014.03.1711.01211.113 0.91711.025 0.118132014.04.0310.93111.805 7.99610.958 0.247142014.04.1810.568 9.511-10.00210.961 3.719152014.05.0511.02311.463 3.99211.139 1.052162014.05.1911.47212.504 8.99611.646 1.517172014.06.0212.11212.596 3.99611.785-2.700182014.06.1811.35412.473 9.85611.844 4.316192014.07.0112.18212.912 5.99211.767-3.407202014.07.1512.07111.226-7.00011.826-2.030212014.08.0111.58410.889-6.00011.789 1.770222014.08.1511.15112.043 7.99911.519 3.300232014.09.0311.96412.203 1.99811.701-2.198242014.09.1911.98911.269-6.00612.024 0.292252014.10.0312.08712.449 2.99512.009-0.645262014.10.1711.74911.028-6.13711.904 1.319272014.11.0212.15711.306-7.00011.942-1.769

由表7可以看出,将轨道几何尺寸历史数据对齐后,最大的相对误差绝对值低于5%,将各次预测的相对误差绝对值取均值,得到该ARIMA(1,1,3)模型的平均预测水平只存在1.75%的相对误差;而基于没有对齐的数据进行预测,其平均预测水平达到5.48%的相对误差,其相对误差绝对值最大值远大于将原始数据对齐之后的预测结果。由此可知,该模型得出的预测值与对轨道进行检查时得出的观测值之间的误差是非常小的,可以达到较高的预测精度。

4 结束语

由于轨道检查得出的轨道几何尺寸原始数据不一定都是对齐的,经常伴随累积里程误差,会直接影响到轨道不平顺预测研究的观测值。通过互相关函数的迭代匹配将所有样本内历史数据对齐后,再通过ARIMA模型预测TQI数值,结果表明:将轨道几何尺寸原始数据对齐后再进行其不平顺状态的预测研究,预测结果的相对误差绝对值最大在5%之内,样本内相对误差均值为1.75%,可以达到更高的试验精度。

猜你喜欢
原始数据平顺差分
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
数列与差分
受特定变化趋势限制的传感器数据处理方法研究
基于Simulink的汽车行驶平顺性研究
平顺植保站:开展粟灰螟防治
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
对物理实验测量仪器读数的思考
相对差分单项测距△DOR
2.0L和2.2L欧5柴油机噪声-振动-平顺性的改善