基于最大Lyapunov指数的铁路煤炭发送量预测研究

2013-08-02 03:59吴华稳王富章
交通运输系统工程与信息 2013年6期
关键词:发送量增长量维数

吴华稳,王富章

(中国铁道科学研究院电子计算技术研究所,北京100081)

基于最大Lyapunov指数的铁路煤炭发送量预测研究

吴华稳,王富章*

(中国铁道科学研究院电子计算技术研究所,北京100081)

应用混沌理论的相空间重构方法,分析了与铁路煤炭运量相关的3组时间序列,分别计算了它们的嵌入延迟时间、嵌入维数、关联维数、最大Lyapunov指数等混沌统计量,并以此为依据判断了3组时间序列的混沌特性.结果显示:煤炭发送增长量和增长率符合混沌特性,煤炭发送量不符合混沌特性.最后,利用最大Lyapunov指数方法和BP神经网络方法对铁路煤炭发送增长量和增长率进行预测.预测结果表明,基于最大Lyapunov指数预测值能够较好地与实际值相吻合,其预测的准确度明显好于BP神经网络预测值.因而用混沌理论中的最大Lyapunov指数在煤炭发送量相关时间序列预测中有广泛的实用价值.

铁路运输;煤炭发送量时间序列;最大Lyapunov指数;混沌判定;相空间重构

1 引 言

煤炭是我国铁路货运量比重最大的货种,铁路煤炭发送量预测是指根据铁路运输现状的统计数据,进行动态分析,结合国民经济和社会发展规划,在定性基础上进行定量计算,采用数理统计方法对铁路煤炭发送量进行预测.正确预测铁路煤炭发送量,对铁路货运发展、资源配置和经营管理都有重要作用[1].

如何对铁路煤炭发送量有效地进行预测,一直都是铁路货运运量处理所面临的重大课题,近年来,国内诸多学者在大量研究的基础上提出了一些货运预测的数学模型.文献[2,3]利用神经网络具有很强的非线性拟合能力,以及学习规则简单、便于计算机实现的优点,对铁路货运进行预测建模.但神经网络存在过分依赖学习样本、易陷入局部最优、泛化能力不强等缺点.文献[4,5]利用分形理论具有完备自相似性、递归性强的优点对铁路货运进行预测,但分形理论预测体系还不成熟,计算量较大.文献[6,7]利用灰色理论所需数据少、计算量小、不考虑分布情况、不考虑变化趋势的优点,对铁路货运进行建模预测,但灰色理论存在发展时间比较短、不适合长期预测等缺点.鉴于上述理论在研究铁路货运预测中的不足,本文采用混沌理论中最大Lyapunov指数预测方法对铁路煤炭运量进行预测研究,该方法具有不易受噪声数据影响,不陷入局部最优解、解的精度较高、收敛速度快等优点.

时间序列分析中的一个主要问题是判断时序是确定性还是随机的,从而合理选择与待处理的序列数据相一致的处理方法.如果是随机的,就没有必要研究吸引子的性质;如果序列是低自由度的确定性混沌,则系统必然是存在非线性机制的耗散系统.如何确认时间序列是否混沌,Lyapunov指数是检验系统不稳定、出现混沌的一个非常有用的特征量.本文按照混沌动力学的过程,根据煤炭运量时间序列计算最大Lyapunov指数,建立模型来预测铁路煤炭运量的发展规律,最后对预测结果进行了分析与验证.

2 重构相空间

相空间重构的目的是从高维相空间中恢复混沌吸引子.混沌吸引子作为混沌系统的特征之一,体现了混沌系统的规律性.由Pachard[8]和Takens[9]等人证明了可以找到一个合适的嵌入维m和时间延迟τ,重构相空间

式中 x(j)为时间序列;τ为时间延迟;m为嵌入维数.

混沌时间序列相空间重构即通过对一维时序的维数进行扩充和延拓,将其扩展到三维甚至更高维的空间中去,以便将时间序列中蕴藏的信息充分显露出来.重构相空间技术的关键就在于时间延迟τ和嵌入维数m的选取.

3 混沌时间序列的判定

3.1 铁路煤炭发送量时间序列的选取

本研究数据选取从1999年1月1日到2012年6月26日14年共4 926天的铁路煤炭发送量,如图1所示.为对铁路煤炭发送量进行全面的混沌分析,选取了3个时间序列,分别是铁路煤炭发送量、铁路煤炭发送增长量、铁路煤炭发送增长率;其中煤炭发送量为基础数据,煤炭发送增长量由当日煤炭发送量减去前一日的煤炭发送量的差得到的增量数据;煤炭发送增长率由当日煤炭发送量数据减去前一日的数据的差再除以前一日的数据得到.

3.2 C—C求嵌入时延和嵌入窗

为了从给定的时间序列中把蕴藏的信息充分地显露出来,以便恢复吸引力的特性,通常是采用时间延迟技术重构相空间.在重构相空间中,时延τ和嵌入维数m的选取具有非常重要的意义.1999年,H.S.Kim[10]等人基于嵌入窗的思想提出了C—C方法,该方法使用关联积分同时估计出时延τd和嵌入窗τw.时延τd确保xi各成分相互依赖,但不依赖于m,而嵌入窗τw依赖于m,且τ随m而变化.

图1 铁路煤炭日发送量时间趋势Fig.1 The trend of railway coal dispatched volume per day

(3)根据Scor(t)最小值去发现时间序列的第一个整体最大嵌入窗.

根据C—C方法,在构造出相空间后,代入煤炭发送量相关时间序列4 926天的数据进行计算.图2展示了铁路煤炭发送量相关时间序列用C-C方法求嵌入时延及嵌入窗,直线代表t),点“.”代表Δt),星号“*”代表Scor(t).

在上面的铁路煤炭发送量相关时间序列用C-C方法求嵌入时延及嵌入窗中,根据图2得到最佳时延和嵌入窗的数值,如表1所示.

表1 铁路煤炭发送量相关时间序列最佳时延和嵌入窗数值Table 1 The optimal embedded time-delay and embedded window of railway dispatched volume time series

图2 铁路煤炭发送量相关时间序列用C-C方法求嵌入时延及嵌入窗Fig.2 C-C method to calculate embedded time-delay and embedded window of railway coal dispatched volume related time series

3.3 G-P方法求嵌入维数

基于时延嵌入空间的思想,Grassberger和Procaccia[11]在1983年提出了一个针对实验数据的方法,即通过单变量时间序列在重构空间上关联积分C(r)与距离r的关系获取分形维数,称为G-P算法.设D为关联维,R为给定值,则有rD.在实际计算中通常让n从小增大使D不变,即双对数关系lnCn(r),lnr中除去斜率为0和∞的直线外,拟合最好的直线斜率就是D.而D的稳定值就是嵌入维m.

下面是应用饱和关联维数G-P方法求解3组铁路煤炭发送量相关时间序列的嵌入维数的结果,计算中选取嵌入维数为1到15,最佳时延在表1中已算出数值,在图3中显示了铁路煤炭发送量的相关时间序列的关联维数随嵌入维数增加的变化情况.

在图3中,每组图的下部分显示了铁路煤炭发送量相关时间序列的嵌入维数D随着嵌入维数m的增加而变化的情况;每组图上半部分显示铁路煤炭发送量相关时间序列,随着嵌入时延的增加,线性区域内出现了趋于饱和的现象,继续增加延迟时间几乎不影响关联积分的值,说明3组时间序列都不是随机序列.由混沌理论可知,这种饱和现象的出现只是判别时间序列是否混沌的一个必要条件,更为精确的是通过最大Lyapunov指数来判断.

图3 铁路煤炭发送量相关时间序列GP方法求关联维及嵌入维数和关联维数的关系Fig.3 G-P method to calculate correlation dimension and the relation of embedded dimension and correlation dimension of railway coal dispatched volume related time series

3.4 最大Lyapunov指数

Lyapunov指数是一个混沌特征量.该指数的大小可用来度量系统混沌的程度,当系统的最大Lyapunov指数λ大于0时,表示存在混沌吸引子,系统具有混沌特性;λ小于0时,表示系统为随机系统或确定性系统;λ等于0时,表示系统对应着分叉点或系统的周期解,即系统出现周期现象. Lyapunov指数的倒数为最大可预报时间,而且λ越大,系统运动可预测的时间越短,预测性越差.

本文应用最小数据量法[12]对3组煤炭发送量时间序列进行最大Lyapunov指数的计算,图4显示了相空间中吸引子轨迹两点之间距离的变化情况.

混沌轨道具有对初始值的敏感性,即从两个相邻的初始条件出发的两条轨道之间的距离将随时间指数增加而增加,这种敏感性可以用Lyapunov特征指数定量地描述[13].铁路煤炭发送量相关时间序列计算结果如表2所示,通过数据显示,只有煤炭增长量和增长率两组时间序列的最大Lyapunov指数是明显大于零时,才满足混沌的条件.

图4 煤炭发送量相关时间序列最大Lyapunov指数Fig.4 The maximal Lyapunov exponent of coal dispatched volume related time series

表2 铁路煤炭发送量相关时间序列最大Lyapunov指数Table 2 The maximal Lyapunov exponent of coal dispatched volume related time series

4 基于最大Lyapunov指数的铁路运量预测

4.1 基于最大Lyapunov指数的铁路运量预测步骤

(1)对时间序列{x(i),i=1,2,…,N}进行FFT变换[1],计算出平均周期p;

最后,不要随便掏耳朵。俗话说:“耳不掏不聋。”外耳道皮肤比较娇嫩,与软骨膜连接比较紧密,皮下组织少,血液循环差,掏耳朵时如果用力不当容易引起外耳道损伤、感染,导致外耳道发炎、溃烂。掏耳朵时稍不注意,还会伤及鼓膜或听小骨,造成鼓膜穿孔,影响听力。

(2)用C-C方法同时计算出嵌入维数m和时间延迟τ;

(3)根据时间延迟τ和嵌入维数m重构相空间{y(t),t=1,2,…,M};由C-C方法和G-P算法计算出时间延迟和嵌入维数;

(5)对相空间中每个点y(t),计算出该邻域点对的i个离散时间步后的距离dt(i)为

(6)对每个i求出x(i),即

式中 q为非零dt(i)的数目,并用最小二乘法做出回归直线,该直线的斜率为最大Lyapunov指数λ1.

选用铁路煤炭运量从1999年1月1日到2012年6月26日之间14年共4 926天增长量时序数据和增长率时序数据构成时间序列{x(t)},t=1,2,…,n,n=4 926.按照混沌动力学的理论,Lyapunov指数λ1的倒数Tm=1/λ1表示混沌系统最长预报时间.煤炭增长量λ1=0.030 8,则增长量最长预报时间Tm=1/λ1=32天;煤炭增长率λ1=0.025 3,从而增长率最长预报时间Tm=1/λ1=40天.比较二者最长预报时间,为提高预测精度,选取预测长度为30天.即在时间序列4 926个长度中,选取前4 896天数据进行相关参数的计算,后30天数据用作预测模型的检验.

4.3 预测结果及分析

依据上述的预测步骤,对铁路煤炭增长量时间序列和增长率时间序列进行最大Lyapunov指数预测,并与BP神经网络预测数据进行比较,将预测结果绘制成曲线如图5所示.曲线中“+”号代表真实值,“o”代表最大Lyapunov指数预测值,“*”代表BP神经网络预测值.用前4 896天的数据作为基础数据,来预测从第4 897天到第4 926天共30天的数据,并与实际值进行比较.其中,BP神经网络构建根据系统输入输出数据特点确定的BP神经网络结构.由3.3节得出煤炭增长量嵌入维数m=12,也就是说一个相空间含有12个状态变量,所以BP神经网络模型的输入层神经元个数为12;神经模型的预报步长为1,所以BP神经网络模型输出层的神经元数为1.计算隐层神经元的个数采用经验公式

式中 n1为隐层神经元个数;n为输入层神经元个数;m为输出层神经元个数;a为1-10之间的常数.

应用式(1)-式(5)计算煤炭增长量隐层神经元数4≤n1≤13,经试算选定隐层神经元的个数为5,最后确定铁路煤炭增长量神经网络模型结构为12-5-1,同理铁路煤炭增长率神经网络模型结构为12-6-1.得到铁路煤炭运量神经网络模型结构后,进行BP神经网络训练,然后仿真预测未来值,得到的预测结果如图5所示,并将真实值、最大Lyapunov指数预测值、BP神经网络预测值进行对比分析.从图5可以看出,最大Lyapunov指数预测结果前15天的数据预测值和真实值融合度很高;后15天的数据随着天数的增加,变化趋势是一致的,离散较小;而BP神经网络预测值误差相比最大Lyapunov指数预测误差大一些.结果表明,基于最大Lyapunov指数预测结果能很好地反映铁路煤炭日增长量和增长率的变化趋势,预测精度较高.

为了明确煤炭增长量和增长率的混沌预测效果,对预测结果的精度进行性能校验.本文用预测值与实际值的均方差作为评判预测效果的一个指标,如式(6)所示:

ESS小,说明预测值偏离实际值的程度小,预测效果较好;ESS大,说明预测值偏离实际值的程度大,预测效果就较差.实验表明,对于最大Lyapunov指数预测,影响ESS的主要因素有:被预测序列的混沌性,构造状态空间的维数m,确定预测点邻界状态的距离,序列长度N和预测长度L等.通过式(6)算出基于最大Lyapunov指数预测铁路煤炭增长量的误差为7.621%,煤炭增长率的误差为6.323%;BP神经网络预测铁路煤炭增长量的误差为16.927%,煤炭增长率的误差为15.673%.

图5 煤炭发送增长量和增长率时间序列预测Fig.5 Coal dispatched volume growth amount and growth rate time series prediction

5 研究结论

煤炭发送量是铁路货运中的重要指标,针对煤炭发送量相关时间序列的非线性特性,本文证明了铁路煤炭增长量和增长率为混沌时间序列,并应用C-C方法和G-P方法确定了煤炭发送量相关时间序列的嵌入时延和嵌入维数,探讨了时间序列重构吸引子的特点,并通过最大Lyapunov方法实现了煤炭增长量和增长率的预测,同时与BP神经网络预测结果进行对比.通过实例分析,结果表明:

(1)本文通过计算Lyapunov指数,得到煤炭增长量和增长率的Lyapunov指数处于[0,1]之间,说明数据有较强的拟周期性,可以进行有限步的预测,具备时间序列的混沌特性.在实际生产项目中,对增长量和增长率的预测往往比对发送量预测更有研究意义.

(2)本次研究根据时间序列的非线性特性,分别基于最大Lyapunov指数以及BP神经网络对铁路煤炭运量进行预测.实际预测结果表明,基于最大Lyapunov指数的混沌预测在逼近能力、分类能力和学习速度等方面均优于BP神经网络;而且由于BP神经网络算法有学习收敛速度较慢,容易陷入局部极小点等固有不足.从预测结果中可以清晰发现,采用基于最大Lyapunov指数预测模型可以得到更高的预测精度,从而更好地满足实际现场的需要.

[1] 吕金虎,陆君安,陈士华.混沌时间序列分析及应用[M].武汉:武汉大学出版社,2002:106-108.[LV J H,LU J A,CHEN S H.Analysis and application of chaotic time series[M].Wuhan:Wuhan University Press,2002:106-108.]

[2] 刘婷婷,邓克涛,马昌喜.模糊神经网络非线性组合预测在铁路货运量预测中的应用[J].铁道运输与经济,2008,39(9):91-94.[LIU T T,DENG K T, MA C X.Application of nonlinear combination forecast of fuzzy neural network on forecasting railway freight volume[J].Railway Transport and Economy,2008, 39(9):91-94.]

[3] 胡波,刘建民.基于层次结构模型的RBF神经网络货运量预测方法[J].长沙交通学院学报,2006,22 (4):61-64.[HU B,LIU J M.The radial basis function neural network modelforfreightvolume forecast based on hierarchy configuration model[J]. JournalofChangshaCommunicationsUniversity, 2006,22(4):61-64.]

[4] 李红启,刘凯.基于分形理论的铁路货运量分析[J].铁道学报,2003,25(3):19-23.[LI H Q, LIU K.Analysis of railway fright volume based on fractal theory[J].Journal of the China Railway Society,2003,25(3):19-23.]

[5] 聂伟,邵春福,杨励雅,等.分形理论在货运量预测中的应用探讨[J].物流技术,2007,26(2):104-108.[NIE W,SHAO C F,YANG L Y,et al. Application of fractal theory in freight volume forecast [J].LogisticsTechnology,2007,26(2): 104-108.]

[6] 张诚,周湘峰.基于灰色预测-马尔可夫链-定性分析的铁路货运量预测[J].铁道学报,2007,29 (5):15-21.[ZHANG C,ZHOU X F.Prediction of railway freight volumes based on gray forecast-markov chain-qualitative analysis[J].Journal of the China Railway Society,2007,29(5):15-21.]

[7] 平海.基于灰色系统理论的铁路货运需求预测[J].统计与决策,2005,29(5):57-58.[PING H.Prediction of railway freight volumes based on gray forecast[J].Statistics and Decision,2005,29(5): 57-58.]

[8] Packard N H,Crutchfield J P,Farmer J D.Geometry from a time series phys[J].Rev.Lett.,1980,45: 712-716.

[9] Takens F.Determining strange attractors in turbulence [J].Lecture Notes in Mathematics,1981,898: 366-381.

[10] Kim H S,Eykholt R,Salas J D.Nonlinear dynamics, delay times,and embedding windows[J].Physica D, 1999,127:48-60.

[11] Grassberger,Procaccia I.Measuring the strangeness of strange attractors[J].Physica D,1983(9):189-208.

[12] Wolf A,Swift J B,Swinney H L,et al.Determining Lyapunov exponents from a time series[J].Physica D,1985,16:60-67.

[13] 张卓,练继建.混沌神经网络综合法在边坡位移预测中的应用[J].哈尔滨工业大学学报,2009,41 (4):210-212.[ZHANG Z,LIAN J J.Slope displacement forecast using the combination of chaos and neural network[J].Journal of Harbin Institute of Technology,2009,41(4):210-212.]

Railway Coal Dispatched Volume Prediction Based on Maximum Lyapunov Exponent

WU Hua-wen,WANG Fu-zhang
(Institute of Computing Technology,China Academy of Railway Sciences,Beijing 100081,China)

The phase space reconstruction method of chaos theory is used to analyze the three groups of time series associated with railway coal dispatched volume.The embedded time-delay,embedded dimension,correlation dimension and the maximum Lyapunov exponent of each time series are separately calculated.The results are used to judge the chaotic characteristic of time series.The analytical results show as follows:the growth amount and growth rate of railway coal dispatched volume have chaotic characteristics while the coal dispatched volume doesn't.The maximum Lyapunov exponent method and BP neural network are separately used to forecast the growth amount and growth rate of railway coal dispatched volume.The result shows that the predicted data using maximum Lyapunov exponent method is anastomotic with the real data.The maximum Lyapunov exponent method is better than BP neural network in prediction.The maximum Lyapunov exponent prediction of chaos theory has extensive and practical value in railway coal dispatched volume time series prediction.

U29.39

A

U29.39

A

1009-6744(2013)06-0184-07

2013-06-24

2013-09-03录用日期:2013-09-23

铁道部科技研究课题(2007X008-G,2008X015-H).

吴华稳(1983-),男,河北唐山人,博士生.

*通讯作者:wfzh@rails.cn

Key words:railway transportation;railway coal dispatched volume time series;maximum Lyapunov exponent;chaotic judgment;phase space reconstruction

猜你喜欢
发送量增长量维数
β-变换中一致丢番图逼近问题的维数理论
云南:铁路客流持续回暖 单日旅客发送量连续超20万
一类齐次Moran集的上盒维数
不同配比的基质对不同多肉植物生长的影响
不同坡度和不同坡向对金花茶生长量的影响
金都1号火龙果果实发育过程中品质的变化规律分析
施用新型肥料对闽南桉树生长的影响
春运来了
关于齐次Moran集的packing维数结果
涉及相变问题Julia集的Hausdorff维数