自适应动态三次指数平滑法在交通预测中的应用

2019-11-19 08:26曹邦兴
关键词:发送量平方和预测值

曹邦兴

(广州大学松田学院,广东 广州 511370)

指数平滑法是时间序列分析的一个重要分支,具有适应性强、容易操作等优点,被广泛应用于各个领域的预测.在预测城市交通流量、铁路旅客发送量、港口吞吐量和道路交通事故量等有一定趋势的非线性时间序列时,三次指数平滑法具有理论简单、预测效果好等特点,被众多研究人员采用.但在传统三次指数平滑法预测模型中,平滑系数是静态的,一旦确定就始终固定不变,难以跟踪时间序列随时间变化的因素,无法反应不同时间段的历史数据对预测结果的影响,从而影响预测精度.鉴于此,笔者拟提出一种改进的动态三次指数平滑法,该方法使用误差平方、最小原则和地毯式搜索算法来获得动态调整的平滑因子.

1 传统三次指数平滑法

三次指数平滑法是在二次指数平滑法基础上再进行一次平滑,主要用于有明显趋势且呈非线性的时间序列的预测.其基本模型如下:

(1)

(2)未来数据的预测.设T为自t时点起向前预测的时点的期数,at,bt,ct为3个预测系数,且

则第t+T期的预测值[2]Yt+T=at+btT+ctT2.

β的取值在0.1~0.9之间[2].为了确定合适的值,可以设定开始时β=0.1.计算出全部已知历史数据Xt与相应期数的预测值Yt的误差平方和后,取步长λ=0.01,重新计算β=0.11时的误差平方和.如此循环,直到计算出β=0.9时的误差平方和,按误差平方和最小原则选定对应的β值作为最终的平滑系数值,然后以此平滑系数值对未来数据进行预测.

上述计算可在MATLAB软件中编程实现.需注意的是,平滑系数一旦确定,在未来的预测中就始终是同一个固定值.

2 改进的自适应动态三次指数平滑法

在采用三次指数平滑法进行实际预测时,平滑系数是静态的.若时间序列数据变化幅度较大,则预测模型的适应性下降,从而影响到预测精度.为此,笔者建立了一种改进的动态三次指数平滑法,使平滑系数能够不断跟进时间序列数据的变化并自动作出相应调整.其实现过程如图1所示.

图1 自适应动态三次指数平滑法模型流程Fig. 1 Flow Chart of Self-Adaptive and Dynamic Cubic ES Method

将(1)式展开,得到

(2)

(1)历史数据的平滑.令Xk,t=Xk+t-1,t=1,2,…,N,N为每次预测时选取的历史数据的期数,则历史数据的平滑公式改写为

(2)预测精度的评价.最小误差平方和

(3)

(3)未来数据的预测.3个预测系数相应改成

(4)

则第t+T期的预测值

Yk,t+T=ak,t+bk,tT+ck,tT2.

(5)

与静态平滑系数β不同,动态平滑系数φk,t是期数t的函数,随着预测次数k和预测期数t的变化而改变,能够跟踪时间序列随时间大幅度波动的变化趋势,提高了适应性,从而提高了预测精度.

3 仿真实例分析

在现实生活中,交通状况不但关系着普通百姓的出行,也事关社会和国民经济的协调健康发展,对城市道路交通流量、铁路旅客发送量、全国公路运输量、港口吞吐量和道路交通事故量等进行有效预测,能够为各级政府和职能部门科学制定规划、合理配置资源等提供参考信息.上述交通流量、运输量和事故发生量等,都具有波动范围大、非线性变化和趋势性等特点,非常适合用三次指数平滑法模型对未来数据进行预测.如黄荣富等[3]利用三次指数平滑法模型来预测港口吞吐量,郝军章等[4-6]利用SARIMA模型、灰色马尔柯夫过程和灰色线性回归组合模型等来预测我国铁路旅客运量.

笔者以我国铁路旅客发送量为例,选取2003—2018年实际发送量的原始数据(数据摘引自中华人民共和国交通运输部和国家铁路局历年《铁道统计公报》)作为样本,采用自适应动态三次指数平滑法对2019—2021年的全国铁路旅客发送量进行预测.

根据图1所示的自适应动态三次指数平滑法模型流程,算法可按以下具体步骤实现:

(ⅰ)采用一段时间的历史实测数据,如采用第1期到第N期的共N期数据实测数据{X1,1,X1,2,…,X1,N}={X1,X2,…,XN},在动态的三次指数平滑模型的基础上,根据误差平方和最小原则,由(3)—(5)式确定平滑因子β1;

(ⅱ)通过(5)式运用自适应动态三次指数平滑法进行预测,得到第1次的第N+1期的预测值,即第N+1期的铁路旅客发送量;

(ⅲ)去掉最早的那个数据,将第N+1期的铁路旅客发送量预测值作为X1,t+1,再次运用自适应动态三次指数平滑模型,根据误差平方和最小原则,由(3)—(5)式确定新的平滑因子β2;

(ⅳ)利用第2期实测数据到第N+1期实测数据{X2,1,X2,2,…,X2,N}={X2,X3,…,XN+1},来预测第2次的第N+2期的铁路旅客发送量;

(ⅴ)依此类推,更新旅客发送量时间序列{Xk,1,Xk,2,…,Xk,N}={Xk,Xk+1,…,Xk+N-1},由(3)—(5)式得到新的平滑因子βk,继续预测后期的旅客发送量YN+k,直到规定的时刻为止.

预测结果的相对误差 =(预测值-实测值)/实测值×100%,为了避免正负误差相互抵消,平均相对误差用预测结果的相对误差取绝对值之后再取平均值.3种算法预测结果的相对误差与平均相对误差见表1.

表1 3种算法预测结果的相对误差与平均相对误差

分析2006—2018年共13年的平均相对预测误差,三次指数平滑法的为2.747%,SARIMA模型的为2.018%,自适应动态三次指数平滑法的为1.269%,由此可知自适应动态三次指数平滑法具有明显的优势.自适应动态三次指数平滑法的年度最大相对预测误差发生在2011年(-3.14%),年度最小相对预测误差发生在2017年(0.13%),即期数为13的预测区间内相对预测误差范围为0.13%~3.14%,平均值为1.269%,其预测精度和整体稳定性都是令人满意的.

将自适应动态三次指数平滑法用趋势外推的方法,可得到2019,2020,2021年的铁路旅客发送量预测值分别为370 513,401 668,433 257万人.

4 结语

针对传统三次指数平滑法的不足,提出了一种改进的动态三次指数平滑法.将该方法与SARIMA模型、三次指数平滑法进行对比,通过铁路旅客发送量的仿真实例分析结果可知,该方法能更好地适应时间序列的变化趋势,具有良好的预测精度,可以广泛应用于预测城市道路车辆通过量、民航旅客发送量、港口吞吐量、道路交通运输量和道路交通事故量等.

猜你喜欢
发送量平方和预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
AI讲座:ML的分类方法
云南:铁路客流持续回暖 单日旅客发送量连续超20万
费马—欧拉两平方和定理
利用平方和方法证明不等式赛题
勾股定理的扩展
春运来了
关于四奇数平方和问题