基于季节调整的中国航空客运量预测研究

2023-07-10 07:08陶瑞
物流科技 2023年8期
关键词:遗忘曲线情感因素

陶瑞

摘 要:受重大突發事件影响,民航业遭遇巨大冲击,导致航空客运量数据规律变得更加复杂。月度航空客运量序列中季节性因素会影响航空客运量预测的准确性,而随着居民生活逐渐恢复正常,情感因素成为影响居民出行的关键因素。为此,文章基于季节调整预测模型,找寻航空客运量数据中存在的一般规律,对2023年3月—2025年12月的航空客运量数据进行预测,并给出合理化建议。首先,利用季节调整模型对2019年1—12月的客运量序列进行仿真预测。其次,验证模型有效性,并得到仿真预测的2023年3月—2025年12月航空客运量。最后,考虑情感因素对航空客运量的影响,拟合遗忘曲线,并以此对预测结果进行修正,得到最终预测结果。利用该预测模型找出航空客运量数据的规律,能够为交通运输管理提供更科学可靠的决策支持。

关键词:航空客运量预测;情感因素;遗忘曲线

中图分类号:F252文献标志码:ADOI:10.13714/j.cnki.1002-3100.2023.08.024

Abstract: Influenced by major emergencies, the civil aviation industry has been greatly impacted, resulting in enhancing the complexity of the regularity of air passenger volume data. Seasonal factors in the monthly air passenger volume series will affect the accuracy of air passenger volume forecast. With the gradual recovery of residents,lives, emotional factors have become the key factors affecting residents,travel. Therefore, based on the seasonal adjustment prediction model, this paper seeks the general rules in the air passenger volume data, forecasts the air passenger volume data from March 2023 to December 2025, and gives reasonable suggestions. First, the seasonal adjustment model is used to simulate and forecast the passenger volume series between January and December 2019. Secondly, the paper verifies the effectiveness of the model and obtains the simulated predicted air passenger volume from March 2023 to December 2025. Finally, considering the impact of emotional factors on air passenger volume, a forgetting curve is fitted, and the prediction results are corrected accordingly to obtain the final prediction result. Using this prediction model to identify the patterns of air passenger volume data can provide more scientific and reliable decision support for transportation management.

Key words: air passenger volume forecast; emotional factors; the forgetting curve

0    引    言

随着科学技术的飞速发展和国家经济水平、人民生活水平的日益提高,公众对更加便利的出行方式和更加快捷的运输工具的需求不断增加。然而,受重大突发事件的影响,民航业受到巨大冲击。对政府来说,准确预测未来航空客运需求是政府机构进行航空运输系统各组成部分投资预算和政策制定的重要依据。研究表明,航空客运量需求预测的准确度每提高10%,航空公司的收益就能相应提高1%~4%。因此,研究如何提高航空客运需求量预测准确度对我国的民航业和区域经济发展有着十分重要的意义。

对于航空客运量预测的研究,始于20世纪50年代。闻克宇等(2020)[1]在经典提升(Boost)算法的基础上,提出了高铁短期预测模型。Gunter等(2021)[2]利用全局向量自回归(GVAR)模型对全球最繁忙机场前20名的客运量进行了预测。梁小珍等(2017)[3]提出了基于奇异谱分析(SSA)的集成预测模型来预测航空客运量。陈荣等(2017)[4]运用组合模型对旅游突发事件的客流量进行了预测。李晓炫等(2017)[5]提出了基于网络搜索的CLSI-EMD-BP组合预测模型,对旅游客运量进行了预测。Shaolong Sun(2019)[6]提出了基于MIV的非线性向量自回归神经网络(NVARNN)方法来预测航空客运量。Feng Jin等(2020)[7]提出了VMD-ARMA/KELM-KELM混合方法进行预测。模型平均法被广泛应用于组合预测。张健等(2020)[8]提出时变模型平均方法,并进行了实证分析。周建红等(2020)[9]建立了多个随机前沿预测模型,并通过CV交叉验证准则对模型进行平均。Shuojiang Xu(2019)[10]提出的SARIMA-SVR模型可以用来预测航空业的统计指标。梁小珍等(2021)[11]基于网络搜索数据和历史航空客运量数据构建了两阶段的分解集成预测模型,并对航空客运需求进行了预测。Chan等(2021)[12]使用神经格兰杰因果关系模型,得到了能够反映单向神经格兰杰因果关系与樟宜机场到达航空乘客数量的搜索词。Jinghua Wang等(2023)[13]利用恢复率和累积损失将新冠感染对航空客运量的影响。

当前,学者们对于客运量需求预测的研究主要基于找寻历史数据中存在的规律,以此来对未来的航空客运量数据进行预测。然而,受此次突发事件影响,航空客运量数据波动较大,规律性变得不明显,且考虑情感因素对预测结果影响的研究较少。基于以上分析,本文研究的基本思路为:先利用季节调整方法对原时间序列进行分析,仿真预测航空客运量;再定量分析居民情感因素对航空客运量的影响值,拟合遗忘曲线,以此对季节调整模型结果进行修正。

1    模型构建

针对中国航空客运量在2019年之前存在较为明显的季节性和周期性变动情况,采用季节调整模型对其进行研究。

1.1    季节调整模型和预测

目前,广泛使用的季节调整程序是美国普查局开发的X-13-ARIMA-SEATS,程序主要包含两个阶段。

1.1.1    regARIMA建模阶段

此阶段可以识别和处理各类离群值,如式(1)所示。

式(1)中:Yt为航空客运量序列在t期的观测值;P,Q,p,q分别表示季节与非季节自回归和移动平均算子的最大滞后阶数;d,D分别表示非季节和季节性差分次数;Op(L)、ΦP(L)分别是非季节自回归过程AR和季节自回归过程SAR的滞后算子多项式;(1-L)d、(1-LC)D分别是对序列Yt-Σtβixit的非季节差分和季节差分滞后算子,xit是与Yt同期观测的外部回归变量;C是季节差分的步长;εt是独立同分布的,均值为0,方差为σ2。

1.1.2    X11季节调整过程

本文将航空客运量序列分解成加法模型,如式(2)所示。

其中,Tt为长期趋势、St为季节波动、εt为不规则波动、Dt为交易日。应用多次迭代的移动平均方法估计趋势循环成分,原始序列减去趋势成分后形成不规则成分序列和季节成分序列Ai;按月应用移动平均估计季节成分后,原始序列减去季节成分序列后就可得到季节调整后序列Bi。

之后,对趋势成分使用ARIMA模型进行拟合。季节周期为12个月,使用同期历史均值进行预测。不规则波动则使用历史平均值进行预测。最终将三个分量组合,得到季节调整模型仿真预测数据,将其与BP神经网络预测模型预测结果进行对比分析。

1.2    遗忘曲线

遗忘曲线由德国心理学家艾宾浩斯提出,其描述了人们对于事物记忆的一般规律。遗忘在学习之后立即发生,起初遗忘速度很快,之后逐渐缓慢。遗忘曲线的一般形式如下。

其中,Ri为随时间变化的回忆值,c为系数,L为记忆痕迹的强度。根据模型预测值和真实观测值可得到Ri的值。使用最小二乘法对其进行拟合。

其中,ri为季节调整模型预测值与真实值的差值,求解得到参数c和L的值。

1.3    季节调整模型预测值修正

本文考虑居民情感因素对航空客运量造成的影响,以此对预测数据进行修正。

2023年3月—2025年12月客运量计算公式如式(6)所示。

其中,Y为调整后预测值;N为季节调整模型预测值。

1.4    模型框架

综上所述,本文基于考虑心理因素构建了季节调整预测模型。提出的预测方法包括以下几个步骤,具体流程见图1。

1.4.1    进行季节调整

第一阶段,检测航空客运量序列中的离群值。基于季节调整方法原理,剔除离群值影响,确定进入regARIMA模型的离群值变量。第二阶段,利用季节调整方法对负荷序列进行季节调整,获得消除各类离群值的季节调整后序列和季节成分序列。第三阶段,对趋势成分使用ARIMA模型進行拟合,得到季节调整预测序列,然后对季节成分序列使用历史均值进行预测。

1.4.2    求得遗忘曲线方程

对2022年12月、2023年1月和2023年2月的三组数据联立方程,求解得到三组由于情感因素导致的航空客运量损失量,并根据这三组数据,使用最小二乘法拟合遗忘曲线。

1.4.3    模型预测结果修正

将不含情感因素影响的模型预测结果与遗忘曲线相组合,得到含有居民情感因素影响的预测模型,并以此为基础,对未来的预测值进行修正,得到最终的预测结果。

2    实证分析

2.1    数据来源与处理

根据以上对航空客运量需求影响的分析,本文选取2009年1月—2023年2月全国航空客运量月度数据(数据来源于国家统计局和中国统计年鉴)。根据模型需要,对以上数据做归一化处理。

2.2    季节调整实证结果分析

本文使用EViews软件提供的X-13-ARIMA程序对2009—2018年原航空客运量序列进行季节调整并预测,经过两个阶段调整,得到季节调整模型仿真预测序列,如图2所示。

EViews软件提供了11种统计量来判断季节调整的质量。M1-M11的结果为(0.244,0.108,0.099,0.690,0.352,0.139,0.342,0.549,0.346,0.543,0.504),根据结果加权计算出Q统计量为0.35,系统显示接受。同样,谱线图中显示垂线没有落在谱图的峰值上,因此季节调整结果是可接受的。

用于对比分析的BP神经网络模型,采用滚动方式生成样本,即使用t-1,t-2,t-3......期的样本数据作为输入值,以第t期的样本数据为输出值。本文使用前4期数据作为输入值,第5期数据作为输出值,共得到132组数据。再按照70%和30%的经验比率将样本分为训练样本和测试样本,即分成了92组训练样本和40组测试样本。

BP神经网络模型为经典的三层结构,输入层神经元个数为4个,隐含层神经元个数为6个,输出层神经元个数为1个。输入层与隐含层之间的激活函数为Sigmoid函数,隐含层与输出层之间的激活函数为Trainlm函数。对模型进行训练和预测,得到预测结果及模型对比分析(如表1所示),模型拟合度选择平均绝对百分比误差(MAPE)。

经过对比结果,可以看出季节调整模型在航空客运量序列预测的精度上要明显高于BP神经网络模型,因此可以用于对航空客运量的预测。

2.3    遗忘曲线

针对此次突发事件,在国家政策改变以后,居民起初对此持有怀疑态度,并且对于出行方面的选择也更加偏向于私有出行方式,尽量避免与外人有过多接触。因此,2022年12月份的客运量数据相较于11月,增量并不明显。后来,随着时间推移,居民正常生活秩序逐渐恢复,2023年1—2月客运量也开始迅速增长。可以观察到,情感因素的影响起初很高,之后大幅下降,最后逐渐减缓,这一过程符合遗忘曲线的一般规律。因此,本文选用遗忘曲线来分析情感因素对航空客运量的影响。

2022年12月及之后的客运量数据,主要受到季节因素和居民情感因素影响。因此,航空客运量实际值可以由客运需求值减去居民情感因素导致的客运量损失值计算。由此可以得到,2022年12月、2023年1月和2023年2月由于居民情感因素导致的客运量损失值分别为4 658万人、2 830.94万人和1 458.11万人。

使用最小二乘法拟合遗忘曲线,得到最终情感因素导致客运量损失函数为

2.4    季节调整模型预测值修正

首先,根据式(7),计算2023年3月—2025年12月居民情感因素导致的客运量损失值集合(884.996 657,505.510 489 5,288.791 883,164.928 928,94.185 723 5,53.784 786 5,30.757 915,17.540 324 5,10.058 669 5,5.735 935 5,3.242 050 5,1.828 849,1.080 685,0.581 906 5,0.332 518,0.166 259,0.083 129 5,0.748 165 5,0.033 251 8,0.024 938 85,0.008 312 95,0.006 650 36,0.003 325 18,0.001 662 59,0.001 246 943,0.000 731 54,0.000 415 648,0.000 232 763,0.000 133 007,0.000 074 816 6,0.000 041 564 8,0.000 024 938 9,0.000 014 132 0,

0.000 008 313 0)。从集合中可以看到,情感因素损失值逐渐减小。由此对季节调整模型预测值进行修正,得到模型预测值集合(6 050.83,6 411.64,6 661.74,6 689.75,7 273.23,7 531.67,7 010.10,7 268.43,6 920.66,6 921.86,7 159.51,

7 237.48,7 333.35,7 315.17,7 348.81,7 253.12,7 765.95,7 983.30,7 439.43,7 684.55,7 329.31,7 326.20,7 561.35,

7 637.92,7 733.04,7 714.36,7 747.74,7 651.89,8 164.63,8 382.66,7 838.07,8 083.18,7 727.93,7 724.81)。

根据预测结果显示,情感因素导致的航空客运量损失值一直在逐渐减小,直至趋近于0。预计到2023年3月,中国航空客运量就会恢复并超过2019年同期客运量。目前,中国民航业正处于恢复阶段,未来的一段时间将处于平稳上升期,2023年度客运总量将会超过2019年,且逐年递增。

3    结论与展望

本文基于考虑心理因素构建了一个季节调整和回归分析相结合的预测模型,对我国航空客运量需求进行了分析预测。本文的创新性在于考虑人民情感因素对航空客运量数据的影响,从中找寻历史发展规律,并利用模型进行了预测,为中国民航业发展提供了参考性建议。因此,本文的研究结果具有一定的现实意义,具体结论如下。

首先,考虑人民情感因素对航空客运量的影响后发现,影响程度起初很大,然后剧烈下降,之后下降趋势趋于平缓,符合遗忘曲线的一般发展规律,可以用于分析情感因素对航空客运量的影响。

其次,建立季节调整模型,对2019年1—12月客运量数据进行拟合后發现,拟合效果较好,可以将其用于航空客运量数据的预测。因此,利用季节调整模型对2023年3月—2025年12月的航空客运量月度数据进行了预测,并使用遗忘曲线进行结果修正。从预测结果上看,预计到2023年3月,中国航空客运量会恢复并超过2019年同期客运量,且呈逐年上升趋势。

最后,针对不断提升的航空客运量需求,民航业应当扩大内需和消费,积极开发新的发展模式,实现行业可持续发展。民航业仍需不断变革,优化业务结构,降低服务成本。还要不断创新符合自身发展的生产模式,全面推进智慧民航建设,以数字化转型带动行业高质量发展。

由于本文样本数量不够大,仅凭样本不能完全反映影响我国航空客运量的相关因素,会造成模型预测结果与实际结果发生偏差。因此,在未来的研究中,研究者可以考虑将后续航空客运量数据代入模型中,使求得的参数更具说服力。也可以将更多影响因素加入模型中,从而获得更好的预测结果。

参考文献:

[1] 闻克宇,赵国堂,何必胜,等.基于改进迁移学习的高速铁路短期客流时间序列预测方法[J].系统工程, 2020, 38(3):11.

[2] GUNTER U, ZEKAN B.Forecasting air passenger numbers with a GVAR model[J].Annals of Tourism Research,2021,89(C):1-20.

[3] 梁小珍,喬晗,汪寿阳,等.基于奇异谱分析的我国航空客运量集成预测模型[J].系统工程理论与实践,2017,

37(06):1479-1488.

[4] 陈荣,梁昌勇,陆文星,等.面向旅游突发事件的客流量混合预测方法研究[J].中国管理科学,2017,25(05):167-174.

[5] 李晓炫,吕本富,曾鹏志,等.基于网络搜索和CLSI-EMD-BP的旅游客流量预测研究[J].系统工程理论与实践,2017,

37(01):106-118.

[6] SUN Shaolong, LU Hongxu, TSUI Kwok-Leung, et al.Nonlinear vector auto-regression neural network for forecasting air passenger

flow[J].Journal of Air Transport Management,2019,78:54-62.

[7] JIN Feng, LI Yongwu, SUN Shaolong, et al.Forecasting air passenger demand with a new hybrid ensemble approach[J/OL].Journal

of Air Transport Management,2020,83(4).https://www.sciencedirect.com/science/article/pii/S0969699719302261.

[8] 张健,孙玉莹,张新雨,等.基于时变模型平均方法的我国航空客运量预测[J].系统工程理论与实践,2020,

40(6):1509-1519.

[9] 周建红,邝雄,陈志明,等.我国航空客运量需求预测模型:基于随机前沿预测模型和模型平均[J].系统工程理论与实践,

2020,40(11):2861-2871.

[10]  XU Shuojiang, CHAN Hing-Kai, ZHANG Tiantian.Forecasting the demand of the aviation industry using hybrid time series SARIMA-

SVR approach[J].Transportation Research Part E: Logistics and Transportation Review,2019,122:169-180.

[11]  梁小珍,张晴,杨明歌.面向网络搜索数据的航空客运需求两阶段分解集成预测模型[J].管理评论,2021,33(5):236-245.

[12]  LONG C L, GULERIA Y, ALAM S.Air passenger forecasting using Neural Granger causal Google trend queries[J/OL].Journal of Air

Transport Management,2021, 95(3).https://www.sciencedirect.com/science/article/pii/S0969699721000661.

[13]  WANG Jinghua,  ZHANG Zhao, LU Guangquan, et al.Analyzing multiple COVID-19 outbreak impacts: A case study based on

Chinese national air passenger flow[J/OL].Transportation Research Part A: Policy and Practice,2023,169(11). https://www.

sciencedirect.com/science/article/pii/S096585642300006X.

猜你喜欢
遗忘曲线情感因素
遗忘曲线在高中数学教学中的应用初探
妙用心理学提高思想政治教学效率探析
英语词汇学习浅析
中学课堂启发式教学之思考
浅析情感因素对二语习得的影响及启示
浅析品牌设计中体验营销的情感因素
情感因素与外语教学
情感因素对高校训练队训练影响分析
艾宾浩斯记忆模型在电力运维自学习系统中的应用与研究
落实“两个关注”,促使课堂评价走向有效