肖淑敏,李印凤,2,刘妍煊,闫晨玉,傅航
( 1.华北理工大学 建筑与工程学院,河北 唐山063210;2.中国电科28所空中交通管理系统与技术国家重点实验室,江苏 南京210007;3.中国民用航空华北地区空中交通管理局,北京 100621)
随着社会经济的不断发展,民航旅客吞吐量也呈快速发展态势。民航运输以其高效性、国际性等优势成为世界经济发展中较快的行业。2019年我国仅飞机起降架次达到195.532 6万次旅客吞吐量达到10 001.143 8万人次。航空业务量预测是机场发展决策、规划建设的基础,是确定机场近期建设规划规模和远期预留控制的依据。北京作为中国的首都,随着生活水平质量的提高和大兴机场的开航更加促进了北京航空旅客吞吐量增长。在此趋势下,对北京两场航空旅客吞吐量进行科学、准确预测尤为重要。
国内一些专家、学者已对民航运输开展过许多研究工作,并已取得相应成果。舒严娇使用回归预测法对机场辐射区域内的旅客需求量进行预测,选择巢式离散模型得到旅客吞吐量[1];李明捷等运用灰色预测方法对未来的旅客周转量进行预测[2,3];陈玉宝等采用组合加权方法对预测结果进行组合预测,根据组合预测值和历史值的误差比较分析[4-6];张青青等运用灰色关联度计算相关影响因素,选取神经网络模型进行预测[7,8];Dantas等将Bagging 和Holt Winter 模型相结合,对航空运输需求进行预测,并与SARIMA和HoltWinters等基准方法作比较,提供了更为精确的预测[9]。WU Xiang-li 建立多元线性回归模型,对各省未来机场客货吞吐量及吞吐量增长率进行预测[10];李静娴等人对主流的航空运输业务量预测方法进行了详细的阐述和归纳[11]。
综上所述,目前的研究多侧重于利用单一模型做预测分析,而某一预测方法考虑因素相对单一,受个别因素影响大,容易产生较大误差。故本研究不考虑疫情原因带来的近几年短期影响(根据国际民航运输协会报告可知2024年航班运输水平即可恢复疫情前水平),从长期战略角度出发进行宏观预测,采用2010~2019年机场吞吐量数据,运用多元线性回归模型、时间序列趋势外推模型和灰色GM(1,1)预测模型分别对北京2030年旅客吞吐量进行预测,运用熵权法对3种预测模型进行分权组合,最终得出北京2030年旅客吞吐量,并对资源优化分配问题提出了建议措施。
1.1.1多元线性回归预测法
回归分析[12]是一种预测性的模型分析技术,它研究的是因变量(旅客吞吐量)和自变量(年份)之间的关系。其第一步需要找出影响预测值的主要变量,比如,北京的旅客吞吐量与GDP、第二、三产业增加值、交通运输仓储邮政业增加值、人口数等。
以此建立一般模型,如下:
y=α1x1+α2x2+…+αnxn+μ
(1)
式中:y是因变量,α1,…αn是回归系数,xn是自变量,μ是误差。
1.1.2趋势外推预测法
根据拟合直线方法的相关原理建立模型。公式如下:
(2)
(3)
(4)
1.1.3灰色GM(1,1)预测法
灰色GM(1,1)预测模型[15]是指对历史旅客吞吐量数据进行分析,推测未来变化趋势。该方法基于最小二乘法原理,通过累加生成弱化随机性较为规律的离散数据列,最大可能地将过去10年的真实数据拟合成曲线,并得到曲线对应的函数方程。
首先对已知10年的旅客吞吐量数据x0(t)进行累加,从而生成新的数列:x1(t)={x0(t1),x0(t2),…,x0(tn)。
然后根据数列x1(t)建立一个GM(1,1)模型,其微分方程为:
(5)
式中a、u是灰色参数,GM(1,1)基本模型的最小二乘估计参数列为:
(6)
其中:
(7)
将求的待定系数a、u带入元模型即可得到:
(8)
把计算所得到的值作累减算子还原得到所求数据的估计值:
(9)
以上过程均基于Python实现。
该研究主要目的是对航空旅客吞吐量进行预测分析,选择3种常规预测模型,进行利弊分析,得出结论:多元回归分析预测模型的优点为计算简单、精准度高,但是需要大量数据,且涉及种类较多;趋势外推模型简单,操作性较容易,但是仅能对变化稳定的数据进行预测;灰色预测模型对原始数据要求低,但是复杂度高,数学公式繁琐。因此采用鲁棒性强、单调性好、数据信息恒定和缩放无关性的熵权法,根据客观真实的数据,运用差异驱动原理尝试求得最佳权重,做到全面并且真实地反映指标信息,这使其赋权过程具有很高的信度和效度。利用客观赋值的熵权法得到每一年相关指标体系的误差大小,考虑到吞吐量预测是一个多指标的综合问题,不能孤立地看单一方法预测出的结果,需要借助每一种方法的不同误差进而得到每一种方法误差的贡献度,加权得到最后的预测比例。最终使用熵权模型得到各年份和预测方法的熵值与熵权。
1.2.1基本原理
熵权法是一种仅依赖于数据本身的离散性的客观赋权法。其客观权重是根据指标变异性的大小来确定的。在通过已知数据对未知数据进行预测时,若某个指标的信息熵越小,表明指标值的变异程度越大,提供的信息量越少,在综合评价中所能起到的作用也越小,其权重也就越小。
1.2.2基本步骤
该算法综合各种航空运输需求的影响因素,选取各个年份的误差作为相关系数指标,运用熵权法计算出各个方法的权重。依据权重将3种方法预测出的旅客吞吐量进行加权平均,从而预测出北京两场旅客吞吐量。具体的算法如下:
选取m个误差,n个预测方法。综合评价指标数值归一化:
(10)
其中dij为第i个误差值的第j个方法指标归一化结果,rij为第i个误差的第j个方法的数值,rmin为第j个方法指标当中的最小值;rmax为第j个方法指标当中的最大值。
3种方法指标比重计算:
(11)
其中,Pij为第j个方法指标中第i个误差所占比重。
各指标熵值的计算:
(12)
其中ej为第j个方法的熵值。
各指标权重的计算:
(13)
其中,wj为j个方法指标的权重,且0≤wj≤1。
误差综合评价指数计算:
(14)
其中,Di为第i个误差的综合评价指数
计算各个预测方法的权重Wk(k=1,2,…,h):
(15)
(16)
其中yk为第k种方法的旅客吞吐量。
根据国家统计局发布的2010~2019年北京经济、交通运输量,利用Python软件对旅客吞吐量的影响因素做了相关性分析,结果显示:北京的旅客吞吐量与GDP、人均GDP,第二、三产业增加值,交通运输仓储邮政业增加值、人口数、接待国际游客数、国内游客数、铁路旅客周转量、公路旅客周转量、航空运输业就业人数相关性显著。如图1所示为2010~2019年北京旅客吞吐量相关性分析。
图1 旅客吞吐量相关性分析
除以上北京的经济、计划、环境因素影响以外,在2019年以前,北京的旅客吞吐量主要由首都机场和南苑机场组成,2019年10月大兴机场开航后,南苑机场不再进行民航旅客运输,主要为首都机场和大兴机场。3座机场近10年的旅客吞吐量分布如表1所示。
表1 2010~2020北京旅客吞吐量分布/万人
(1)根据1.1.1中多元回归模型,计算得出:
y=8.97x1-0.1x2-9.8x3-8.27x4+2.47x5+0.3x6-8.04x7+8 063.197 29
(17)
其中,根据相关性分析可知,x1为“北京GDP”,x2为“北京人均GDP”,x3为“第二产业增加值”,x4为“第三产业增加值”,x5为“交通运输、仓储和邮政业增加值”,x6为“全国国内游客”,x7为“北京铁路旅客周转量”。此模型的决定系数R2=0.981 94>0.95,接近于1,拟合程度很高,平均误差为0.59%。
(18)
此模型的决定系数R2=0.99>0.95,接近于1,拟合程度很高,平均误差为0.86%。
(3)根据1.1.3中灰色GM(1,1)模型得出平均误差为0.70%。
计算所得3种方法的2010~2019年旅客吞吐量如图2所示,2010~2019年的平均相对误差分别为:0.59%、0.86%和0.70%,如表2所示。
图2 2010~2019年旅客吞吐量预测
表2 2010~2019误差分析/%
通过熵权法,使用python软件可以确定旅客吞吐量权重:多元线性回归:0.405 142 288;趋势外推:0.253 003 9;灰色预测模型:0.341 853 8。熵权大小反映了误差对预测方法的影响程度及重要性。预测结果和相对误差如表3所示。
表3 熵权法2010~2019年吐量预测与误差分析
由表3可知,由熵权法预测的近十年旅客吞吐量平均值为9 343.495万人,相对误差最小为0.1%,最大为1.25%,平均相对误差为0.63%,此结果相对误差值较小,在可接受范围内,故得到的预测值相对准确可信。利用预测模型,采用熵权法进行赋值,最终得出如图3所示2030年北京机场旅客吞吐量的预测结果。
图3 2021~2030年北京旅客吞吐量预测
由图3可知基于自身优势,得出的误差相对较小,最终预测北京两场2030年的旅客吞吐量为16 330.688 21万人次。
基于北京地区未来10年旅客吞吐量的宏观预测结果,为更好地发挥北京“一市两场”运行模式的优势,提出以下几点发展建议:
(1)根据旅客吞吐量预测结果,在预战术阶段进行两场飞行量的优化配置,充分利用两场互补的优势,对饱和机场进行分流,促进两场的协调发展,实现两场资源的统筹配置。
(2)在“一市两场”的模式下,逐年增高的旅客吞吐量促使各航司优化航班计划,根据其区位的不同为不同区域的旅客出行提供方便,带动不同区域的经济发展,从而带动京津冀地区的航空运输保障能力整体提升。
以多元线性回归模型、趋势外推模型和灰色GM(1,1)预测模型为基础,提出了基于熵权法赋值的组合预测方法,熵权法预测模型综合吸收了计算简单、精准度高、原始数据要求低等优点,避开其需要大量数据涉及种类较多等缺点,这种方法相比单一模型预测的结果能够减少极端数据的产生。最后对2030年北京两场旅客吞吐量进行了预测,并对未来资源优化分配提出2条建议。