吴建新
(天津滨海综合发展研究院天津300452)
基于ALI模型的沿海港口集装箱吞吐量短期预测分析
吴建新
(天津滨海综合发展研究院天津300452)
本文应用自动领先指数(A LI)模型建立了我国沿海港口集装箱月度吞吐量的短期预测模型,综合反映港口发展、贸易金融、中国与世界经济对沿海港口集装箱吞吐量的影响。分析得出的港口集装箱吞吐量预测结果与实际值较为吻合,实践证明该模型的短期预测效果要明显优于A R基准模型。
港口集装箱吞吐量;自动领先指数;A LI模型;动态因子
作为经济全球化的重要载体,港口集装箱物流推动了生产、贸易与资本运作的全球化,加速了商品、资金在全球范围内的流动和配置,促使各国经济日益相互依赖、紧密联系。上海、深圳、天津等我国一些具备天然深水优势、经济腹地广阔、集疏运系统完备的港口城市已崛起成为国际航运枢纽港口,并逐步成为全球性的综合物流服务基地、商品物资集散地和金融贸易中心。
国际金融危机过后,世界经济已进入转折期,我国沿海港口集装箱吞吐量受外向型经济影响程度更大,走势存在较多变数。港口集装箱吞吐量预测对制订港口发展战略、投资计划,确定港航企业经营策略,建设集装箱空箱调运交易平台以及调配城市集疏运系统等都具有重要意义。特别是当前我国沿海集装箱运输业的市场波动日益频繁,行业监测预警技术研究就显得更为重要。
现有的港口集装箱吞吐量预测方法主要有指数平滑法、灰色预测法、神经网络法等,已有文献多是针对港口集装箱的年度数据,关注我国集装箱运输的长期趋势问题,在国际金融危机持续影响下,集装箱运输业的短期波动问题更值得人们关注[1]。虽然有一些学者已开始研究集装箱吞吐量的月度数据,但受困于建模工具限制,或仅用时间变量做一元回归,或利用较少的影响集装箱月度吞吐量的指标,遗漏了一些其他重要的因变量。总之,学界已就存在诸多影响集装箱吞吐量的因素问题达成共识,从单因素或少量因素入手进行分析将很难剖析影响港口集装箱吞吐量的机理,从而影响预测的准确性,但建模工具的不完善使目前的预测方法存在变量考虑少、模型不够精确等需要改进的问题。
向量自回归模型(VAR)在经济预测领域享有盛名,其注重原始数据,较多地应用于高频数据的预测之中。但随着VAR模型所包含的变量的增多,待估参数将呈指数型增长,这使得VAR模型只能控制在较小的规模上,在一定程度上制约了VAR模型的应用。如周健等虽然选取了16个对影响集装箱吞吐量的16个因素进行相关性分析,但受观测数据样本限制,最终只选用4个因素与集装箱吞吐量进行VAR建模[2]。
经济变量往往存在周期性波动现象,我国沿海港口集装箱吞吐量也存在季节性现象[1]。Camba-Mendez等提出的“自动领先指数”(Automatic Leading Indicator,ALI)方法[3],在测算过程中不仅包括了过去计算领先指数和同步指数所采用的高频月度数据,而且同时也纳入了含缺失数据的月度数据以及季度数据,充分应用了相关信息,极大地提高了模型预测的准确度。
一般来讲,ALI模型的建立分两步进行,一是用动态因子模型提取因子,二是用VAR模型对相关指标进行预测[4],具体可参考文献[5]中的介绍。
对预测变量yt,设n维列向量xt为其解释变量,通过如下动态因子模型,可将n个解释变量压缩为m个动态因子ft:
上式中,A(m×m)、B(n×m)为待估系数矩阵,et为n维扰动向量,ut为m维扰动向量。上述状态空间模型可用卡尔曼滤波求解。除观察法外,Bai和Ng以及Onatski分别发展了估算因子数目的定量方法。本文选用上述三种方法分别确定动态因子数目,并取其中的最大值确定为动态因子数。接下来将上述解得的动态因子与预测变量建立向量自回归模型,然后就可对预测变量进行预测。
本文选定的预测目标为我国沿海港口集装箱月度吞吐量,相较于全国港口集装箱吞吐量指标,该指标更能反映我国港口经济受全球市场波动的影响。当前,我国沿海各地正掀起新一轮港口开发建设热潮,但港口发展的规模不能大于市场的需求,或是超过港口城市的基础设施承载能力,否则会造成供给过剩。准确预测港口集装箱吞吐量的月度变化,有助于相关部门提前做好安排调度,打通交通等节点问题,避免设备闲置、资源浪费。港口集装箱的影响因素很多,传统预测方法,考虑变量较少、精度不高。本文针对这些问题,选择能从高维宏观经济信息集中提取因子的动态因子模型,在港口集装箱吞吐量预测文献所选取的指标基础上,本文变量集囊括了更多宏观经济数据,共四大类18个指标,详见表1。
本文所用数据均来自Wind资讯金融终端的经济数据库。由于交通部公布的港口月度数据不含每年的12月份值,因此分别选择沿海港口集装箱吞吐量等四个港口发展指标的月度累计值,通过对其求月度环比数据增量,得到每月的数据,初始变换后的这四项主要指标的起始日期为2001年3月,其他指标的起始日期都要早于这一日期,因此将样本集的起始日期统一设定为此日期。
表1 我国港口集装箱预测模型的变量选取类型
对原始序列进行初始变换后,用ADF方法分别检验原始变量序列的平稳性。
理论上讲,一些宏观经济存量指标存在季节因素,但求取年同比增长率季节影响很小,故本文中暂未做相应处理。接下来对所有变量进行标准化处理,采用的方法是每个指标减去其平均值然后再除以标准差。最后,得到的最终样本集含有1个因变量,17个解释变量,样本期从2003年3月至2015年3月。17个解释变量中,有5个变量含有缺失数据或为低频数据,剩余12个解释变量为不含缺失数据的月度变量。
首先,为了验证ALI模型的可信度,笔者以样本期2003年3月至2014年3月进行建模,将2014年4月至2015年3月的数据用于验证预测结果。数据分析利用EViews软件。按照第2节介绍的ALI基本原理,分步骤展开论述。
1.求动态因子数目
由于不论是采取主成分分析的方法,还是Bai-Ng或Onatski的方法,所用于提取动态因子数目的数据集都是相同频率的,因此用12个不含缺失数据的月度变量组成数据集,并分别用三种方法确定因子数目为7个、7个、5个。其中主成分法选取因子个数的依据为使得方差累积贡献率达到85%以上,该原则能够确保从选取的解释变量中提取尽可能多的信息。因此选取三种方法确定的最大因子数7作为该样本集的动态因子数目。
表2 ALI模型与AR模型向前12期的RMSE值比较
2.求解状态空间模型
由于状态空间模型允许混频数据以及数据含缺失值,将7个因子及其相应的一阶滞后变量确定为状态空间模型的状态方程,将17个解释变量与7个因子分别组成的17个回归方程确定为状态空间模型的量测方程,因子的初值选为主成分分析法确定的7个主成分。用卡尔曼滤波算法迭代求解,最终得到该样本数据集的7个动态因子。
3.VAR模型预测
将上步得到的7个动态因子与经数据变换后的沿海港口集装箱吞吐量变量建立向量自回归模型,经综合考虑AIC和SC信息准则,确定VAR模型的滞后阶数为2。以上述VAR模型进行12期预测,模型的静态拟合与动态预测结果如图1所示。
图1 ALI模型的拟合与预测效果
为比较ALI模型的预测效果,对经过平稳性与标准化变换后的沿海港口集装箱吞吐量变量建立AR模型,经模型滞后阶数检验,选定AR(5)模型,用RMSE作为衡量模型预测效果的指标,对于从2014年4月的向前12期预测,两个模型的表现列于表2中。
从表2中可以清楚地看出,在6个月以内预测期中,ALI模型的预测效果要明显优于AR基准模型,6个月以上期限两者的预测效果则难分伯仲。
本文采用自动领先指数模型这一短期预测领域内的最新方法,对我国沿海港口集装箱吞吐量月度数据进行了预测。模型经验证拟合程度较高,预测值与真实值在短期内较为吻合,短期预测效果要明显优于AR基准模型。现阶段我国沿海港口集装箱运量日益受到多方面因素影响,建议相关部门和企业结合ALI等模型的预测结果,密切关注相关指标变化,提早进行针对性研究,以便适时果断地采取应对措施。
[1]朱吉双.我国沿海港口集装箱吞吐量的季节性及其调整方法[J].中国水运,2010(11).
[2]周健,郑莉,武丽.我国月度集装箱吞吐量集成预测——基于SARIMA、PDL和VAR模型的实证[J].中国水运,2013(3).
[3]Camba-Mendez,G.Et al.An Automatic Leading Indicator of EconomicActivity:ForecastingGDPGrowthforEuropean Countries[J].Econometrics Journal,2001(4).
[4]何新华.中国需警惕高通货膨胀突现[A].何新华,刘世国.世界经济解读:2010—危机、对策与效果[C].北京:中国财政经济出版社,2010.
[5]吴建新.港口月度集装箱吞吐量预测研究[J].城市, 2015(12).
责任编辑:张明