港口物流对当地经济的混频预测分析

2022-06-26 22:46刘凤丹范国良
上海海事大学学报 2022年2期
关键词:模型

刘凤丹 范国良

摘要:为深入探究港口物流与当地宏观经济的内在联系,采用混频数据抽样(mixedfrequency data sampling, MIDAS)模型分析国内5个省市港口的月度港口货物吞吐量增长率对其季度GDP增长率预测的有效性。研究结果表明:港口货物吞吐量表征的港口物流对当地GDP具有较好的预测效果;相较于传统的季节性自回归综合移动平均(autoregressive integrated moving average, ARIMA)模型,MIDAS模型能夠捕捉高频解释变量的有用信息,提高预测精度。

关键词:  港口货物吞吐量; GDP; 混频数据抽样(MIDAS)模型; 经济预测

中图分类号:  F552.7文献标志码:  A

Mixed frequency prediction analysis of local economy

using port logistics data

Abstract: In order to deeply explore the internal relationship between the port logistics and the local macroeconomy, the mixedfrequency data sampling (MIDAS) model is adopted to analyze the effectiveness of using the monthly port cargo throughput growth rate of Chinese five provinces (cities) to predict the quarterly GDP growth rate. The results show that, the port logistics characterized by the port cargo throughput is of a good prediction effect on the local GDP; compared with the traditional seasonal autoregressive integrated moving average (ARIMA) model, MIDAS model can capture the useful information of highfrequency explanatory variables and improve the prediction accuracy.

Key words: port cargo throughput; GDP; mixedfrequency data sampling (MIDAS) model; economic forecast

引言

各省市宏观经济的预测具有重要意义,预测GDP也是各国学术界和经济界研究的热点问题之一。目前,国内对GDP的预测多采用时间序列自回归综合移动平均(autoregressive integrated moving average, ARIMA)模型[1]、神经网络[2]、灰色GM(1,1)模型[3]等。这些传统预测模型无法将不同频率的变量直接进行建模分析,在建模之前通常需要人为对数据进行同频处理,方法主要有两种:一是通过插值法将低频数据处理成高频数据,二是通过简单加总等方法将高频数据转化为低频数据。这些粗糙的处理方式会损失大量的样本信息,而且数据处理方法不同可能会导致实证结果相差甚远。为克服这些问题,GHYSELS等[4]提出了混频数据抽样(mixedfrequency data sampling, MIDAS)模型,该模型能将不同频率的样本数据纳入同一模型中,突破了传统模型的局限性。MIDAS模型不仅可以利用高频变量中的有效信息对低频变量进行解释,而且能改善预测效果、提高预测精度,在预测方面具有显著优势。在具体建模方面,GHYSELS等[5]介绍了R语言中的midasr包,展示了如何运用各种优化方法进行估计,如何从数值收敛和统计充分性两方面检验模型的有效性,如何基于信息准则进行模型选择,以及如何评估MIDAS模型的预测精度。

基于MIDAS模型的上述优良属性,国内外学者已将MIDAS模型运用于宏观经济预测。文献[67]将MIDAS模型运用于中国季度GDP的预测,发现该模型在中国宏观经济总量的短期预测方面具有比较优势。郑挺国等[8]选取金融变量作为预测因子并通过MIDAS模型对GDP增长率进行短期预测,以及文献[911]先后基于MIDAS模型对消费者物价指数(consumer price index, CPI)进行预测,均发现MIDAS模型能够提高预测精度。也有一些学者将MIDAS模型运用到其他领域,如PENEV等[12]将该模型运用于分析水质的变化趋势。黄羽翼等[13]利用MIDAS模型基于若干宏观指标对社会物流总费用及其在GDP中的占比进行预测;秦梦等[14]将MIDAS模型应用于能源消费总量的预测:均验证了MIDAS模型预测的有效性与时效性。上述学者对宏观经济的混频预测多集中于全国整体层面,不能有效满足港口省市的宏观经济预测需求。基于以下港城融合发展的理论与事实,本文首次将港口物流数据运用于当地宏观经济的预测。

在港城融合发展趋势下,港口物流已经成为了促进港口城市经济发展的重要力量,其发展也带动了所在城市的产业升级。港城互动理论认为,港口作为一个区位因子,依靠它的要素集聚扩散机制能够不断帮助港口城市扩大工业规模和提高规模经济效益,从而带动当地经济高速发展。港口经济越发达,对当地经济的影响越明显。国内外学者就港口与经济增长的关系进行了诸多研究:王婷[15]利用产业集群理论分析了港口物流业集聚形成的机理和特征,为港口经济的发展提供了参考。王耀中等[16]分析了港口物流对经济增长的作用机理,认为港口物流能带动区域内其他相关产业的快速增长,形成产业集群,优化区域产业结构,是新的经济增长点。姜晓丽等[17]运用Huff模型计算了辽宁6个沿海港口对腹地城市的影响势能值,对1995—2009年辽宁沿海港口腹地空间演变进行定量研究,并对影响沿海港口腹地空间演变的驱动要素进行定性分析。司增绰[18]选用灰色关联模型,发现港口基础设施与临港城市经济集聚之间存在着较强的关联性。范厚明等[19]建立港城复合系统协同度模型,在得到港城协同发展对城市经济发展具有明显促进作用的结论的同时,还对比了各城市间的差异。夏恒良[20]运用灰色关联模型和协整模型发现,作为港口物流指标的货物吞吐量与城市经济发展指标GDP之间具有高关联度和长期均衡关系。马原皎等[21]同样使用灰色关联模型,验证了港口物流与当地经济之间的密切关系,两者相互促进。上述学者从各个角度分析了港口物流对当地经济的促进作用。因此,使用港口物流数据预测当地宏观经济具有合理性,这为本文的研究提供了前提。

为更好地研究港口物流对当地经济的混频预测效果,本文运用MIDAS模型分析国内5个省市的月度港口货物吞吐量增长率对当地季度GDP增长率混频预测的预测精度。通过与传统的季节性ARIMA模型的预测精度比较,验证MIDAS模型应用于港口物流对当地经济混频预测的有效性和适用性,同时为港口城市的经济预测指标选取提供新的视角。

1模型设定

1.1基礎MIDAS模型

MIDAS(m,k)-AR(p)是带有自回归项的MIDAS模型,一般表达式为(1)式中:Yt、X(m)t、m分别代表低频被解释变量、高频解释变量、高频变量与低频变量之间的频率倍差,比如本文中Yt为季度数据,X(m)t为月度数据,则m就为3,因为1个季度有3个月。W(θ,L)=ki=0(ωi(θ)Li/m),ωi(θ)为权重函数ki=0ωi(θ)=1,k为高频变量的最大滞后阶数,L为延迟算子,Li/mX(m)t=X(m)t-i/m。Φ(L)为率子,其表达式为Φ(L)=1-α1L-α2L2-…-αpLp。随机扰动项μt具有传统回归模型的性质,μt~N(0,σ2)。

由于数据的公布往往具有时滞性,每个季度/月度的数据不会在当季/当月及时公布,而会在数月后公布,所以在预测时需要考虑多步向前预测的情况。多步向前的MIDAS模型只需在式(1)的基础上将X(m)t改为X(m)t-h/m即可,h代表向前预测步长。

当不设定权重函数时,模型即为无约束MIDAS模型,记为UMIDAS(m,k,h)AR(p):

(2)

式中:m代表频率倍差;k代表滞后阶数;h代表预测步长;p代表自回归项滞后阶数。当设定权重函数时,模型即为有约束MIDAS模型,记为RMIDAS。

本文采用无约束MIDAS模型(UMIDAS)和4种不同权重函数构建的有约束MIDAS模型(RMIDAS)来探究月度港口货物吞吐量对季度GDP的预测效果;比较固定窗口、滚动窗口、递归窗口下的预测结果,选出最佳的估计窗口类型;最后将最优的MIADS模型与传统的季节性ARIMA 模型比较,说明MIDAS模型具有更优的预测效果。

1.2权重函数的设定

对于RMIDAS模型中权重函数的设定,本文选取Beta含零(记为Beta)、Beta不含零(记为BetaNN)、阿尔蒙多项式(记为Almon)、指数阿尔蒙多项式(记为ExpAlmon)4种常用于宏观经济研究中的权重函数构建权重滞后多项式。

Beta权重函数(3)式中:f(xk;θ1,θ2)=Γ(θ1+θ2)Γ(θ1)+Γ(θ2)xθ1-1k(1-xk)θ2-1,Γ(θ)=∫∞0e-x xθ-1dx;kmax是权重函数的最大滞后阶数。

BetaNN权重函数(4)值得注意的是,Beta权重函数即为BetaNN权重函数中的参数θ3= 0的情况。

Almon权重函数

(5)

ExpAlmon权重函数

(6)

在运用含自回归项的RMIDAS模型时,本文使用Almon(k*)AR(p*)、ExpAlmon(k*)AR(p*)、Beta(k*)AR(p*)、BetaNN(k*)AR(p*)代表各个权重函数下的最优模型,其中k*表示权重函数最优滞后阶数,p*表示自回归项最优滞后阶数。

2实证分析

2.1数据及预测指标选取

港口货物吞吐量是衡量港口生产能力、运营能力、港口规模及发展水平的重要指标,文献[6,2225]在研究港口物流与宏观经济的关系时,均选取港口货物吞吐量作为代表港口物流的指标。陈念清[26]在研究港口物流发展策略时使用港口货物吞吐量衡量港口物流情况。另外,王洪清等[27]在研究港口对腹地经济的贡献时也将港口货物吞吐量作为港口发展的指标。因此,参考上述学者的研究,同时基于数据的可获得性,本文选取2005年1月至2020年6月的上海港月度货物吞吐量(沿海)增长率(记为X(3)t)数据作为表征港口物流的高频解释变量,上海市2005年第一季度至2020年第二季度的季度GDP增长率(记为Yt)数据作为低频被解释变量,建立MIDAS模型。前者来源于上海市统计局,后者来源于中华人民共和国交通运输部。数据均通过了平稳性检验。X(3)t和Yt的走势图见图1。本文在最后还运用同样的方法验证了天津、山东、辽宁、福建4个沿海省市的实证结果。这4个地区的GDP数据来源于当地统计局,港口货物吞吐量数据同样来源于中华人民共和国交通运输部。

为验证港口物流对当地经济的预测作用,本文使用2005年第一季度至2017年第四季度的Yt和2005年1月至2017年12月的X(3)t作为样本内数据建立模型,预测2018年第一季度至2020年第二季度的Yt。预测精度通过均方根误差(root mean square error, RMSE)衡量。RMSE的表达式为e(7)式中:t为预测期数;T为最大期数;Yt为真实值;Y^t为预测值。

2.2实证结果

首先运用无约束MIDAS模型(UMIDAS(m,k,h)AR(p))进行预测。同时为验证MIDAS模型的有效性,建立预测季度GDP增长率的季节性ARIMA模型来进行比较。季节性ARIMA模型的表达形式为ARIMA(p,d,q)(P,D,Q)s,其中p、d、q以及P、D、Q分别代表非季节性和季节性的自回归项数、差分阶数和移动平均项数,s代表季节周期。通过自相关系数和偏自相关系数,发现预测效果最优的季节性ARIMA模型形式是:ARIMA(0,0,1)(0,1,1)4。季节性ARIMA模型中AR部分为0,因此UMIDAS模型也暂时不加入低频被解释变量的自回归部分,且暂时不考虑多步向前预测,即h=0。经检验,UMIDASAR(0)模型的最优滞后阶数为20阶,最优估计窗口为固定窗口。二者预测误差结果见表1。

由对比可以看出,无约束MIDAS模型的预测误差比季节性ARIMA模型的低。另外,从两个模型的样本外预测值图(见图2)可以看出,无约束MIDAS模型的预测值更接近真实值,预测效果更好。

季节性ARIMA模型仅能基于上季度末的数值来预测本季度末的数值,无法充分利用更多的相关月度数据信息。若基于本季度末月的货物吞吐量增长率来预测本季末的GDP增长率,则由于其公布时间相近,并没有太大的实际意义。因此,需要在混频模型中考虑多步向前预测。

本文分别考察了滞后1至25期向前1步、2步、3步的预测,同时还考虑了低频被解释变量的滞后对模型的影响。具体而言,即在模型中加入了低频被解释变量的自回归项,并分别考虑了自回归项滞后阶数p分别为0、1、2、3时的情况。表2展示了各预测模型的预测误差(RMSE)。

表3展示了运用季节性ARIMA模型对季度GDP增长率进行1步、2步、3步预测的最优预测结果。通过表2与表3的对比可以看出,在每个预测步长下,UMIDAS模型的预测误差都小于季节性ARIMA模型的预测误差。这进一步验证了MIDAS模型的有效性,表明在对季度GDP进行多步向前预测时,考虑月度港口货物吞吐量增长率,能够提高预测精度。

预测效果最优的无约束MIDAS模型UMIDAS(3,21,1)AR(0)的参数显著性检验结果见表4。当滞后阶数为1阶、2阶、5阶、7阶、8阶、9阶、12阶、18阶、19阶、20阶时,模型参数通过了显著性检验,说明上海港货物吞吐量对当地季度GDP具有较长时期的延迟乘数效应,影响持续约7个季度之久,且存在总效用为正的正负交替的作用路径。其中过去第7个季度对本季度的影响效应最大,为1.170 5。这在一定程度上验证了港口物流对当地经济的乘数效应。港口物流的发展能够带动和刺激相关产业的发展,从而增加就业率,提高城市消费水平;也能吸引大量投资,进而通过投资乘数效应刺激社会总需求,影响经济。另一方面,港口纳税会增加政府收入,而政府收入增加又会使得城市基础设施投资增加以及相应部门收入增加,从而实现经济的成倍增长。因此,港口物流的发展除影响即期经济外,还能刺激数月后的经济。由于乘数效应涉及的环节极其复杂,所以表4中细分到每个月的系数结果并无太大意义,重要的是其总的效应。其总的影响效应为0.737 8,说明港口货物吞吐量的增加总体上会拉动当地GDP的增加。

p≠0时的预测精度虽弱于p=0时的预测精度,但是相差并不大。为充分利用低频被解释变量的信息,本文进一步考虑h=1情况下的组合预测方法。参考以往研究,采用基于等权重加权组合(equal weight, EW)、BIC准则加权组合(BIC weight, BICW)、均方预测误差加权组合(mean square forecast error, MSFE)、优化的均方预测误差加权组合(discounted mean square forecast error, DMSFE)这4种形式的加权组合预测方法进行p为0、1、2、3的样本外组合预测,参与组合的每个模型

均为既定p下的最优UMIDAS模型。将组合预测的RMSE和平均绝对比例误差(mean absolute scaled error, MASE)与基准模型(UMIDAS(3,21,1)AR(0))的RMSE和MASE进行比较,结果见表5。

由表5可知,DMSFE的预测效果最优(RMSE最小)。图3展示了单模型预测和组合预测的效果,其中单模型预测是运用单一最优模型UMIDAS(3,21,1)AR(0)进行预测的,组合预测是运用DMSFE进行预测的。从图3可以看出,组合预测略优于单模型预测,其效果更好。因此,考虑被解释变量的滞后项,能够提高预测精度。

进一步分析不同权重函数对预测的影响,运用有约束MIDAS模型(RMIDAS)进行预测。考虑Beta、BetaNN、Almon、ExpAlmon 4种权重函数约束情况。分别考察滞后1至20期向前1步、2步、3步的预测结果,并根据AIC准则选择出每种权重函数的最优滞后阶数k*。同样,还考虑低频被解释变量的滞后项对有约束模型的影响。表6展示了各种情况下的预测误差(RMSE)。通过比较固定窗口、滚动窗口、递归窗口这3种窗口下的预测效果,发现固定窗口下预测精度最高,因此表6是固定窗口下的样本外预测误差结果。

由表6与表2的对比可以看出,有约束的MIDAS模型的预测效果整体劣于无约束的MIDAS模型。这与马原皎等[21]、于扬等[28]的结论一致。在有约束的MIDAS模型中:进行向前1步预测时,带有滞后2期自回归项(p=2)的Almon混频模型最优,RMSE为0.087 4,滞后阶数为6阶;进行向前2步预测时,带有滞后3期自回归项(p=3)的BetaNN混频模型最优,RMSE为0.076 6,滞后阶数为6阶;进行向前3步预测时,带有滞后3期自回归项(p=3)的ExpAlmon混频模型最优,RMSE为0.079 1,滞后阶数为3阶。每种预测步长下的最优模型的p均不为0,表明在有约束MIDAS模型下,加入低频被解释变量的滞后项也能提高预测精度。4种权重函数并没有绝对的优劣之分,当考虑RMIDAS模型时,还需要具体问题具体分析。

最后,为更客观地说明MIDAS模型的预测作用,用同样的方法验证除上海外其他沿海地区的结果。由于除天津和上海这2个直辖市外,其余沿海城市均无法获得全面的季度GDP数据,故本文将范围扩大到省级,发现天津、山东、遼宁、福建等4个省市的季度GDP数据和月度港口货物吞吐量数据较为全面。于是对这4个省市展开上述建模过程。表7展示了季节性ARIMA模型、UMIDAS模型、RMIDAS模型的最优预测结果。

从表7可以看出,这4个省市的MIDAS模型的预测结果均优于传统的季节性ARIMA模型的预测结果,且无约束MIDAS模型的预测结果最优。这进一步说明在预测沿海地区季度GDP增长率时,考虑港口货物吞吐量增长率的MIADS模型较传统的季节性ARIMA模型具有更优的预测效果。

3结论

本文应用混频数据抽样(MIDAS)模型分析了月度港口货物吞吐量增长率对当地季度GDP增长率的混频预测效果。得出以下结论:(1)港口货物吞吐量表征的港口物流对当地经济具有较好的预测作用。(2)港口货物吞吐量对GDP具有较长时期的延迟影响效应,且存在正负交替的作用路径,但总的影响为正,即港口物流的增长能够拉动当地经济的增长。(3)相较于传统的季节性自回归综合移动平均(ARIMA)模型,MIDAS模型可以有效捕捉高频解释变量的有用信息,提高经济预测精度。(4)无约束的MIDAS模型优于有约束的MIDAS模型。同时,在模型中加入季度GDP增长率的滞后项能够提高预测精度。

基于本文的研究结论,港口物流为沿海港口省市的经济预测提供了新的思路。各大金融机构以及广大投资者可以将港口货物吞吐量的增长情况作为反映当地宏观经济情况的先行参考指标。MIDAS模型也为混频类数据的分析提供了新的办法。在今后的经济预测中,还可以考虑加入其他类型的指标,从而实现更加精确、灵敏的预测。另外,随着我国港口经济的不断发展,还可以将MIDAS模型运用于港口相关指标(如集装箱吞吐量等)的分析与预测,这将在未来的研究中加以完善。

参考文献:

[1]龚国勇. ARIMA模型在深圳GDP预测中的应用[J]. 数学的实践与认识, 2008, 38(4): 5357.

[2]朱帮助, 林健. 基于神经网络集成的经济预测模型[J]. 辽宁工程技术大学学报, 2006, 25(增刊): 257259.

[3]王晓霞, 祖培福, 赵宝江, 等. 牡丹江GDP的GM(1,1)预测及其影响因素的灰色关联分析[J]. 数学的实践与认识, 2013, 43(8): 4249.

[4]GHYSELS E, SANTAClARA P, VALKANOV R. The MIDAS touch: mixed data sampling regressions models[R]. Anderson Graduate School of Management, UCLA, 2004. DOI: 10.4103/09769668.127274.

[5]GHYSELS E, KVEDARAS V, ZEMLYS V. Mixed frequency data sampling regression models: the R package midasr[J]. Journal of Statistical Software, 2016, 72(4): 135. DOI: 10.18637/jss.v072.i04.

[6]刘金全, 刘汉, 印重. 中国宏观经济混频数据模型应用: 基于MIDAS模型的实证研究[J]. 经济科学, 2010(5): 2334. DOI: 10.19523/j.jjkx.2010.05.004.

[7]刘汉, 刘金全. 中国宏观经济总量的实时预报与短期预测: 基于混频数据预测模型的实证研究[J]. 经济研究, 2011, 46(3): 417.

[8]郑挺国, 尚玉皇. 基于金融指标对中国GDP的混频预测分析[J]. 金融研究, 2013(9): 1629.

[9]龚玉婷, 陈强, 郑旭. 基于混频模型的CPI短期预测研究[J]. 统计研究, 2014, 31(12): 2531. DOI: 10.19343/j.cnki.111302/c.2014.12.004.

[10]孙本瑶. 中国CPI的实时预报与短期预测[D]. 厦门: 华侨大学, 2015.

[11]鲁万波, 杨冬. 基于半参数混频误差修正模型的中国CPI预测研究[J]. 统计研究, 2018, 35(10): 2843. DOI: 10.19343/j.cnki.111302/c.2018.10.003.

[12]PENEV S, LEONTE D, LAZAROV Z, et al. Applications of MIDAS regression in analysing trends in water quality[J]. Journal of Hydrology, 2014, 511: 151159. DOI: 10.1016/j.jhydrol.2014.01.031.

[13]黄羽翼, 艾小青, 吴盼玉. 基于混频数据的社会物流成本预测[J]. 统计与决策, 2020, 36(13): 179183. DOI: 10.13546/j.cnki.tjyjc.2020.13.040.

[14]秦梦, 孙毅, 刘晓明. 中国能源消费总量的混频预测研究[J]. 生态经济, 2018, 34(12): 9498.

[15]王婷. 港口物流产业集聚的形成机理及竞争优势分析[J]. 生产力研究, 2010(6): 198200. DOI: 10.19374/j.cnki.141145/f.2010.06.075.

[16]王耀中, 黎谧. 中国沿海港口物流对经济增长的作用研究[J]. 湖南大学学报(社会科学版), 2009, 23(5): 4851.

[17]姜晓丽, 张平宇. 基于Huff模型的辽寧沿海港口腹地演变分析[J]. 地理科学, 2013, 33(3): 282290. DOI: 10.13249/j.cnki.sgs.2013.03.008.

[18]司增绰. 港口城市港口基础设施与地区经济集聚相关性研究: 连云港市与日照市的比较[J]. 经济体制改革, 2012(1): 7074.

[19]范厚明, 马梦知, 温文华, 等. 港城协同度与城市经济增长关系研究[J]. 中国软科学, 2015(9): 96105.

[20]夏恒良. 港口物流与城市经济发展关系研究[D]. 北京: 北京交通大学, 2012.

[21]马原皎, 姚秉琪. 港口物流与腹地经济的关系分析: 以上海港为例[J]. 商业经济, 2016(7): 6263, 163.

[22]吕青, 唐秋生. 港口物流与区域经济协同发展研究[J]. 水运工程, 2012(4): 6770. DOI: 10.16233/j.cnki.issn10024972.2012.04.016.

[23]徐伟, 宫小涵. 青岛港口物流与腹地经济圈协同度实证研究[J]. 山东科技大學学报(社会科学版), 2019, 21(5): 8895. DOI: 10.16452/j.cnki.sdkjsk.20191009.022.

[24]胡家菁. 港口物流与城市经济增长的关系探讨[J]. 市场研究, 2020(3): 5556. DOI:10.13999/j.cnki.scyj.2020.03.019.

[25]赵喜仓, 付星星. 港口物流对经济增长影响分析: 以张家港港口为例[J]. 特区经济, 2010(1): 279281.

[26]陈念清. “一带一路”倡议下连云港港的物流发展策略研究[D]. 大连: 连海事大学, 2019. DOI: 10.26989/d.cnki.gdlhu.2019.000093.

[27]王洪清, 祁春节, 刘欢. 港口对腹地经济贡献弹性的U型曲线及其理论解释[J]. 地域研究与开发, 2013, 32(2): 2226, 45.

[28]于扬, 王维国, 王娟. MIDAS类模型的估计及其应用研究[J]. 数学的实践与认识, 2017, 47(21): 4251.

(编辑赵勉)

收稿日期: 20210406修回日期: 20210622

基金项目: 教育部人文社会科学研究项目(20YJC910003);上海市自然科学基金(20ZR1423000)

作者简介: 刘凤丹(1998—),女,四川成都人,硕士研究生,研究方向为产业经济学,(Email)mustang0206@foxmail.com;

范国良(1981—),男,安徽黄山人,教授,博士,研究方向为产业经济学, (Email)glfan@shmtu.edu.cn

猜你喜欢
模型
自制空间站模型
从勾股定理到“一线三等角”模型
模型小览(二)
导数中涉及“[ex,l n x]”的模型
圆周运动与解题模型
离散型随机变量分布列的两法则和三模型