郭杨莉
摘 要:以福建省物流需求为研究对象,选取福建省1996—2015年货物吞吐量、全社会固定资产投资总额、农林牧渔总产值、进出口商品总额、居民消费水平、地区生产总值等统计数据,基于多元线性回归思路,诊断多重共线性。采用逐步回归法,以SPSS软件为工具, 建立貨物吞吐量与全社会固定资产投资总额以及进出口商品总额的二元线性回归模型。通过统计分析检验模型的有效性,运用货物吞吐量观测值与预测值的残差及相对误差检验模型的实践性。
关键词:多元线性回归 物流需求预测 逐步回归 多重共线性 异方差
一、绪论
(一)研究背景及意义
区域物流是经济活动的动脉,是联系生产和消费的纽带,是社会发展和人民生活水平提高的基础条件,也是衡量一个国家现代化程度的重要标准之一。
早在2009年国务院就宣布了我国的十大产业振兴规划,其中就有物流产业。2011年3月,我国“十二五”规划纲要中仍然将发展现代物流纳入其中。可见,我国非常关注物流业。随着地方政府纷纷采取促进物流发展的相关措施,物流业得到了飞速发展。发展物流业是优化产业结构和转变发展方式的必要条件。可以提升经济水平,壮大现代服务业的规模;可以降低企业成本,改善企业组织方式。由此可见,研究区域物流有着重大意义。
(二)货运量预测的国内外研究现状
在货运量预测方面,目前国内外应用的各种定性以及定量的方法已达上百种。主要的基本模型集中在时间序列法、回归分析法、指数平滑法、神经网络法、灰色模型法、ARIMA法等方法上。
国外对货运预测方面的研究开展较早,所以国外关于货运量预测模型方面的研究比较多,其理论及实际经验要远比国内成熟.Gregory A.Godfrey和Warren B.Powell(2000)以指数平滑法为基础,提出了一系列预测方法,与ARIMA方法相比,这一系列的预测方法操作更为简单、易行,并且在预测方面有着更高的精确度。
国内学者在货运量预测方面的研究相对较晚,但国内关于货运量预测的研究成果也不少,如:郭玉华等人(2010)对经济周期阶段参数的内涵进行阐述,并将经济周期进行量化,作为一个输入因素,建立基于经济周期的Elman神经网络预测模型,以我国1992-2008年铁路货运量为实例,对预测模型进行检验。
二、实证分析
(一)模型指标的选取
物流需求是指一定物流需求是指一定时期内社会经济活动对生产、流通、消费领域的原材料、成品和半成品、商品以及废旧物品、废旧材料等的配置作用而产生的对物流在空间、时间和费用方面的要求,涉及运输、库存、包装、装卸搬运、流通加工以及与之相关的信息需求等[16]。考虑到运输是现代物流体系的中心环节, 以及获取数据的完整性、一致性和时效性等方面因素,本文选取1996-2016年福建省统计年鉴上的数据作为样本数据,选取物流货运量(万吨)为物流需求指标Y,选取全社会固定资产投资总额X1(亿元)、农林牧渔总产值X2(亿元)、进出口商品总额X3(千万美元)、居民消费水平X4(元/人)、地区生产总值(亿元)X5等5个因素为物流需求预测的经济指标[17]。
(二)多重共线性诊断
多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
在多元线性回归模型中,自变量之间可能存在线性相关的关系,会使得系数估计的标准误差增大,从而使得模型的预测精度大大降低。使用SPSS软件全回归法对所选取的指标建立模型,结果显示如下:
S=(7950.893) (0.878)(12.823)(0.736)(1.936)(2.945)
t=(2.051) (3.873)(0.597)(2.778)(1.342)(-1.186)
p=(0.058) (0.002) (0.560)(0.014)(0.200)(0.254)
F=(814.603) P=(0.000)
R2=0.996
n=21 (df=15)
结果发现模型整体是显著的,但是对模型系数的检验表明很多变量对“货运量”的影响并不显著。由以上结果可知,t统计量与Sig值均不显著。自变量之间很可能存在共线性的问题。计算各解释变量的相关关系并进行共线性诊断,从下表可以看出VIF远大于10,各解释变量间存在严重的多重共线性,因此考虑改用多元逐步回归法对物流需求与各经济指标建立模型, 减少多重共线性对模型参数估计、模型误差以及稳定性等的影响。
(三) 多元逐步回归
多元逐步回归的基本思想是:对全部因子根据其对因变量Y影响程度的大小(即偏回归平方和R2值的大小),从大到小逐个地引入回归方程,同时对回归方程当时所含的全部变量进行统计检验,观察其是否仍然显著,如果不显著就将其移出模型,直到回归方程中所有的变量对因变量Y的作用都是显著的,再考虑引入新的变量。再在剩余的未选因子中,选出对因变量Y的作用最大者,检验其显著性,若显著则引入方程,若不显著则不引入,直到最后再也没有可以引入的显著因子,也没有不显著的变量需要移除为止。 多元逐步回归分析本质上没有新的理论,只是在多元线性回归内部运用一些计算技巧获得最优的多元线性回归方程,是实用且被广泛应用的统计分析方法。
在逐步回归中,变量X5、X1、X3被逐个引入,在第三个模型中X5被移除,最终得到模型4。模型4解释变量为X1、X3,模型整体显著(R2=0.996,F=2085.824,Sig=0.000),模型系数检验显著。t1=15.973,Sig1=0.000;t2=7.324,Sig2=0.000,比较理想,同DW=1.976,模型不存在自相关性问题。解释变量X1、X3的方差膨胀因子VIF=7.909,多重共线性问题已经消除。
(四)物流需求预测模型
由表3中的模型4可得物流需求预测回归模型为:
Y=24544.827+2.951x1+1.650x3
其中X1为社会固定资产投资总额,X3为进出口商品总额(千万美元)。模型整体检验显著、模型系数检验显著,具有一定的分析价值。由该模型计算得出1996-2016年物流货运量预测值,由表4可知少数年份残差较大。标准化残差正态曲线直方图如图1所示, 标准化残差概率图如图2所示。可以看出标准化残差呈正态分布,散点在直线上或下靠近直线,回归方程满足线性以及方差齐次的检验,物流需求预测模型通过了实践检验。
三、结论
基于1996-2016年福建省货运量及相关统计数据建立的多元线性回归模型, 表明福建省货运量与全社会固定资产投资总额、进出口商品总额表现出高度的相关性。农林牧副渔总产值、居民消费水平、地区生产总值等经济指标与货运量也存在很强的相关关系, 但由于各变量间存在较强的多重共线性,在逐步回归中被剔除。由偏边际经济理论可知,在进出口商品总额不变的情况下,全社会固定资产投资总额每增加1个单位,物流需求平均增长2.95个单位;社会固定资产投资总额不变的情况下,进出口商品总额每增加1个单位,物流需求平均增长1.650个单位。从模型可以看出,全社会固定资产资对物流需求的影响较大。
参考文献
[1].Gregory A. Godfrey, Warren B. Powell. Adaptive estimation of daily demands with complex calendar effects for freight transportation[J]. Transportation Research Part B, 2000, 34(6):451-469.
[2].郭玉华, 陈治亚, 冯芬玲,等. 基于经济周期的铁路货运量神经网络预测研究[J]. 铁道学报, 2010, 32(5):1-6.
[3]王治. 基于遗传算法-支持向量机的铁路货运量预测[J]. 计算机仿真, 2010,