基于内蒙古物流需求预测的实证分析

2012-12-20 03:22孟千金
财经理论研究 2012年1期
关键词:共线性货运量回归方程

孟千金

(内蒙古财经学院 研究生处,内蒙古 呼和浩特 010070)

一、引言

近年来,内蒙古自治区经济快速发展,具有特色优势的六大产业逐渐发展成一定规模,形成产业集聚,对此建立配套的物流体系将极大地推动区域产业间的协调发展。尤其是《内蒙古自治区以呼包鄂为核心的沿黄河沿交通干线经济带重点产业发展规划(2010-2020年)》的出台,更需要建立与之相适应的物流体系。而对内蒙古自治区物流需求量进行科学合理的预测,整合利用物流产业资源,建立起高效运行的物流配套体系,是推动内蒙古自治区经济更快更好发展的前提条件。本文根据内蒙古物流需求量及相关经济影响因素,运用eviews计量经济软件建立起多元回归分析模型,并在此基础上运用指数平滑预测法对未来五年的物流需求量做出科学预测。

二、多元回归预测模型的构造

(一)建立回归预测模型

建立回归预测模型时,在众多变量中首先要确定一个变量为因变量,其余变量为自变量。回归预测法属于因果分析,它根据自变量个数的多少,可分为一元回归、二元回归和多元回归模型,一元线性回归方法也叫最小二乘法。它是用来处理两个变量之间具有线性关系的工具。一般地,包含被解释变量Y与k-1个解释变量X2,X3,…,Xk的函数称为多元总体线性回归函数,具体表示为:

其中,Y 为被解释变量,X2i,X3i,…,Xki(i=1,2,…,n)为解释变量;βj(j=1,2,…,k)为模型的参数;ui为随机误差项;k-1为解释变量的个数。

该线性回归函数的条件均值形式为:

多元线性回归分析主要解决的问题,仍然是如何根据变量的样本观测值去估计回归模型中各个参数,既要用样本回归函数去估计总体回归函数,还要对估计的参数及回归方程进行统计检验,最后利用回归模型进行预测和经济分析。

(二)模型精度的统计检验

在实际问题研究中,事先并不能判断随机变量Y与X1,X2,Xp之间确有线性关系,在进行回归参数的估计之前,用多元回归方程去拟合它们之间的关系。当求出线性回归方程后,为进一步分析回归模型所反映的变量之间的关系是否符合客观实际、引入的影响因素是否有效,需要对回归模型进行检验。常用检验方法有:

1.多重可绝系数R2检验拟合优度——R检验法

多元线性回归中Y的变差分解式为:

(1)变差

TSS:总离差平方和;RSS:残差平方和;ESS:回归平方和

(2)自由度

其中,TSS反映了被解释变量观测值总变差的大小;ESS反映了被解释变量回归估计总变差的大小,它是被解释变量观测值总变差中由多个解释变量做出解释的那部分变差;RSS反映了被解释变量与估计值的变差,是被解释变量观测值总变差中未被列入模型的解释变量解释的那部分变差。显然ESS越大,RSS就越小,从而被解释变量观测值总变差中能由解释变量解释的那部分变差就越大,模型对观测数据的拟合程度就越高。因此,定义多重可绝系数为:

或者表示为:

多重可绝系数是介于0和1之间的一个数,R2越接近1,模型对数据的拟合程度就越好。由于R2与回归方程中解释变量的个数有关,当回归方程中解释变量个数增加时,R2不可能减少,为此,人们用修正的可绝系数¯R2,来比较不同数目解释变量的回归方程的拟合优度。

2.回归方程的显著性检验——F检验

回归方程的显著性检验主要是给出统计量F对R2的显著性进行检验,对模型总体进行检验。构造假设H0:β2=β3=…βk=0。若 H0成立,那么所有解释变量Xi对Y都不构成影响。统计量F为:

即统计量F服从自由度为k-1和n-k的F分布。

给定显著性水平α,在F分布表中查出自由度为k-1和n-k的临界值 Fα(k-1,n-k),将样本观测值代入上式中计算F值,然后将F值与临界值Fα(k-1,n-k)比较。若 F>Fα(k-1,n-k),则拒绝原假设H0:β2=β3=…βk=0,说明回归方程显著,即列入模型的各个解释变量联合起来对被解释变量有显著影响;若F<Fα(k-1,n-k),则不能拒绝原假设H0:β2=β3=…βk=0,说明回归方程不显著,即列入模型的各个解释变量联合起来对被解释变量影响不显著。

3.回归参数的显著性检验——t检验法

在多元线性回归中,方程的整体线性关系显著并不一定表示每个解释变量对被解释变量的影响都是显著的。因此,必须从回归方程中剔除那些次要的变量,重新建立更为简单的回归方程。所以需要对每个回归方程中的自变量作显著性检验。

构造假设 H0:βj=0(j=1,2,…k),可以用统计量t对回归系数作显著性检验:

对于给定的显著性水平α,如果|tj|>tα/2(nk),则拒绝H0,认为βj显著不为零,Y与Xj确实存在线性关系,如果|tj|< tα/2(n - k),则接受 H0,认为βj在统计上为零,Y与Xj不存在线性关系。

4.DW 检验法

序列相关是指数列的前后期相关。最常见的是时差为一期的序列相关,又称一阶自相关。回归模型假设随机误差项之间不存在序列相关或自相关,即互不相关,若回归模型不满足这一假设,则称回归模型存在自相关,这时就不能继续使用最小二乘法估计参数。在序列相关中,最常见的是一阶自相关,常用的检验方法是DW检验法。

DW统计量为:

根据DW检验法检验模型是否存在自相关;构造假设H0:ρ=0,即假定回归模型不存在自相关,根据给定的检验水平及自变量个数m,从DW检验表中查得相应临界值dL和dU,当0≤DW≤dL,模型存在正自相关;当 dL<DW≤dU时,不能判断是否存在自相关;当dL<DW≤4-dU时,接受假设,即模型不存在自相关;当4-dU<DW≤4-dL时,不能判断是否存在自相关;当4-dL<DW≤4时,模型存在负自相关。

(三)方程的诊断及重建

通常在经济问题的回归预测中,由于受认识水平的局限,容易考虑过多的自变量。当涉及自变量较多时,大多数回归方程都受到多重性的影响。当自变量存在多重共线性时,得到的回归系数估计值很不稳定,回归系数的方差随着多重共线性强度的增加而加速增长,会造成回归方程高度显著的情况下,有些回归系数通不过显著性检验,甚至出现回归系数的正负号得不到合理的经济解释。消除多重共线影响最常用的方法是逐步回归法。本文主要采用eviews计量经济软件进行数据的统计和分析,诊断方程是否存在严重的多重共线性,并在消除多重共线性以后重新建立回归方程。

(四)进行回归预测分析

重新建立好回归方程之后,便可以利用新的回归方程进行进一步的预测分析。

三、基于多元回归分析的内蒙古物流需求预测分析

(一)变量选取

1.物流需求量的经济指标选取原则

物流需求预测指标选择是实施预测的关键。为了使物流需求预测具有科学性和预测结果具有准确性,有必要设立指标的选择原则。

(1)相关性原则

本文利用内蒙古经济指标来建模并预测未来五年的内蒙古物流需求规模,所以在选择指标时要考察经济指标和预测指标的相关性。理论上,两者之间的相关性越强,预测结果会越可靠。

(2)可操作性原则

指标可操作性,包括指标数据的可获得性。目前我国物流业统计数据不完善,虽然一些数据对预测来说很重要,但从统计数据中根本无法取得。所以,在设立预测指标时要选取比较容易获取数据的指标。本文就是根据这一原则,选择了运输业的货运量和货物周转量作为衡量物流需求发展规模指标。

(3)相对独立性原则

无论是经济指标还是物流需求指标,在一定程度上都有着较强的替代性和内在关联性。如果不经过筛选就直接使用这些指标来进行预测,可能会导致预测结果与实际情况偏差很大。所以,选择相关指标进行预测时,要尽可能地选择相对较独立的指标进行预测。

2.经济指标选取的经济因素分析

在社会经济活动过程中,物流需求由于受多种因素的影响而不断变化。有经济影响因素、政策因素、资源因素等,本节主要就内蒙古物流需求的经济影响因素进行分析。

(1)经济总量水平

区域经济发展的规模与水平是区域物流需求的决定性因素,也是区域物流需求增长的内在动力。区域经济总量水平越高、增长速度越快,对生产资料、半成品、产成品的流通要求也就越高,物流需求就越大,带动物流业越快发展。反过来,物流业较发达的地区经济发展水平也较高。内蒙古近几年的经济发展较快,物流需求也在快速增长。因此,区域经济总量与物流需求量间有着很强的正向相关性。

(2)产业结构

物流包括了物质资料在生产领域中各个生产阶段之间和独立于生产之外向消费领域转移的全部运动过程,物质资料主要包括了工业、农、林、牧、渔业,即第一产业第二产业所生产的农产品和工业品。故第一产业增加值和第二产业增加值对物流需求量产生了重要影响。随着内蒙古经济的发展,产业结构也在发生着变化,目前为 9.5:54.6:35.9,工业比重最大,对物流需求的影响最强。

(3)社会消费品零售总额

随着经济的增长和城市化水平的提高,消费者的需求发生了明显的改变,城市化水平的提高,城市居民多样化、个性化和高度化生活需求的逐步显现,使得城市居民生活所需小商品配送量开始增长。而区域社会商品零售总额这一指标从侧面反映了区域物流规划中城市配送量的大小,影响着配送中心的数量与功能定位。故社会商品零售总额也是影响物流市场需求的主要因素。

(4)固定资产投资总额

一个地区经济的稳定发展离不开固定资产的投入,固定资产投资总额对一个地区经济的发展具有后向效应,投资将转化为以后现实的生产能力,增加物流量。故固定资产投资总额也是影响物流市场需求的重要因素。

(5)外贸总额

对外贸易的发展离不开物流的坚强后盾,反过来,也推动着物流需求量的增加,二者之间存在着必然的联系。目前内蒙古对外贸易量正在快速增长,对物流的需求也在不断增加,因此,对外贸易总额也是影响物流市场需求的重要因素。

(6)人均可支配收入

人均可支配收入也是影响物流需求的因素之一。人均可支配收入影响物流的规模和流向。居民消费商品的数量、品种及消费的习惯不同,引起企业生产变化,进而引起物流需求的变化。当人均可支配收入水平提高时,物流需求就会随着增加;当人均可支配收入水平降低时,物流需求就会随着减少。

(7)货运量

关于物流需求量,由于学术界对物流需求量没有做明确界定,而与之相关性最大的就是货运量。从指标的可操作性角度考虑,本文选取货运量作为物流需求量进行预测分析。

根据上述分析,选取变量如下:

解释变量:内蒙古国内生产总值(GDP)X1;第一产业总产值X2;第二产业总产值X3;第三产业总产值X4;内蒙古社会消费品零售总额X5;外贸总额X6;社会固定资产投资总额X7;人均收入X8。

被解释变量:货运量Y。

(二)数据的选取

选取2001年到2010年样本观测值的数据如表1。

表1 2001-2010年内蒙古物流需求规模及主要经济指标统计数据

(三)建立模型

根据表1中各项经济指标,利用excel进行相关性分析,结果如图1:

图1 各经济指标的相关性共线性

在图1中,左轴表示货运量,右轴表示X1到X8经济变量,从图1可以看出货运量Y与X1到X8经济变量均存在很强的线性相关性,可以建立多元线性回归模型。但从图1也可看出各经济变量之间存在比较严重的多重共线性。如果多重共线性不消除,模型的参数就不能完全被估计出来,从而造成后面的预测值偏差很大,达不到预测的效果。因此可采用逐步回归法来消除多重共线性影响,本文利用eviews软件来达到这一目标。对于货运量与各经济变量之间的关系,根据表1数据,建立模型并采用逐步回归法消除多重共线性影响,如表2。

由表2可看出Y与X8间的相关系数最大为0.970350,且由回归模型知回归系数为正,符合经济意义。因此用Y、X8再与其他解释变量进行回归。结果都没有使¯R2改进,继续选取略低的相关系数进行逐步回归,直到选取Y、X7与X6的相关系数0.975037,改进最大,且回归系数没有负值,符合经济意义,各参数的 t检验显著,选择保留X6,用Y、X7、X6与其他变量进行逐步回归,没有任何改进,最终修正严重多重共线性影响的回归结果如表3。

表2 货运量与各解释变量间修正后的R2

表3 以外贸进出口总额X6和全社会固定资产投资X7为解释变量的模型

回归结果分析:(l)各项系数(即参数)均为正,大小比较恰当,符合经济意义,表明内蒙古社会固定资产投资每增长l亿元,货运量将增加7.602217万吨,外贸进出口总额每增加1亿元,货运量将增加372.0961 万吨;(2)模型可决系数 R2=0.980584,表明解释变量内蒙古外贸进出口总额和社会固定资产投资对货运量的解释能力为98.0584%,说明模型拟合的非常好;(3)方差检验的F值显著性概率为0.000001,说明模型总体回归效果较显著;解释变量和常数项t值的显著性概率基本通过检验;(4)DW统计量的值为2.347041,在检验水平为0.05条件下,不包括常数项的解释变量个数k为2,则从DW检验表中查得相应临界值 dL=0.629、dU=1.699,0.629<2.347041<2.3590,符合 dL<DW≤4 -dU,所以模型不存在序列相关,结果比较理想通过检验。

回归模型为:Y=32562.31+372.0961*X6+7.602217*X7

本文利用excel分析工具,运用一次指数平滑和二次指数平滑的方法,对外贸进出口总额和全社会固定资产投资未来五年2011-2015年分别进行预测。

(1)一次指数平滑预测法

设时间序列为 y1,y2,……yn,则一次指数平滑公式为:

即以第t期一次指数平滑值作为第t+1期预测值。

(2)二次指数平滑法

则预测的线性模型为:

(3)平滑系数α的选择

平滑系数α的选择直接影响着预测效果,α的大小表明了修正的幅度。α值愈大,修正的幅度愈大,α值愈小,修正的幅度愈小。由此可见,在指数平滑法中,α的取值是否恰当对预测精度有着决定性的作用。在实际应用中,α值是根据时间序列的变化特性来选取的。若时间序列波动不大 ,则α应选择小一些,如0.1-0.3;若时间序列具有明显的变动倾向,则α应选择大一些,如0.6-0.9。实质上,α是一个经验数据,通过多个α值进行试算比较而定,哪个α值所引起的预测误差最小,就选取哪个。

本文运用excel进行逐步试算,发现当α=0.7时,预测的误差最小,所以最终选取α为0.7,通过分析计算,得出的2011-2015年的货运量和货运周转量预测数据如下:

表4 货运量预测表

图2 货运量发展趋势图

从图2可以看出,货运量在2004年以后一直保持快速增长,2008年、2009年出现小幅波动,之后又继续快速增长。内蒙古2010年的物流需求值应为132205万吨,至2015年时,内蒙古的物流需求量将上升至332738万吨。这说明内蒙古的物流需求愈来愈大,内蒙古物流业的发展有了更广阔的前景。由各变量间的相关性分析可知,与货运量的发展相关性较大的是贸易总额和全社会固定资产投资,这与内蒙古现阶段经济发展现状是相吻合的。随着内蒙古对外贸易和基础设施建设的迅速发展,货运量还会继续快速增长。

四、结论与建议

根据以上分析结果,结合目前出台的产业规划和内蒙古物流业发展现状,特提出以下建议:第一,针对目前重点产业集群,整合现有物流资源,加强对物流基础体系的规划建设;第二,提高对中小物流企业的扶持力度,使其逐步走向专业化;第三,加大对物流专业人才的培养力度;第四,建立强大的物流信息平台,实现信息资源的有效利用;第五,针对目前的产业现状,制定并落实物流产业发展政策。

[1]王国维.预测与决策[M].北京:中国财政经济出版社,2006.47-55.

[2]秦璐,刘凯.基于产业结构的区域物流需求分析[J].物流技术,2006,(7):4 -6.

[3]庞皓.计量经济学[M].北京:科学出版社,2007.85-95.

[4]任新平.区域物流布局[M].北京:化学工业出版社,2011.130-138.

猜你喜欢
共线性货运量回归方程
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
银行不良贷款额影响因素分析
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
走进回归分析,让回归方程不再是你高考的绊脚石
不完全多重共线性定义存在的问题及其修正建议
2017年上半年拉脱维亚港口货运量同比增长7%
诊断复共线性的特征分析法及其在GEO定轨中的应用