利用多元回归分析影响GDP增长的因素

2019-08-16 06:56王兰平
智富时代 2019年7期
关键词:多元统计分析

王兰平

【摘 要】GDP增速一直是一个地区乃至一个国家经济发展状况的最直接衡量指标。研究GDP增长的影响因素对决策者提供政策指导、国家经济的健康快速发展具有重要意义。本文通过描述性统计分析和多元回归分析分析发现固定资产投资增速和第三产业增加指数对GDP增速最为显著。

【关键词】GDP增速;描述性统计分析;多元统计分析

一、数据来源

GDP 一直以来都是热门研究话题,现有的文献大多研究 GDP 总量或者人均 GDP 的影响因素。比如刘丽华[1]刘丽华基于回归分析方法对人均 GDP 的影响因素做了研究,刘花璐[2]运用灰色系统理论中的GM(1,1) 预测模型预测湖北省未来的 GDP 走势。在本文中,主要对 GDP 增长率的影响因素做深入研究, 这或许更能把握 GDP 的决定因素。

本文所用数据均来自于国家统计局官方网站[3]。共选取 GDP 增长率(y)、专利数增率(x1)、技术市场成交额增率(x2)、第一产业增速(x3)、第二产业增速(x4)、第三产业增速(x5)、固定资产投资增速(x6)、房地产投资增长率(x7)、城鎮登记失业率(x8)共 9 个分析指标。其中 GDP 增长率、第一产业增速、第二产业增速、第三产业增速、城镇登记失业率为官方提供的数据。专利数增率、技术市场成交额增率、固定资产投资增速、房地产投资增长率为通过官方年度数据算得。选取的年份为 2016 年,相关数据参见 2016年国家统计局网站数据3。

二、描述性统计分析

可以看到,GDP 增长率主要集中在 8%附近。极少数在 10%以上。只有一个样本点小于 0%。而从第一产业、第二产业、第三产业增长率的箱线图来看, 第三产业整体发展迅速主要集中在 9%附近,高于第二产业的 7.5%和第一产业的 3.5%。而对于固定资产投资增速、房地产投资增长率、专利数增率、技术市场成交额增率来说,波动幅度都比较大。城镇登记失业率波动幅度很小,基本集中在 2%-4%。

变量的矩阵分布散点图如图 2:

从图上可以看到,GDP 增长率和第二产业增加值增速、第三产业增加值增速、固定资产投资增速、房地产投资增长率的相关性很高。而与专利数增率、技术市场成交额增速、第一产业增加值增速、城镇登记失业率相关性比较弱。

三、多元回归分析

回归分析研究的主要对象是客观事物变量间的统计关系,它是建立在对客观事物进行大量试验和观察的基础之上,用来寻找隐藏在哪些看上去是不确定的现象中的统计规律性的研究方法。回归分析方法是通过建立统计模型研究变量间相互关系的密切程度、结构状态及进行模型预测的一种有效的工具。[4]

回归分析根据自变量的个数可以分为一元线性回归和多元线性回归。一元回归分析提出的主要背景在于我们经常需要研究某一现象与影响它的最主要因素之间的关系,比如粮食产量与施肥量质检的关系如何。此时,一元回归分析更能得到精确的答案。

但是更多情况下,现象之间的相关关系并不是那么简单。比如上面提到的粮食产量,它可能不仅仅与施肥量有关,还与降水量、光照强度乃至土地管理投入等密切相关。这时候就需要将多个变量的影响考虑进来。

在本文中,主要用多元回归分析来分析 GDP 的影响因素。

1.逐步剔除法建模

逐步剔除法建立模型,是指先用全部变量建立模型,根据模型中各个变量的显著性逐步剔除不显著的变量直到最后模型中所有变量都显著的方法。

首先,考虑利用所有变量建立多元回归模型。由于 GDP 增长率与第一产业、第二产业、第三产业增速存在完全的线性关系,所以这里只选取代表传统行业的第一产业增速和代表新兴行业的第三产业增速作为变量加入模型。调整后的R 方达到了0.88, 模型 F 检验高度显著。而且德宾-沃森统计量为 1.888,接近于 2。所以可以基本判断模型随机误差项不存在自相关问题。

不过从回归系数图这张表格中可以看到,在 0.05 的显著性水平下面,只有第三产业增速、固定资产投资增长率这两个变量是高度显著的。其余的变量是不显著的。所以直接利用第三产业增速、固定资产投资增长率这两个变量建立回归模型,模型结果如图 3 :

从上面的回归结果可以看到,当只用第三产业增速、固定资产投资增长率这两个变量来预测 GDP 增长率时,回归模型调整后 R 方达到了 0.890,F 统计量达到 122.361 是高度显著,而且,固定资产投资增速和第三产业增速的 t 检验结果分别达到 5.674 和 4.389,在 0.05 的显著性水平下面,都是高度显著的。不过需要注意的是德宾-沃森统计量降到了 1.679。不过从 DW 检验上下界表5中可以看到,在 0.05 的显著性水平下面,当 k=2,n=31 时,dl 和 du 分别为 1.36 和 1.50。

由此可知,模型残差项不存在自相关。此外,通过变量的 VIF 统计量可以看到,相比于全量模型,选模型变量的 VIF 统计量分别有所降低。第三产业增速从 3.009 降到了 2.691,而固定资产投资增速也从 3.973 降到了 2.691。这说明相比于全量模型,选模型在变量多重共线性方面得到了很大改善。

建立的模型为:

y = 34.894+0.577*x5+0.089*x6

模型的预测结果如下:

2.逐步回归

相比于逐步剔除变量的方法,逐步回归方法要更加灵活得多。逐步回归法的基本思想是有进有出。具体方法是将变量一个一个引入,每引入一个变量后,对已选入的变量要进行逐个检验,当原引入的变量由于后面变量的引入而变得不再显著时,要将其剔除。这样能够确保模型中只包含显著的自变量。在既没有显著的变量选入模型,也没有不限制的变量需要从模型当中剔除时,跌倒停止。

SPSS 中可以直接进行逐步回归。用我们的数据进行逐步回归,建模过程及结果如图5:

从建模结果可以看到,建模过程相当利索,首先将固定资产投资增速引入模型,然后再将第三产业投资增速引入模型。迭代过程便停止了。最终模型与逐步剔除法得到的模型一致。

模型方程为:

y = 34.894+0.577*x5+0.089*x6

四、模型结论

通过建立回归模型发现,第三产业增速和固定资产投资增速这两个变量对GDP 的增长率影响最大。而专利数增率、技术市场成交额增率、第一产业增速、房地产投资增长率、城镇登记失业率等对 GDP 增速的决定作用不是那么明显。

第三产业增速和固定资产投资对 GDP 增速影响很大,这个很符合预期。对于产业变革来说,第三产业是朝阳产业,是最具可持续发展机制的产业。第三产业做得很好的省份,往往经济的可持续发展也越能得到源源不断的动力。而由于中国还是处于社会主义初级阶段。固定资产的投入也能直接的影响到经济的发展。所以为了保持经济的高速增长,相关政府应该加大固定资产投资,同时出台相关政策扶持第三产业的发展的相关政策。

模型还是有不太符合预期的地方,创新是近几年一直强调的重点。科学技术是第一生产力的口号深入人心。但是从此模型看来,专利数增率、技术市场成交额增率对 GDP 的增长却没有显著的决定作用,还有待进一步的研究。

【参考文献】

[1]刘丽华.基于回归分析的人均 GDP 影响因素研究[J]. 经济研究导刊,2013,189: 9-10.

[2]湖北省 GDP 预测的数学模型及其影响因素分析[J]. 刘花璐,汤涛. 数学的实践与认识. 2015(05).

[3]国家统计局官网:http://www.stats.gov.cn/.

[4]应用回归分析,何晓群、刘文卿,中国人民大学出版社 P285.

猜你喜欢
多元统计分析
多元统计分析在农机监理系统中的应用
黑龙江省雾霾影响因素分析
浅析多元统计分析及相关应用
多元统计分析方法在证券投资中的应用
应用型本科院校多元统计分析课程的探索与实践