田垠
摘要:本文采用灰色预测和神经网络的组合预测模型预测未来两年城乡居民收入差距。利用Adaptive-Lasso估计方法,得出就业率和经济实力是影响城乡居民收入差距的关键因素,它们之间存在高度正相关关系。预测结果表明:我国城乡居民收入差距在未来两年会持续增长,因此现阶段建议降低失业率,加强财政对农村社会保障和教育支出,缩小城乡居民收入差距。
关键词:收入差距;Adaptive-Lasso估计;灰色预测;神经网络;预测
引言
自上世纪八十年代以来,我国经济快速增长,人民的生活水平极速提升。但随着经济快速发展,社会公平问题日益突出,城乡居民之间收入差距的扩大就是证明。我国现已从一个国民收入相对平均的经济体变成财富分配很不均匀的经济体。1978年,中国城乡居民人均可支配收入分别为343.4元和133.6元,城乡居民收入差距为209.8元。到2013年,两者之间的差距扩大到了18059.2元。相比于1978年,翻了85倍之多[1]。城乡收入差距过大不仅意味着农村居民不能和城镇居民一样享有改革开放带来的同等成果,同时,它对中国当前社会的稳定和构建和谐社会造成了一定威胁。因此,分析预测好未来城乡居民收入差距,对于维护中国社会经济的健康发展以及整个和谐社会的构建都具有重要的理论和现实意义。
而目前,针对城乡居民收入差距这一问题,大多数学者采用的是ARMA模型来进行建模与预测分析,但近年来也有不少学者采用灰色模型等其他方式进行预测。我国学者张桂龄通过ARMA模型对1974-2014年城乡收入差距进行拟合和预测,认为应通过调整农业结构,对农产品实行保护价格等行为减少城乡收入差距[2];两位副教授吕艳丽和陈兵建也用ARMA模型分析和预测了甘肃省的收入差距[3];涂雄苓采用ARIMA模型、灰色模型和二次多项式模型三种建模方式进行预测,通过使用具有最低平均相对误差绝对值(MAPE)的二次多项式预测模型来执行二期预测,给出相应建议[4];张艺则是直接采用灰色预测GM(1,1)模型对河北省收入差距进行预测并提出建议[5]。他们都是采用单个模型对城乡居民收入差距进行预测并分析建议,暂时还没有学者尝试用组合模型对我国城乡居民收入差距进行预测。笔者基于1995-2017年中国城乡居民收入差距的数据,建立灰色预测模型与人工神经网络的组合预测模型,得到我国城乡居民收入差距的预测值。
1、模型设定与指标选择
1.1模型概述
近年来,Lasso被广泛应用于参数估计和变量选择,使用Lasso进行变量选择已被证明在确定的条件下是一致的。Lasso最初由Robert Tibshirani于1996年提出,它是一种正则化方法,可同时执行参数估计与变量选择。Lasso参数估计的定义如下:
由于Lasso方法的运用具有需要满足一定的苛刻条件的缺点,因此Zou给不同的系数赋予不同的权重,就此提出了一种改进的Lasso方法,这种改进的方法被称为Adaptive-Lasso方法,定义如下:
最小二乘法得出的系数。
设一组非负单调原始数据序列为X(o)={X(0)(i),i=1,2...,n},对变量X(0)建立灰色预测模型,过程如下:
首先对变量X(O)进行一次累加,得到X(O)的一次累加序列X(1)={X(1)(k)=1'2...,n}。
为X(l)建立一阶线性微分方程,如下所示:
该微分方程即为GM(1,1)模型。
求解微分方程(3),可得到预测模型:
鉴于GM(1,1)模型得到的为一次累加量,将GM(1,1)模型计算所得数据X(1)(k+1)经过累减还原为X(o)@+1),即X(O)的灰色预测模型为:
后验差检验模型精度表如表1所示。
在本文中,我们使用Adaptive-Lasso估计来选择变量,使用灰色预测模型对Adaptive-Lasso估计所选定的单个影响因素进行预测,得到城乡居民收入差距在2018年-2019年的预测值。为了使预测结果具有较强的适用性和容错能力,建立了历史数据的神经网络训练模型,将灰色预测得到的预测结果输入神经网络模型中,得到结果。
预测模型过程的步骤如下:
(1)收集到与城乡居民收入差距相关数据;
(2)利用(1)形成的已完成数据预处理的建模数据,建立Adaptive-Lasso变量选择模型;
(3)在(2)的基础上,建立单变量的灰色预测模型和人工神经网络预测模型;
(4)利用(3)的預测值代人人工神经网络模型中以获得预测值。
1.2数据来源说明
从《中国统计年鉴》中得到1995-2015年我国城镇居民人均可支配收入和农村居民人均可支配收入,从我国财政报告中,可以找出2016-2017年我国城镇居民人均可支配收入和农村居民人均可支配收入,它们之间的差值是我国城乡居民收入差距数据,用y表示(表2)。
在查阅文献以及经济学理论对其的解释,共选取以下因素为影响城乡居民收入差距(y)的自变量。
贸易依存度(Xl):根据基于要素禀赋理论的Stolpa-Samuelson定理,对外贸易会通过改变产品价格影响要素价格,从而影响一个国家的收入分配。为当年的进出口总额与当年的GDP比值。
贸易顺差(X2):出口总额与进口总额的比值。
城镇化(X3):城镇人口占总人口的比率。
就业率(X4):城镇就业人口占总就业人口的比率
经济实力(X5):财政总收入。
社会卫生占比(X6):卫生总费用占GDP的比值。
第一产业比重(X7):第一产业增量占GDP的比值。
第二产业比重(X8):第二产业增量占GDP的比值。
第三产业比重(X9):第三产业增量占GDP的比值。
根据以上描述,获得最终变量数据,如表3所示。
1.3主要变量分析
首先,对主要变量进行描述性统计分析,以获得对数据的整体理解。表4给出了主要变量的描述性统计结果。由表可见,城乡居民收入(y)的均值和标准差分别为10660.19和6753.67。这说明我国城乡居民收入差距存在较大差异。
注:Min为最小值,Max为最大值,Mean为均值,SD为标准差。
相关系数可用于来描述定量变量之间的关系,初步判定因变量和解释变量之间是否存在线性相关。变量的Pearson相关系数矩阵如表5所示。
由表5可知,贸易依存度(xl)與城乡居民收入的线性关系十分不显著,而贸易顺差(x2)与城乡居民收入线性关系不显著。其余变量中,除第一产业比重(x7)和第二产业比重(x8)与城乡居民收入呈负相关之外,其余与城乡居民收入高度正相关。
运用LARS算法进行公式(2)的Adaptive-Lasso估计,LARS算法中对于每一个Y,都有一个最优的λn与其对应。本文取Y=l,计算结果如表6所示。
由表6可以看出,贸易依存度、贸易顺差、城镇化、社会卫生占比、第一产业比重、第二产业比重与第三产业比重等因素的系数均为O,这说明在模型构建过程中这几个变量被剔除了。这是因为贸易依存度和贸易顺差属于进出口方面因素,对国内城乡收入的影响十分小,对收入差距的影响更是微乎其微;城镇化与城乡居民收入存在明显的共线性,因此在模型构建中剔除了这个变量;在我国农村医保的大力实行的政策下,我们可以认为社会卫生对城镇和农村的影响是一样大的;同理我们可以推断地一、二、三产业增量对城乡收入差距的影响一致,因此被剔除。上述结论体现了Adaptive-Lasso方法在构建模型时,不仅能够识别并剔除存在高度共线性关系的变量,同时还具有对同时多指标进行建模的优势。
综上所述,影响城乡收入差距的关键因素是就业率、经济实力。
2、城乡居民收入预测
通过以上分析,得出就业率和经济实力是影响城乡居民收入的关键因素。针对这两个因素建立灰色预测与神经网络的组合预测模型,参数设置如下:误差精度△t=10-7,学习次数n=10000次,神经元个数为2。通过灰色预测模型计算得出就业率(x4)、经济实力(x5)在2018年及2019年的预测值,如表7所示,可知灰色预测模型得到的预测值具有很好的预测精度。
代入所建立的神经网络预测模型,得到城乡收入差距真实值与预测值的对比图,如图1所示。由该图可以看出,使用灰色预测和神经网络的组合预测模型具有一致性。
3、结论
本文利用Adaptive-Lasso变量选择方法以及灰色预测和神经网络模型对我国城乡收入差距及其影响值进行分析与预测,预测结果表明,未来两年内,我国城乡居民收入差距将持续增加,且增长幅度较高。同时我国财政收入和就业率对缩减城乡收入差距有好的影响,与城乡收入差距呈高度正相关。由以上结论我们可以提出下面建议。
强化政府公共服务,协调资源,努力为社会成员提供平等发展的机会,改善公民福利,促进社会公平;通过打破行业垄断,稳定垄断行业与一般行业人员收入差距,减小收入差距;建议从民间角度调整居民收入分配,努力提高低收入群体的收入水平。
还要加大对农村、农民的支持力度,提高其收入水平。缩小城乡收入差距的重点在于提高农民收入,而农民收入差距过大的原因在于区域间经济发展的不平衡,因此需要完善收入分配体制,给予农村更多的政策支持。
参考文献:
[1]郭小东,付升华.社会保护底线支出、城镇偏好与城乡居民收入差距[J].社会保障研究,2017,02:95-105.
[2]张桂龄.基于ARMA模型对我国城乡居民收入差距的分析与预测[J].经营管理者,2017,20:66-67.
[3]吕艳丽,陈兵建.基于ARMA模型的城乡居民收入差距分析与预测——以甘肃为例[J].商业经济研究,2017,2:204-206
[4]涂雄苓.我国城乡居民收入差距预测模型比较研究[J].安徽农业科学,2011.39(24):57-59,62.
[5]张艺.基于灰色预测法的河北省城乡居民收入的分析与预测[J].商,2015,28:197,188.
[6]霍炳男.中国城乡居民收入差距影响因素的实证检验[J].统计与决策,2017,4(427):110- 112.
[7]马斌,张富饶,城乡居民收入差距影响因素实证分析[J].中国农村经济,2008,2:53-59.
[8]魏发凡.我国城乡居民收入差距的影响因素分析[J].改革与开放,2010,7(298):4-6
[9]喻胜华,张静.基于Lasso和BP神经网络的组合预测及其应用——以居民消费支出预测为例[J].财经理论与实,2016,39:123-128.
[10]薛嘉春,韩建雨.我国居民收入差距发展趋势研究——基于ARIMA模型的预测分析[J].当代经济研究,2011,12:79-84.
[11]龚承刚,王梦,谢航.基于ARIMA模型的湖北省城乡居民收入差距的预测统计与决策[J].2014,15:94-97.
[12]张良均,云伟标,王路,刘晓勇.R语言数据分析与挖掘实战[M]北京:机械工业出版社,2015