□谭元元,欧诗德
(1. 广西财经学院,信息与统计学院,广西 南宁 530003;2. 玉林师范学院,数学与信息科学学院,广西 玉林 537000)
广西城镇居民人均收入和消费的非参数回归估计
□谭元元1,欧诗德2*
(1. 广西财经学院,信息与统计学院,广西 南宁 530003;2. 玉林师范学院,数学与信息科学学院,广西 玉林 537000)
本文尝试用非参数回归方法研究居民人均可支配收入与消费的关系,应用非参数局部多项式估计方法对广西1980年~2010年城镇居民人均可支配收入与消费数据进行实证分析,克服了传统线性回归模型在讨论居民人均可支配收入与消费关系的不足。实证结果表明非参数回归方法优于线性回归方法.
非参数回归;非参数局部多项式;可支配收入-消费
居民的消费支出和收入存在着相关关系,学者们通常用线性回归模型和非线性回归模型来描述这种相关关系,这种回归模型的回归函数形式是预先设定的,通过给出未知参数的估计,就可确定这个回归模型,这种建模方法就是所谓的参数回归方法.一般来说参数模型的参数都有明确的经济意义,模型建立需要一系列前提条件,比如要求解释变量为确定性变量且与误差项不相关、误差项要有同方差、相互独立、服从正态分布等.如果回归模型选取有误,或者参数假定与实际情况相背离,模型的误差项是异方差、不独立、非正态性,那么推断和预测结果就会出现较大的偏差;另一方面,回归模型假设回归系数在所研究的时期内保持不变,但实际上随着时间的推移或者截面的改变,参数也应随之变化.因此,直接使用经典的参数回归模型进行估计缺乏稳健性,从而导致得到的结论与实际情况产生较大的偏差.
非参数回归模型与参数回归模型不同,它的回归函数形式不需要事先设定,模型构建仅需要较弱的前提条件.由于对经济现象的研究,特别是在微观经济学中,大量的经济结构是预先无法确认的.例如,消费支出与收入问题,它们之间是存在着相关关系,但这种相关关系不一定满足参数回归分析所要求的条件.因此,近年来非参数回归估计方法广泛应用于经济学的研究中,并取得了较好效果.例如,张守一等人(1997)[1]应用非参数估计方法估计居民消费与总收入的非参数函数关系;江海峰(2006)[2]采用随机变量密度函数的非参数核估计和核回归,对我国2004年城镇居民的实际消费进行实证分析;李竹渝等人(2007)[3]用非参数模型研究计量经济领域中若干重要问题,对时间与收入的分布进行解释,并讨论恩格尔曲线的非参数估计等;吴相波等人(2007)[4]探讨了非参数回归中局部线性估计的多重共线问题,提出了有效的解决方法.叶阿忠(2008)[5]全面介绍了非参数模型的理论、方法及其在计量经济中的应用;周先波等人(2008)[6]通过设定面板数据Working-Leser模型的非参数形式,运用非参数局部线性估计方法给出了消费支出份额与总消费支出函数关系;刘浚(2009)[7]运用非参数回归模型研究我国GDP 与能源消费总量之间的关系,模型拟合效果较好.这些文献表明了非参数回归方法在实际中的应用很受关注.
然而,在应用非参数回归估计方法来研究经济中的有关消费和收入问题的文献中,大多是研究全国居民的消费和收入问题,很少涉及到地方居民的消费和收入问题.本文使用非参数回归方法来研究广西消费支出和收入问题,通过应用R-统计软件(参见薛毅等人[8])设计程序对数据进行统计分析,给出有关非参数回归的计算,揭示广西城镇居民收入与消费支出关系,为政府部门制定经济决策提供有价值的理论依据.
通常的参数回归模型是预先假定被解释变量Y和解释变量X之间具有某种确定的关系Y=f(X).非参数回归不指定X与Y的关系f,设给定样本观测值(X1,Y1),(X2,Y2),…,(Xn,Yn),并且(XI,YI)独立同分布,可建立回归模型:
其中m(Xi)=E(Yi|Xi),εi为随机误差项,是相互独立同分布的随机变量,满足Eεi=0,Var(εi)<+∞.根据样本来确定未知函数m(x)=E(Y|X),模型(1)就是非参数回归.
关于m(x)的估计Stone(1977)[9]给出了权函数估计方法,其表达式为:
其中权函数Wni(x)=Wni(x;,X1…,Xn),i=1,2,…,n.Wni(x)≥0,
对于核权函数的确定,比较常用的方法有Nadaraya-Watson核估计、Gasser-Muller核估计(参见Nadaraya(1964)[10],Watson(1964)[11],Gasser和Muller(1979)[12]),其表达式分别为(3)和(4):
若模型(1)中的回归函数m(x)在X=t处存在p+1阶导数,x为t邻域内的任一点,Tsybakov(1986)[13]提出了局部多项式回归方法,由Taylor展开式得:
这里可以视m(t),m'(t),m((t)为待估参数.
令m(j)(t)=j!βj,(j=0,1,…,p),则(1)的局部多项式估计可表示为:
非参数回归中窗宽的选择非常重要,对于一元密度函数核估计的窗宽选择,可用交错鉴定选择方法和直接插入,本文用直接插入法,详细的方法参见叶阿忠(2008)[5],这个计算过程较繁杂,我们可用Wand编写的R软件包KernSmooth中的dpik函数求出窗宽.
本文采用1980年至2010年广西城镇居民人均可支配收入与消费作为样本数据(参见广西2011年统计年鉴),数据变化趋势见以下的图1和图2.
图1 广西城镇居民人均收入与消费支出趋势
从图1来看,广西在1980年到2010年期间城镇居民人均可支配收入和消费都在逐年增长.用一元线性回归方法研究人均可支配收入和消费之间的关系,表1给出了模型估计情况.
表1 系数估计
相应的回归模型是:
对上述线性回归模型做回归诊断,下面的表2给出了残差分析的结果,图2展示了残差情况:拟合消费支出的平均绝对误差和均方误差分别是:
表2 残差分析
图2 线性回归残差
从图2可以看到残差图从左向右逐渐散开呈漏斗状,这表明残差的方差不相等,即存在异方差,因此运用一元回归描述消费支出与收入关系结果不太可靠.
下面利用非参数回归模型对广西城镇居民人均可支配收入与城镇居民人均消费关系做非参数回归估计.利用R-软件中的基于非参数回归建模软件包KernSmooth,可求得最佳窗宽为h=1857.398,再利用局部多项式回归拟合,表3给出了拟合数据,图3展示了拟合效果.
表3 人均消费的非参数回归拟合值(单位:元)
图3 非参数回归拟合图
用非参数方法拟合消费支出的平均绝对误差和均方误差分别是:
从上面的表3和图3,以及平均绝对误差和均方误差来看,非参数回归模型的拟合效果比线性回归方法拟合效果好很多.另一方面,非参数回归模型的曲线斜率是不断变化的,这反映了人均消费在不同时期受可支配收入影响是不同的.广西城镇居民家庭人均可支配收入与人均消费支出关系是上凸形状的曲线,这表明人均消费支出随人均可支配收入的增加而增加,并且增加的趋势是逐渐减缓的.
本文运用非参数回归方法,探讨了广西城镇居民家庭人均可支配收入与人均消费关系.它们之间的关系是非线性,如果运用线性回归方法来描述这种关系,尽管模型的决定系数很好,但不满足线性回归的同方差条件,结果模型拟合效果精度不高.在残差出现异方差下,我们应用非参数回归方法构建模型,实证结果表明用非参数回归模型能有效地描述广西城镇居民人均可支配收入与消费支出的非线关系,模型拟合效果很好,并且比较吻合实际情况,即基本趋势是一个大致上凸曲线,消费水平随收入的增加而增加,并且增加的趋势是逐渐减缓的,与宏观经济规律相符. ■
[1]张守一,葛新权,王斌. 非参数回归及其应用[J]. 数量经济技术经济研究,1997,(10):60-65,87.
[2]江海峰. 消费函数的非参数回归与实证分析[J]. 安徽工业大学学报,2006,(4):474-477.
[3]李竹渝,鲁万波,龚金国. 经济、金融计量学中的非参数估计技术 [M]. 北京: 科学出版社,2007.
[4]吴相波,叶阿忠. 局部线性估计中的多重共线性问题[J]. 统计与决策,2007,08: 4-6.
[5]叶阿忠. 非参数和半参数计量经济模型理论[M]. 北京:科学出版社,2008.
[6]周先波,田凤平. 非参数估计方法在长江和珠江三角洲地区城镇居民消费支出分析中的应用[J]. 经济学,2008,(4): 1459-1475.
[7]刘浚.我国能源消费与GDP关系的非参数回归分析[J].统计与决策,2009,12: 112-113.
[8]薛毅,陈立萍. 统计建模与R软件[M]. 北京: 清华大学出版社,2008.
[9]Stone, C. J. Consistent nonparametric regression [J]. The Annals of Statistics, 1977, 5(4): 595-645.
[10]Nadaraya, E.A. On Estimating Regression [J]. Theory of Prob. and Appl., 1964, 9: 141-142.
[11]Watson, G. S. Smooth regression analysis [J]. Sankhya, Series, 1964, A(26): 359-372.
[12]Gasser, T. H. and Muller, H. G. Kernel estimation of regression function [M]. Smoothing Techniques for Curve Estimation. (Th. Casser and Rosenbitatt, eds), Lecture Notes in Mathematics, Volume 757, Springer-Verlag, Berlin, pp. 23-68, 1979.
[13]Tsybakov, A. B. Robust reconstruction of functions by the local-approximation method [J]. Problems of Information Transmission, 1986, 22: 133-146.
【责任编辑 谢文海】
The Application of Nonparametric Regression Estimation of the Per Capita Income and Consumption of Guangxi Urban Household
TAN Yuan-yuan1,OU Shi-de2
(1. College of Information and Statistics, Guangxi University of Finance and Economics, Nanning, Guangxi 530003;2. College of Mathematics and Information Science, Yulin Normal University, Yulin Guangxi 537000)
The paper attempts to introduce nonparametric regression estimation theory to study the per capita income and consumption relationship. Based on the data from the per capita income and consumption of Guangxi urban household from 1980 to 2010, we make empirical analysis with nonparametric local polynomial estimation method, and overcome the shortcoming of the traditional linear estimation method for the per capita income and consumption relationship. The result shows that nonparametric regression is superior to linear regression.
nonparametric regression, nonparametric local polynomial estimation, income-consumption
F222.1
A
1004-4671(2014)05-0012-05
2014-01-01
广西教育厅科研项目(编号:200911LX388),国家统计局科研项目(编号:2012LY052)。
谭元元(1981~),女,广西合山人,广西财经学院信息与统计学院讲师,硕士。主要研究方向:金融统计。*
欧诗德(1964~),男,广西玉林人,玉林师范学院数学与信息科学学院教授,博士,研究方向:金融统计。oushide@aliyun.com,yuanyuan39@126.com.