刘德权 刘大成
摘要:从经济学和统计学视角,本文选取影响城镇居民消费水平的因素,并以相关消费理论和模型为基础,利用主成分分析方法和岭回归分析方法建立城镇居民消费水平经验模型。分析结果表明两种方法各有千秋,主成分分析方法在模型拟合方面更加具有优势,拟合结果更加精确稳定,而岭回归分析方法在模型调试方面更加有效。当然,将两者结合起来运用会使经验模型与理论模型更加贴近,更有效地揭示经济现象。
关键词:主成分分析;岭回归分析;经验模型构建
中图分类号:F063.2 文献标识码:A
一、文献综述
消费函数反映了居民消费性支出与影响消费性支出的变量之间的函数关系,无论从理论研究上还是从实证研究上,消费函数理论一直是经济学家关注和研究的领域。作为经济学中最基本、最重要的经济函数之一,消费函数一直被广泛地运用到分析国民收入的使用动向,以及研究居民消费水平与收入水平之间的关系。因此,消费函数理论可以为政府制定宏观经济政策,进而实施宏观经济调控提供有力的参考。
国外关于消费函数的研究是以凯恩斯的消费理论作为起点而发展起来的,为了说明消费与收入之间的关系,凯恩斯提出了消费函数。在凯恩斯的经典理论中,消费与可支配收人之间有稳定的函数关系,而且这种函数关系是线性的函数形式。以此为基础,经济学家对消费函数进行了扩展,从不同角度作了更进一步的研究,形成了常见的杜森贝里相对收人消费函数,弗里德曼持久收人函数,莫迪利安尼终生收人消费函数等多种消费函数形式[1-2],当前的实证研究也是在这些消费函数形式的基础上发展起来的。
国内对于消费函数的研究则是借鉴西方国家的消费模型形式,再结合我国的具体国情而建立起来的我国居民消费模型。比较成型的居民消费模型有扩展线性支出系统(ELES),该系统假定某一时期人们对各种商品(服务)的需求量取决于人们的收入和各种商品的价格,而且人们对各种商品的需求分为基本需求和超过基本需求之外的需求两部分,而且认为基本需求与收入水平无关,居民在基本需求得到满足之后才将剩余收入按照某种边际消费倾向安排各种非基本消费支出,ELES模型把消费者对各类商品或服务的消费支出看作收入和价格的函数[3]。
再有就是在凯恩斯经典消费理论的基础上,所建立起来的人均可支配收入与人均消费性支出的一元线性回归模型[1]。最近几年,一些学者和专家在这方面也取得了一定的研究成果。如曾令华、赵晓英(2006)运用中国1978-2004年数据,构建了城镇居民的消费函数,研究居民消费与其影响因素之间的长期均衡和短期动态关系;田俭(2008)以绝对收入假说和生命周期假说为基本理论依据,利用1995-2005年数据实证分析了家庭平均可支配收入、当期收入、持久收入等因素,对我国城镇居民、农村居民消费的影响;杨晓春(2008)构建了一个非常简单的消费模型,采用1980-2003年的数据进行回归,并结合消费函数的相关的经济理论,对模型进行反复修正和改进,最终得到和以绝对收入假说理论为基础的消费函数模型相一致的我国居民消费函数模型[4]。
另外,还有运用协整理论与误差修正模型,以及格兰杰因果检验来建立居民消费模型。该理论总结了收入对消费的决定性作用,认同收入与消费之间存在长期均衡和短期波动的关系。在这方面比较有代表性的研究成果,如褚德银和经庭如(2009)使用我国1990-2007年数据,采用协整、误差修正模型以及格兰杰因果检验等经济计量方法,分析了我国农村居民消费和收入水平的关系,认为长期内农村人均消费支出和人均收入之间存在稳定的均衡关系,而短期内农村居民人均消费支出变动是有人均纯收入的增加所引起的[4]。
本文重点总结了我国现阶段关于居民消费模型的实证研究,发现很少有学者使用主成分分析方法或岭回归分析方法来建立居民消费经验模型来进行总量模拟和进一步地预测,即使有关于上述两种方法的应用论述也主要集中在综合评价方法方面。因此,本文重点探讨这两种建模方法所建立起来的经验模型的模拟效果情况和两种方法所各自具有的分析优势。
二、城镇居民消费水平的系统阐述
(一)部门分类与选取
从国民经济核算的实际需要出发,依据对经济活动主体行为特征的考察,SNA区分了两种不同类型的经济活动主体:机构单位和基层单位,并以此为基础形成了关于国民经济活动主体的两种分类:机构部门分类和产业部门分类[5]。根据研究目的的需要,本文采用机构部门分类(经济总体中全部常住单位的分类)这一分类方法,以及从统计数据的可获得性(不包括为住户服务的非营利机构部门)角度,选取对居民消费水平有经济影响的各部门具有代表性的因素进行经济学分析。具体来讲,本文选取了政府部门、金融机构、住户部门、非金融企业部门。作为影响居民消费水平的因素的载体,进而分部门地进行影响因素的经济学分析。
(二)城镇居民消费水平概述
1.城镇居民消费水平定义。城镇居民消费水平是指居民为满足生活需要而消耗物质产品和享受劳务的数量,它从量的方面反映居民生活需要在某一时点上所达到的水平[6],城镇居民消费水平主要以居民消费总量来反映。居民消费总量,一是就主要消费品的消费来统计的消费实物量,二是就所有消费内容进行消费支出统计,即居民最终消费支出。在此基础上,可计算出人均全年消费性支出。
2.城镇居民消费水平的核算指标。在国民经济核算中,对最终消费的度量有两种标准:一是以承担货物和服务的支出为标准,从支出者的角度核算最终消费,称为最终消费支出;二是以货物和服务的实际获得为标准,从获得者的角度核算最终消费,称为实际最终消费。之所以同时按这两种标准核算最终消费,是因为尽管在多数情况下支出承担者同时也就是获得者,但在某些情况下两者并不是统一的[5]。本文从居民消费所确定的统计时点是获得的物品和服务量的支出,即已承担货物和服务的支出来对居民消费水平进行统计,即使居民最终消费支出作为居民消费水平的核算指标。考虑到统计资料或数据的可获得性这一现实问题,本文选用转换指标人均全年消费性支出来反映居民消费水平,即进行间接度量。公式表示如下:
人均全年消费性支出=[SX(]当前居民最终消费性支出[]当年平均人口数[SX)]
由于居民消费水平统计是对当期居民住户获得的物品和服务量支出的统计,按照上述指标说明理论上应使用最终消费支出。
三、变量的选取
根据前面的部门分类,本文选取影响居民消费水平的各机构部门具有代表性的经济因素包括:财政收支(政府部门)、银行信贷(金融机构)、居民消费价格指数(住户部门)、可支配收入(以非金融企业部门和住户及政府部门为研究对象)、可支配收入(以非金融企业部门和住户及政府部门)。本文将最终消费支出的统计范围和对象限定在哈尔滨市居民即住户最终消费支出。在就以上经济因素对居民消费水平的影响进行实证分析之前,有必要根据现有数据资料为以上各经济因素(包括被影响因素)选择合适的变量,又由于本文的研究主体是城镇居民,并且是以哈尔滨市为例,所以统计数据的来源是《哈尔滨统计年鉴》中的相关城镇部分的数据资料。
(一)因变量(被解释变量)的选取
考虑到统计资料或数据的可获得性这一现实问题,在实证分析中选用转换指标城镇居民人均全年消费性支出来反映居民消费水平,即进行间接度量,记作yt。
(二)自变量(解释变量)的选取
选取地方财政净收入、城镇储蓄存款余额、城镇居民消费价格指数和城镇居民人均可支配收入四个变量,作为研究人均全年消费性支出变动的数量变量[7],而且可以满足n=14>3×i=12的条件,即满足样本容量n大于三乘以解释变量个数i的要求。
1.地方财政净收入x1t。地方财政净收入等于地方财政收入减去地方财政支出,由前面的分析可知作为地方政府部门的财政净收入,很大程度地影响或制约着城镇居民人均消费性支出的水平。
2.城镇储蓄存款余额x2t。城镇金融机构存款余额是指存入银行的时点数(存入数扣除取出数的余额),如月末、季末或年末数额,本文使用年末的统计数据作为城镇储蓄存款余额的时间数列数据。
3.城镇居民消费价格指数(CPI)x3t。城镇居民消费价格指数(CPI)是反映一定时期内城镇居民所购买的生活消费品价格,及服务项目价格变动趋势和程度的相对数。利用城镇居民消费价格指数,可以观察和分析消费品的零售价格和服务价格变动对城镇居民实际消费支出的影响程度。
4.城镇居民人均可支配收入x4t。可支配收入作为二次分配的最终结果,是居民实现有效消费的关键性变量,选用人均可支配收入是从一般水平上来考虑居民的可支配收入水平,进而来考虑对人均消费性支出的影响,以消除单纯由人数所造成的总量指标过大的虚假现象,以此来消除指标代表性不好的问题,从平均或一般角度来真正意义上地考察它们二者之间的制约或约束关系。
四、城镇居民消费水平经验模型
(一)构建经验模型的理论基础
总需求在国民经济核算中是以生产为起点,但总需求反映的不是使用价值量,而是可用于购买最终产品的货币购买力总量。从需求形成的角度来测算国民经济总需求,其出发点主要是因为国民经济总需求就是指经过分配和再分配而形成的对社会产品有支付能力的需要。一方面,总需求必须表现为货币收入,即要有货币支付能力;另一方面,总需求必须表现为需求,即货币收入必须用于购买产品。在货币收入中,凡是愿意用来购买产品的部分就形成了总需求,而不愿意用来购买产品的部分就不形成总需求,以此形成的总需求用公式[6]表示为:本期形成的总需求=国内生产总值-本期储蓄+本期银行信贷+本期财政净收入+本期国际收支差额。再有就是结合凯恩斯的绝对收入假说理论,用C代表消费,Y代表收入,那么可以把消费函数写为:C=f(Y),以表明消费与收入的关系[8]。
由于探讨了储蓄方面的影响因素,本文参考了利兰德的预防性储蓄理论。该理论首次从理论上分析了产生预防性储蓄的必要条件,把预防性储蓄定义为厌恶风险的消费者为了防范未来收入风险导致消费下降而额外增加的储蓄[4-5]。本文以宏观、微观经济理论中的模型架构为蓝本,用主成分分析方法和岭回归分析方法,建立城镇居民消费水平经验模型,并以此来进行城镇居民消费水平的拟合。城镇居民消费水平的经济计量形式的理论模型如下所示:
其中yt表示城镇居民人均全年消费性支出,x1t表示地方财政净收入,x2t表示城镇储蓄存款余额,x3t是城镇居民消费价格指数(CPI),x4t表示城镇居民人均可支配收入,ut表示随机误差项。
(二)使用主成分分析方法,构建城镇居民消费水平经验模型
在进行主成分估计之前,有必要阐述主成分估计的优势所在:在构建的模型中,如果存在两个以上的解释变量,而且是使用普通最小二乘法进行参数估计,那么必然存在着多重共线性的问题。由于这一问题的出现就与基本假设相矛盾,结果导致参数估计值方差过大,要想解决此问题就需要进行变量筛选。但是,进行完变量筛选之后必然会导致一些变量所携带的重要信息的丢失,用剔除了相应解释变量之后所建立起来的模型进行总量模拟和预测,就势必会导致模型参数不稳定,以致模型的实际价值大大降低。但是,使用主成分估计方法就可以将上述问题解决。通常情况下总量模拟效果比较理想,部分计算结果如表1所示。从表1中可以看到有5个主成分的特征值,最大的是λ1=3.129,最小的是λ4=0.003。方差百分比可以反映出主成分所能解释数据变异的比例,也就是所含原始数据信息量的比例。第一主成分的方差百分比为78.213%,含有原始4个变量近80%信息量。由于只有λ1>1,所以就取第一主成分,其累计方差百分比为78.213%,第一主成分的得分表达式为:
F1=-0.309x*1+0.316x*2-0.156x*3+0.316x*4(2)
其中x*i表示标准化的解释变量,利用该表达式可以计算出第一主成分的得分值。现在用y对第一主成分F1做普通最小二乘回归,得主成分回归方程:
=2888.538F1+5571.793(3)
(43.858) (21.910)
然后再将(2)式代入(3)式,得到用标准化后的原始自变量表示的回归方程:
p=5571.793-892.558x*1+912.778x*2-450.612x*3+912.778x*4(4)
使用(4)式就可以对城镇居民人均消费性支出水平做出模拟和预测,相应结果如表2所示。
从图1中可以观察到主成分回归方程对总量的模拟效果,无论是从趋势上看还是从偏差的程度,即估计的精度上看都比较理想。也就是说使用主成分估计的方法可以对城镇居民消费水平模型做出有效地估计,实现了我们最初的目标。
(三)使用岭回归分析方法,构建城镇居民消费水平经验模型
为了对比剔除变量前后模拟效果的好坏,本文将城镇居民人均消费性支出关于不同解释变量[9]所做的岭回归分析的标准化拟合值列于表4中,表4中的倒数3,4,5列是分别使用4,3,2个解释变量在岭回归分析中所得到的标准化拟合值。不难观察到用(5)式所计算出的标准化拟合值与实际标准化值最接近,可见本文的做法是合理的。
最后,将(5)式转换成未标准化的岭回归方程为:r=1056.83+1.075x2+0.371x4(6)
(6.699) (21.817) (25.525)
即(6)式为模型估计形式。相应计算结果列于表2中最后一列。对比图1,从图3中可以观察到使用岭估计方法所建立的方程,在趋势拟合方面明显优于使用主成分方法构建起来的方程所实现的拟合程度,但是在估计精度方面的优劣还需要进一步地使用相关的统计量来分析比较。
(四)两种建模方法的拟合效果比较
五、总结
通过上面对两种建模方法的分析比较,不难看出两种方法各自的优势与缺点。针对建模本身而言主成分分析方法更好,因为它可以有效利用全部解释变量所携带的信息,并且可以有效地解决多重共线性所可能导致的相应问题,使得模型拟合值方差较小、相对稳定,适合做预测分析。在变量选择以及消除多重共线性方面,岭回归分析方法更有优势,操作过程更加简便。换句话讲,它更适合作为模型调试工具来用,而不适合用来建立经验模型本身,这一点从它所建立的经验模型的拟合值的稳定性就可见一斑。因此,应该将两者的优势结合起来运用,以使所需要构建的经验模型更加切合实际情况,更适于进行预测。
参考文献:
[1] 魏英辉.对我国居民消费函数的分析[J].内蒙古电大学刊, 2005(8):33-34.
[2] 刘臣.对消费函数的几点认识[J].广播电视大学学报(哲学社会科学版), 2005(4): 60-61.
[3] 田卫,高合群.山东省城镇居民消费的实证分析[J].消费导刊, 2009(10): 4.
[4] 贺书伟, 郑珍远.宏观经济变量对我国居民消费函数影响的实证研究[J].郑州航空工业管理学院学报,2010(28):16-17.
[5] 肖红叶,周国富.国民经济核算概论[M].北京:中国财政经济出版社, 2004:144-145.
[6] 韩云虹.国民经济核算与分析[M].北京:经济科学出版社, 2005:240.
[7] 朱喃喃,王巧巧.金融危机下进出口商品总额变动对我国居民消费价格指数影响的实证分析[J].统计教育,2010(6):28.
[8] 高阳. 甘肃省城乡居民消费水平和消费结构的比较研究[D].甘肃农业大学,2009.
[9] 何晓群,刘文卿.应用回归分析(第二版)[M].北京: 中国人民大学出版社,2007:144-161.
[10]战昱宁.我国居民消费需求不足及其影响因素研究[D].南开大学, 2009.
Empirical Model Construction of Urban Residents′ Level of Consumption
LIU De-quan1,LIU Da-cheng2
(1.School of Public Finance,Harbin University of Commerce,Harbin 150028, China;
2.College of Economics and Management, Northeast Forestry University, Harbin 150040, China)
Abstract: From the perspective of the economics and statistics, we select the factors of affecting urban residents′ level of consumption. On the base of relative consumption theories and models, we construct the model of urban residents′ level of consumption, using the methods of principal component analysis and ridge regression analysis. As a result, they are both relatively excellent. Principal component analysis, however, is much better to simulate total scale, and makes fitted values more accurate and more stable; on the other hand, ridge regression analysis is capable of debugging models very well. Of course, combining them will make empirical models and theoretical models close, and will more effectively reveal economic phenomena.
Key words:principal component analysis;ridge regression analysis;empirical model construction
(责任编辑:关立新)