基于因子分析和聚类分析研究城镇家庭消费支出

2017-06-14 00:16方帅
现代经济信息 2017年9期

方帅

摘要:本文采用因子分析和聚类分析对城镇家庭消费支出进行统计研究和评价。由因子分析可知:我国城镇居民的消费支出结构分为三大类:日常生活因子,外在因子和居住因子,从综合得分可知经济发展主要分为三梯度:经济发达,欠发达,落后地区。这与通过聚类分析结果相一致。

关键词:因子分析;聚类分析;城镇家庭消费支出

中图分类号:F126 文献识别码:A 文章编号:1001-828X(2017)009-00-02

一、引言

目前,随着经济改革的不断深人,居民的生活水平改善的同时,结构也在逐步级。如何有针对性增强经济发展,这就需要我们分析每个城市的经济发展水平,有的放矢地制定经济发展计划。

二、实证分析

数据来源及处理:

根据数据的可获得性、权威性和统一统计口径原则,本文从国家统计局中得到2014年关于全国各地区31个省市自治区城镇生活费支出的相关数据。主要包括居民家庭平均每人食品、衣着、居住、家庭设备及用品、医疗保健、交通通信、文教娱乐以及其他消费支出共分为八大类,这些指标分别记为X1、X2、X3、X4、X5、X6、X7、X8。

(一)因子分析

1.模型检测

一般,满足线性相关性的变量才可以做因子分析。由上图可知,这八个指标间相似性的相关系数矩阵中绝大多数系数值都较高,说明原始数据适合做因子分析。

由KMO 抽样适度测度值可知: kaiser- MSA= 0.77294558, 大于0.5, 一般认为此值越大, 做因子分析的效果越好。

其次,我们依据据旋转前的先验共同度估计结果λ>1,且累积方差贡献率大于或等于85% 的变量作为公因子的要求,所以特征根λ1 λ2 λ3符合要求,三者累积方差贡献率达到90.80%,大于85%,说明前三个公因子可以解释原始变量的大部分信息量,因此提取前三个公因子是比较科学的。

从最初公因子载荷来看,八个变量在第一个公因子F1 上的载荷都很高,这些变量同第一个公因子高度相关。但是,一般情况下,我们对所提取的公因子之间的相关性较低,或者不具有相关性。我们将采用方差最大化来进行对因子进行旋转增强公因子解释性。

由旋转后得到的因子负荷矩阵可知,食品、家庭、其他商品和服务这六项指标在第一个公因子F1上的载荷很高,说明第一个公因子主要体现居民生活的必要需求,同时也存在享受型的生活支出,如接受娱乐服务。因此,我们把第一个公因子定为日常生活因子。其次,衣着、交通与通信等指标在第二个公因子上的载荷很高,表明反映了外在生活因子。第三个公因子可以被定义为居住因子。

2.提取因子

为了比较分析各地区消费差异,我们需进一步计算各地区城镇居民消费支出状况的综合得分情况。我们需要先得到三个公因子计算公式,然后在以每个公共因子的贡献率作为权值,进而计算综合因子得分值。于是可以得到:

公共因子的计算公式为:

F1=0.93390*X1+0.22475*X2+0.63973*X3+0.85063*X4+0.10249*X5+0.91364*X6+0.84928*X7+0.84313*X8

F2=0.07529*X1+0.20548*X2+0.71759*X3+018865*X4+0.81880*X5+0.24581*X6+0.33126*X7+0.18732*X8

F3==0.00141*X1+0.093796*X2-0.01870*X3+0.30345*X4+0.51308*X5+0.12583*X6+0.24042*X7+0.38424*X8

將这三个公因子以各自的方差贡献率占累积方差贡献率的比重为权重来加权计算综合得分

F=4.3328965*F1+1.4740923*F2+1.4567295*F3

3.综合得分比较

由上图分析可知:对第一公因子日常生活因子来讲,东部地区发达的得分普遍较高,东北和中部地区得分一般,而偏远边界地区较低; 第二个公因子外在生活因子得分:北方地区普遍偏高,南方地区相对较低,这可能与天气相关,一般来说,较冷的地区用于衣着比例较高,而天气更温和的南方地区反而交通与通讯的支出占消费支出总额的比重较高,这可能与发达的南方交通设施有关。从公因子居住因子F3得分来看,北京山西上海得分较高,原因可归纳为发达地区经济发展吸引了更多的人,所以相对来说住房需求较大,房价普遍较高。

最后分析31个地区的综合得分:其中上海得分最高14.1972,上海11.0372,;而贵州 -4.3822,青藏-4.1430,黑龙江-3.9581;可以看出北上广津超一线发达地区得分普遍较高,这与他们的经济发展密不可分,其次沿海二线城市欠发达地区得分一般,最后相对落后地区综合得分则较低。

(二)聚类分析

为了进一步验证结果;我们将采用聚类分析将八个指标重新聚类成三部分如下图所示,可以看出第一类包含5个指标解释方差4.4360173,第二类指标包含两个指标,解释了1.65552的方差,最后一类只有一个指标包含了1的方差。总共解释了7.015692的方差,占总体方差的87.70%。

由上图标准化的回归系数阵,我们可知

C1=0.21026*X1+0.21091*X4+0.21993*X6+0.21681*X7+0.21278*X8

C2=0.54956*X2+0.54956*X5

C3=X3

分析可知:第一类包含了食品,家庭设备及用品,文教娱乐,医疗保健和其他消费,我们可以归类为日常生活因子;第二类外在因子包含了衣服和交通;最后一类也可以归纳为居住因子。

最后我们通过聚类分析的树状图可知,北上广江津发达地区可以聚为一类,因为这些城市居民的收入较高,因此有较强的消费能力。而吉林西藏青海可以聚为一类,这是因为落后的中西部地区,消费能力较弱;其他的聚为另一类。这与我们上述因子分析的结果基本一致。当前我国国民经济运行的主要问题之一是需求不足,消费需求是整个总需求的一个重要方面。

上述分析表明,我国的消费需求呈现出极大的地区不平衡性。而这种三梯度的地区性消费不均现象是与经济发展相关的。因此,我们需大力改善的第三梯度经济,扶持第二梯度地区经济,才能从根本上解决我国消费需求不均衡现象。

三、统计结果分析

通过因子分析和聚类分析可知:我国经济依地区划分主要分为三个梯度,居民消费支出的规模主要受地区经济发展水平影响。首先第一梯度经济发达地区要继续保持领头羊的作用,帮助他们摆脱经济发展怪圈,政府有重点地引导具有地方特色第二梯度地区要持续健康发展的同时,我们要大力增加科技引进,不断为经济发展注入新鲜血液。同时,政府需要大力挖掘文化休闲娱乐等建设。对于第三梯度经济欠发达地区,我们要从根本上解决需求不足,发展落后的问题,可以从减少消费税收的形式刺激一般消费需求,以此进一步提高经济落后地区城镇居民的消费水平。同时政府需要加大交通设施建设改善交通不便现象。

总之,国家实现“刺激消费,扩大内需,刺激经济增长”的目的,需要有的放矢地根据地区发展有针对性的提出发展策略。

参考文献:

[1]孙彩虹.我国城镇居民消费结构变动的因子分析[J].重庆工商大学学报(西部论坛),2007(1).

[2]余明江,季丽,胡云霞.我国城镇居民消费结构的因子分析[J].安徽工业大学学报,2008(25).

[3]国家统计局.中国统计年鉴(2010)[M].北京:中国统计出版社,2013.

[4]王学民.应用多元化分析[M].上海:上海财经大学出版社,1999.