宫雷
摘要:本文运用系统聚类分析方法研究我国农村居民消费结构,为进一步研究我国农村居民消费问题,优化农村居民消费结构并积极寻求有效对策提供了依据。
关键词:因子分析 聚类分析 消费结构
一、引言
随着我国经济的快速平稳发展,对于消费问题的关注成为转型期经济研究的重点之一,而对于消费结构的研究因其变量较多、机理复杂、数据量很大,所以各种较新的数理实证方法在此领域中应用逐渐受到广大学者的重视。传统的实证分析一般停留在简单地对各类指标进行年均增减等比对分析,随着统计方法日趋完善,各类年鉴中统计指标逐渐细化,且有充足统计数据的时间段逐渐延长,对于同一指标的描述也从原来的单变量变为了多维变量,数据量大大增加,而刻画描述的细化程度也越来越有利于我们对实际情况进行分析。可以说,单从各类数据角度出发,对类似于农民消费结构这样的重大经济问题,我们已经有了摆脱简单实证分析的数据基础。
聚类分析是根据已知的观察数据,计算所观察的各个样品或变量之间亲疏关系,再依据某种准则,使同一类内的差别较小,而类与类之间的差别较大,最终将所观察的样品或变量分为若干类的分析方法。本文以日趋完善的统计数据为基础,运用系统聚类分析的方法研究我国农村居民消费结构,对于我国制定完善经济政策,改善农村居民消费结构,促进消费水平,进一步提高农民消费质量有重要的意义。
二、建模基本思想及流程
系统聚类分析的基本思想是:对于位置类别的样本或变量,依据相应的定义把它们分为若干类,分类过程是一个逐步减少类别的过程,在每一个聚类层次,必须满足“类内差异小,类间差异大”原则,直至归为一类,其基本步骤如下:
(1)对原始变量标准化并选择度量样品间距离的定义及类间距离的定义。
(2)計算n个样品两两间的距离,的样品间的距离矩阵D(0)。
(6)画谱系聚类图。
(7)决定分类的个数及各类的成员。
三、实证分析
(一)数据来源
本文数据来源于《中国统计年鉴》(2016年)。考虑到数据的可取性,依据我国常用的消费资料支出分类方法,按农村居民家庭平均每人生活消费现金支出去向分为食品、衣着、家庭设备及服务、交通通讯、文教娱乐及服务、医疗保健、居住、杂项商品及服务八个指标来构建居民消费价格水平的指标体系,避免了单指标的片面性,它们在人均生活消费总支出中所占的百分比分别记为X1,X2,…,X8。
(二)聚类分析
聚类分析是将一批数据的个案或者变量的诸多特征,按照关系的远近程度进行分类。用原始变量进行聚类,由于变量数太多,变量之间的相关性较强,同时存在特异值,使得聚类结果不是很好,而采用因子分析的结果因子得分来进行聚类分析的结果则相对较好。关系远近程度的定量描述方式不同以及利用的聚类方法不同,可以产生有差别的聚类结果,本文度量样品间距离采用的是应用最广的欧式距离,度量类间距离采用的是分类效果较好,基于方差分析思想的离差平方和法(Ward法),采用本文第二节介绍的聚类思想及步骤,可将31个样本聚为3类,聚类结果表1所示:
四、综合评价
从聚类的结果来看,表1中各类别所包括的城市数不同,从形式上不如人为分组整齐,但这恰恰反映了聚类分组的科学性,它避免了人为分组的主观随意性。
第一类是北京,上海、广东,浙江等经济发展水平很高的地区,这些地区的农村居民的衣着、交通和通讯、文教娱乐用品及服务、医疗保健等这几个项目的支出比例是这3类中最高的,这些消费项目是已经超越于日常生活,必需品消费,因此这一类的农村居民生活水平是最高的。
第二类中的这些地区的农村居民的衣着、交通和通讯、文教娱乐用品及服务、医疗保健等这几个项目的支出比例在所有的消费中占的比例也非常高,仅次于第一类中的几个地区,农村居民的生活水平大部分已经达到了小康水平。
第三类中的地区的农村居民的生存性消费还是占主导地位,即食品、居住占主导,而精神消费、娱乐文化等消费欠缺,这一类中的农村居民生活水平已经解决了温饱,正在向小康迈进。从分类中可以看出,生活水平较高的农村居民都是东部沿海经济较发达的省市,而西南部欠发达省市的农村居民生活水平相对较低,这很大原因是各地区经济发展不平衡,造成居民收入差异较大,使得贫困地区的居民可用于消费的资金不多,不敢消费。