我国省域城镇居民消费性支出情况分析

2022-04-11 14:56陈炫轮蒋泽坤
速读·中旬 2022年2期
关键词:聚类分析主成分分析

陈炫轮 蒋泽坤

◆摘  要:本文以31个省份和地区为例,分析了2019年城市居民的消费支出状况,使用主成分分析和聚类分析的方法,结合SPSS软件和JMP软件,对31个省市自治区的消费支出差异情况进行研究,并对其进行分类。结论是地区间经济发展水平的差异以及地理位置因素的影响导致了我国不同地区城镇居民消费支出情况的差异性。

◆关键词:主成分分析;消费支出差异性;聚类分析

一、引言

伴随着我国经济的高速发展,31个省市、自治区的城市居民的生活水平也在逐步提高,消费水平也在逐步提升,但消费结构也在不断地改变。此外,由于各省市自治区经济发展水平各不相同,受地理位置影响,他们的居民消费支出情况也各不相同。正确认识我国31个省市自治区之间居民消费支出的差异情况,并探究其原因,对于提高我国城镇居民消费水平有着十分深远的意义。

国内有关城市居民消费支出的研究從未间断,而主成分分析和聚类分析是本文的主要研究方法。王传仕等运用主成分分析法对我国城市居民的消费状况进行了研究,并运用综合得分进行了排序;朱建军分析了中国城市居民的消费行为,由此得到城市居民的主要消费倾向,并提出了自己的对策和建议;苏静初在调查河南省城市居民的消费行为时,找到了他们的消费热点和焦点;张月等运用恩格尔指数来表示城市居民的生活水准,并运用聚类分析方法对城市居民的消费构成进行了比较分析,得出了各区域的消费特征。

二、理论基础

2.1协方差矩阵与相关矩阵

在应用主成份分析法进行实际问题时,一般有两种方法,一种是先由原变量的协方差矩阵,再协方差矩阵来进行主成分分析;另外一种是从原始变量的相关系数矩阵来进行主成分分析。所以,在实践中,我们到底应该怎么做?

在通常的情形下,我们会根据原变量的协方差矩阵来进行主成分分析,这是由于原变量的相关系数矩阵等于是将原变量的协方差矩阵进行了归一化处理,而由相关系数矩阵进行的主成分分析则是对原资料进行归一化后的数据进行研究,而在这个时候,数据就不再是原来的数据了。在资料的维度和变异值差异很大的情况下,采用基于原变量的相关系数矩阵进行主成分分析。另外,在选择的主要成份时,基于相关系数矩阵的主成分分析所生成的负荷矩阵与相关矩阵的功能是相同的,只须选择一个矩阵就可以对其进行说明。

三、实证分析

3.1数据来源与处理

本文收集了31个省市2019年城镇居民消费支出的8个指标,即X1-X8,食物烟酒、服装、住房、生活、交通通讯、教育、体育卫生、其他用品和服务。资料来源于《中国统计年鉴2020》。

由于各项数据的差异相对较大,为了便于后续的分析处理,故首先对原始数据进行标准化处理。本文采用标准差标准化方法对原始数据进行处理,操作软件为SPSS。

3.2相关系数矩阵

在得到了规范化的资料之后,还要对所选取的变量进行相关性检验,检验所选取的指标是否具有进行主成分分析的前提。通常,在主成分分析中,选择的各变量间相关性越高,就越适宜进行相关的研究。本文使用SPSS对各个变量进行了相关分析。

结果显示,除了食品烟酒与医疗保健之间的相关系数仅为0.097以后,大部分变量的相关性都大于0.6。这说明所选择的指数具有很高的关联度,符合主成分分析的前提。

3.3主成分结果展示

采用 JMP软件,对31个省区的8个变量进行了主成分分析。首先求出各个主要成份的特性值和累积贡献率,见表4。在选择主成分时,原则上通常采用的是大于1的特征值。前两种主成分的特征值分别为5.2926和1.1077,都超过1,两种主要成分的累积贡献率高达80%,说明前面两个主要成份包含了31个省市的绝大部分城市居民的消费情况,所以我们可以选择前面两个主要成份进行分析。

由主成分的载荷矩阵(参见下表),得出了上述两个主要成分的表达式:Y[1]=0.7328X[1]+0.5315X[2]+0.9032X[3]+0.8791X[4]+0.9148X[5]+0.8452X[6]+0.6667X[7]+0.9427X[8] (1)

Y[2]=-0.5726X[1]+0.5841X[2]-0.1677X[3]+0.0070X[4]-0.2271X[5]-0.0452X[6]+0.5858X[7]+0.1167X[8] (2)

根据主成分表达式,我们可以给出一个关于两个主要成分是否与真实的上下文和语义相符的解释。根据的表达式,的值可以衡量全国31个省份城镇居民消费水平的高低;根据的表达式,我们可以根据的值来衡量全国31个省份城镇居民受气候影响的消费性支出占比的情况,主要影响变量是衣着以及医疗保健。

四、结论及建议

结合主成分分析对全国31个省份城镇居民消费支出情况分析的结果,我们得到如下结论和建议:

区域的发展水平对居民的消费支出有很大的影响,区域内的经济发展水平越高,消费支出也就越多,因而总成分的得分也就越高。从总体得分上看,31个省市居民的消费支出呈现出明显的区域失衡。在东部,居民的消费水平比较高,而在中西部,他们的消费水平比较低。北京市、上海市、天津市、广东省、浙江省、江苏省六个省市主要成分的综合得分最高。由于经济发展程度比较高,所以他们的消费也比较高。要解决区域发展的不平衡问题,必须在宏观上调整和调整中西部的经济发展,提高经济发展的速度,同时要加强与中西部、东部的合作与交流,以逐渐减少区域间的不平衡。

参考文献

[1]王传仕.我国城镇居民消费水平主成分分析[J].技术经济,2002(09):40-41.

[2]朱建军.我国城镇居民消费结构主成分分析[J].无锡商业职业技术学院学报,2009,9(01):21-22.

[3]苏静.河南城镇居民消费结构的计量分析[J].河南财政税务高等专科学校学报,2011,25(03):48-51.

[4]张月,张金凤,王泓娜,关静.聚类分析在我国城镇居民消费结构研究中的应用[J].辽宁大学学报(自然科学版 ),2004(01):47-49.

作者简介

陈炫轮(1997-),男,河南信阳人,硕士研究生,主要研究方向大数据分析。

猜你喜欢
聚类分析主成分分析
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
农村居民家庭人均生活消费支出分析
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
服务贸易结构优化路径研究
“县级供电企业生产经营统计一套”表辅助决策模式研究