基于主成分、聚类分析对我国各地区居民幸福指数的研究

2020-09-12 14:07潘秋艳葛梅梅魏薇
经济研究导刊 2020年21期
关键词:幸福指数聚类分析主成分分析

潘秋艳 葛梅梅 魏薇

摘 要:随着社会经济的持续发展,人民的生活质量不断提高。居民幸福指数反映了人民群众的生活质量以及对生活的主观感受。因此,分析我国各个地区居民幸福指数的相关指标及影响因素,是关注各地区人民生活质量水平,提升当地居民幸福感的一个好办法。通过主成分分析和聚类分析的方法,利用R语言和SPSS软件对我国2018年31个省市的幸福指数的指标进行分析,进而对提高各地区居民的幸福指数提出有效的建议。

关键词:幸福指数;聚类分析;主成分分析;建议

中图分类号:C916        文献标志码:A      文章编号:1673-291X(2020)21-0028-04

一、幸福指数的含义

幸福指数是人们幸福感的度量值,它是反映民众主观生活质量的核心指标。近几年,随着生活水平的提高,大家对“幸福”的重视程度也越来越高。笔者根据黎昕等中提出的幸福指数指标,从中选取客观性指标,再从《统计年鉴》中下载2018年的数据进行分析,利用主成分分析和聚类分析的方法对我国各地区居民幸福指数进行研究。本文结合许多学者关于幸福指数的观点,将幸福指数体系划分为三部分:生活质量与幸福、社会环境与幸福和自然环境与幸福。

二、指标的选取及数据来源

根据幸福体系的构建,本文选取了我国31个省、市、自治区及直辖市的12个指标进行建模,数据来源于中国统计年鉴和国家统计局。选取影响国民幸福的指标有:GDP城镇居民人均可支配收入、城镇居民人均消费支出年末城镇人口比重、建成区绿化覆盖率、森林覆盖率、广播节目综合人口覆盖率、生活垃圾无害化处理率、出生率、文盲率、死亡率、失业率,共12个指标,其中前10个为正指标,失业率和文盲率为逆指标。

三、各个地区居民幸福指数的主成分分析

主成分分析是研究如何将多个变量转化为少数几个综合变量(主成分)的一种统计降维技术。这种技术使得转化出来的综合变量能够代表原始变量的绝大多数信息且综合变量之间互不相关。

根据《2019年中国统计年鉴》,将全国31个省(直辖市)所要研究的指标汇总成表,利用R语言软件对数据进行主成分分析,输出结果是前5个主成分累计方差贡献率达到85%,说明选取5个主成分可以解释原始变量的大部分信息。得到主成分的模型为:

F1=0.124X1+0.951X2+0.905X3+0.825X4+0.100X5+0.385X6-0.006X7+0.215X8-0.145X9-0.477X10-0.285X11-0.147X12

F2=0.783X1+0.047X2+0.238X3+0.421X4+0.511X5+0.733X6-0.059X7+0.320X8+0.064X9-0.199X10-0.437X11-0.066X12

F3=0.285X1+0.017X2+0.148X3-0.230X4+0.243X5-0.202X6+0.109X7+0.799X8+0.166X9+0.702X10+0.444X11-0.302X12

F4=0.042X1-0.221X2-0.208X3+0.062X4-0.276X5-0.019X6+0.047X7+0.104X8+0.879X9-0.284X10-0.272X11+0.680X12

F5=0.093X1+0.008X2+0.048X3+0.135X4+0.587X5-0.073X6+0.921X7+0.160X8+0.176X9+0.102X10-0.491X11-0.190X12

由上述主成分模型可得:第一主成分为城镇居民人均消费支出、城镇居民人均可支配收入、年末城镇人口比重,第二主成分为GDP广播节目综合人口覆盖率,第三主成分为生活垃圾无害化处理率、出生率,第四主成分为死亡率、失业率,第五主成分为建成绿化覆盖率、森林覆盖率。

文盲率对主成分的载荷较小,说明文盲率对居民幸福指数的影响没有直接的关系,可能还受其他因素的共同影响。第一主成分主要代表城镇居民的收支情况,第二主成分代表居民生活消费水平,第三主成分反映的是生活条件水平,第四主成分是逆指标,即降低居民幸福感的因素,第五主成分代表当地的绿化水平。再用R语言软件进行分析得出各主成分得分及其综合得分表,并按第一主成分从小到大的顺序进行排序(见下页表)。

结合主成分得分即综合得分表可知,综合得分较高的城市有北京、上海、浙江、广东、江苏,这些城市的第一主成分值较高,说明这些城市居民的收支情况和消费水平均较高且发展较快,居民在这些地方许多生活条件及物质所需都能得到大幅度的满足,所以当地居民幸福指数偏高;但这些地区的第五主成分值即当地的绿化水平偏低,可能是因为在这些地区城市建设发达且人口较多,没有较高的绿化和森林区域,综合考虑对当地居民的幸福指数影响不大。还有许多地区综合得分值相对居中,这些地区可能受地区的地理环境和经济发展的共同影响,两个因素相互制约,所以当地居民的幸福指数相对居中。然而青海、海南、西藏、这些风景优美的旅游胜地的主成分综合得分较低,可能与这些省市的家庭因素和人口密集度有关,这些地区的第五主成分即绿化水平较高,与这些地区是旅游景点有关。但正是由于当地旅游人口较多且人口种族混杂,影响当地居民的幸福感。

四、各个地区居民幸福指数的聚类分析

聚类分析是将样品或变量进行分类的多元统计分析方法。其功能是建立一种分类方法,将一批样品或变量,按照它们在性质上的亲疏、相似程度进行分类。按照分组的方法论不同可分为系统聚类法和k均值聚类,按照分析對象不同可分为R型聚类和Q型聚类。常用的方法有最长距离法、最短距离法、中间距离法、离差平方和法。

上述主成分分析已经确定5个主成分,在SPSS中利用因子分析画出碎石图(见图1)。碎石图在成分数为5时是拐点,可验证在聚类时聚成5类较为合适。然后用聚类分析将这31个省市的数据分为5类,本文利用R语言且采用离差平方和法进行聚类,结果(如下页图2所示)。

结合图2离差平方和法聚类可将31个省市分为5类。

第一类:北京、上海、浙江;第二类:天津、山西、内蒙古、吉林、黑龙江、江西、广西、新疆、甘肃、陕西、云南、贵州、重庆、、河北、辽宁、安徽;第三类:四川、福建、河南、湖北、湖南;第四类:广东、江苏、山东;第五类,西藏、海南、青海、宁夏。结合主成分得分即综合得分表可知,第一类地区居民的幸福指数最高,可能因为这些城市经济比较发达,第四类地区居民幸福感在其次,这些地区大多是沿海城市,温度及环境适宜使当地居民幸福指数增加,第二类地区居民幸福指数居中,这些地区地理位置比较靠北且各个主成分值也居中,第三类较低,第五类最低。由此说明,我国各省市之间幸福指数存在着一定的差距。

五、各个地区居民幸福指数提升的建议

1.提高低收入人群收入,提高居民幸福指数。俗话说:“民以食为天。”有些低收入人群可能连基本的生活必需品都负担不起,提高这部分人的收入是提升居民幸福指数的有效办法。他们的收入提高了才能使衣食住行有保障,使居民的物质需求得到满足,他们才会讲究精神层面的幸福指数,从而使社会整体的幸福指数提高。可以从增加社会福利和增加岗位两方面出发,政府部门要落实社会福利政策,尽可能地为他们提供岗位,让他们靠自己的双手去创造财富。这样才能是真正的幸福:有事做、有希望。

2.加强基础设施建设,改善民生。如今,经济全球化正在缩小着世界各国之间的时空距离,但是人们之间的实际距离即居民幸福指数却在不断地拉大。有些发达城市居民幸福指数越来越高,但有些城市居民幸福指数却在下滑或是停滞不前,若想提高总体的居民幸福指数,就必须加强不发达地区和发展中地区的基础设施建设,可以从铁路建设、环境设施、公园建设、绿化建设这几个方面着手。铁路建设可以方便居民的出行以及增加旅游的机会,从而提高幸福指数;增加环境设施可以改善空气质量,从而提高居民的舒适度和健康状况;公园设施和绿化设施可以使他们的生活更加惬意,进而提升居民的幸福指数。

3.加强食品安全管理,确保“舌尖上安全”。如今,人们生活条件越来越好,更多人不满足于平常的食物而去追求更多新奇美味的食物。但是他们很少注意食品安全,例如现在出现的疫情正是很好的反例,一个人追求野味,全国人在家陪他承受后果,全国停留在宅在家、不营业、不上班的状态,将全国人民的幸福指数大幅度拉低。所以在此呼吁大家一定要注意食品安全,一不留心可能会给他人甚至全国带来威胁。食品安全是提高幸福指数的保障,有关部门需要提高食品安全的标准,进一步完善相关法律法规,并努力提升公民文化素养,从而提高当地居民的幸福指数。

参考文献:

[1]  黎昕,赖扬恩,谭敏.国民幸福指标体系的构建[J].东南学术,2011,(5):66-75.

[2]  赵一纯.基于因子分析、聚类分析对我国居民幸福指数的研究——论国民幸福指数[J].中国商论,2016,(27):149-152.

[3]  魏芸菲,凌济民,陈烛蔷,王学军.基于主成分、聚类分析对我国各个地区幸福指数的研究[J].安庆师范学院学报:自然科学版,2013,(4):40-44.

[4]  徐锦,李芳.基于主成分分析和聚类分析的国民生活幸福指数综合评价[J].中国林业经济,2017,(4):84-88.

[5]  周绍杰,王洪川,苏杨.中国人如何能有更高水平的幸福指数——基于中国民生指数调查[J].管理世界,2015,(6):8-21.

[6]  何曉群.多元统计分析[M].北京:中国人民大学出版社,2019.

[7]  国家统计局.2019中国统计年鉴[K].北京:中国统计出版社,2019.

猜你喜欢
幸福指数聚类分析主成分分析
基于幸福指数的公路勘探设计研究
加强班级教育有效管理,激发学生追求幸福指数
主成分分析法在大学英语写作评价中的应用
农村居民家庭人均生活消费支出分析
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究