基于多元统计的我国地区经济发展水平比较分析

2021-04-26 06:05职文爽河南大学欧亚国际学院
营销界 2021年16期
关键词:变量样品水平

职文爽(河南大学欧亚国际学院)

引言

当前我国处于经济发展快速时期,但是地区经济发展水平不平衡的问题日渐突出,是我国经济发展的一个焦点问题。对各个地区经济水平进行研究,能够宏观把握好地区的经济状况,帮助正确采取措施减小地区经济发展失衡的问题,促进我国经济发展。

数学原理及思想

(一)聚类分析

聚类分析是根据研究对象的特征,对研究对象进行分类的方法,以减少研究对象的数目。它把相似度较大的样品聚合为一类,把另外一些彼此之间相似度较大的样品聚合为另一类,直到将所有样品聚合完毕为止。通常用距离来度量样品之间的相似程度。一般地,用表示样品与之间的距离,常用的距离有欧氏距离和马氏距离。

最短距离法:类与类之间的距离定义为两类中相距最近的样品之间的距离,即类和之间的距离定义为:

(二)主成分分析

主成分分析是一种将多个指标化为少数几个综合指标的统计分析方法。它利用降维的思想,将相关的指标化为不相关的指标,以较少的变量代替原来较多的变量,减少计算量的同时避免了信息重复,简化了问题。

主成分个数的选取原则:若使累积贡献率达到80%以上的主成分个数为x,则选取前x 个主成分比较合适。

数据分析

(一)聚类分析

用R 软件进行系统聚类,采用最短距离法,如图1 所示:

图1 系统聚类法

(1)上述聚类谱系图给出了2019 年我国31 个省市自治区的经济发展状况作为样品聚类分为三类时的各样品所属类别。观察谱系图,我们看出,第一类包括2 个样品(包含:北京市、上海市)。由地区分布情况和经济状况知,第一类所包含的地区主要位于我国经济发达、资源丰富、交通便利的位置。

图2 主成分的累积方差贡献率及因子载荷

(2)第二类包括27 个样品(包含:天津市、河北省、山西省、辽宁省、吉林省、黑龙江、浙江省、安徽省、福建省、江西省、山东省、河南省、湖北省、湖南省、广西壮族自治区、海南省、重庆市、四川省、贵州省、云南省、西藏自治区、陕西省、甘肃省、青海省、内蒙古自治区、宁夏回族自治区、新疆维吾尔自治区)。根据地区分布情况,第二类包含的省、市、自治区相对于第一类来说资源较少、人才较为缺乏、经济水平较低。

(3)第三类包括2 个样品(包含:江苏省、广东省)。根据所学的地理及经济学知识,第三类所包含的地区主要分布于我国东南沿海和临海的华中地区。这些地区经济水平较高,教育资源丰富,并且工业高度发达,有中国尖端技术亦有国外先进管理文化渗入,具有得天独厚的地理优势和发展前景。但同时这也使得我国不同地区的资源和发展不平衡的问题更加突出,加大国内地区贫富差距。

(二)主成分分析

由于主成分分析要求变量之间要有显著的相关性,即变量之间存在多重共线性,且变量的数目比较多,故先用软件计算变量之间的相关系数。可以得到,有绝大多数变量间的相关系数都大于0.3,甚至有的达到了0.98,因此使用这些数据做主成分分析是合适的。

用R 软件输出主成分的累积方差贡献率及因子载荷如图2所示:

由图2 可以看出,主成分1(Comp.1)的累积方差贡献率为75%,说明主成分1 包含原始变量75%的信息,主成分1 至主成分2 的累积方差贡献率为99.6%,说明这两个主成分包含了原始变量99.6%的信息。根据主成分个数的选取原则,使累积方差贡献率达到80%以上的主成分个数都是比较合适的,因此选取前两个主成分。

图2 Loadings 显示的因子载荷表明,主成分1 主要由人均生产总值这个指标来反映。由于主成分1 已有75%的把握评价各地区的经济发展水平,所以该项指标可视为主要指标。而主成分2 则主要从地区生产总值这个指标来反映经济发展水平,并且用这2 个主成分来考核不同地区经济发展水平具有99.6%的可靠性,具有较优的代表性。

用SPSS 软件进行主成分分析,如图3、图4 所示。

图3 为成分矩阵,给出了标准化原始变量用求得的主成分线性表示的近似表达式,分别用,表示各个主成分,则标准化的地区生产总值等于0.801+0.599,其他可以此类推。

图4 为成分得分系数矩阵,可以写出主成分用标准化后的原始变量表 示的表达式。用X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X11分别表示地区生产总值、农林牧渔业、工业、建筑业、批发和零售业、交通运输业、住宿和餐饮业、金融业、房地产业、其他、人均生产总值,则表达式为:

为了根据不同的经济水平实现对各省份的划分,我们可以用样本主成分得分进行排序。构造综合评价函数,由于第一主成分系数全为正,且第一主成分与原变量综合相关度最强,包含数据量信息最多,因此用第一主成分进行排序可计算出各省市自治区的经济发展水平,用R 软件的predict 函数运算并依据第一主成分得分进行排序,得出排名如下:

江苏、北京、上海、广东、浙江、福建、山东、湖北、天津、河南、重庆、四川、湖南、安徽、陕西、内蒙古、辽宁、河北、江西、云南、新疆、海南、贵州、广西、山西、宁夏、吉林、青海、西藏、黑龙江、甘肃。

其中,根据名次和得分,大体上地区可以分为三类:

图3 成分矩阵

图4 成分得分系数矩阵

第一类:江苏、北京、上海、广东、浙江、福建;

第二类:山东、湖北、天津、河南、重庆、四川、湖南、安徽、陕西、内蒙古、辽宁、河北、江西、云南、新疆、海南、贵州;

第三类:广西、山西、宁夏、吉林、青海、西藏、黑龙江、甘肃。

由于主成分是根据地区经济发展水平进行分类的,可以看出,我国2019 年经济发展水平总体上属于待发展状态。从各省份自治区经济发展水平总得分及排名情况可以看出,排名位于第一类的是经济发达地区,这些地区拥有得天独厚的地理环境优势,区域经济发达,经济水平位于各地区平均水平之上;第二类是经济较发达地区,经济水平在各地区平均水平左右,这类地区数目较多,反映了我国的总体情况;第三类是经济不发达地区,由于气候、地理位置、资源等因素,其经济水平在各地区平均水平之下。

结论

本文通过应用聚类分析和主成分分析两种多元统计方法,对2019 年我国31 个省市自治区的影响地区经济发展的11 项指标进行深入分析,得出以下结论:

(1)我国地区经济东西部发展不均衡现象尤为突出,我国南方地理位置优越、资源丰富,尤其是东南沿海地区,不仅具有地理环境优势,而且位于我国与外界发达地区的交通要塞,同时也是顶尖人才的汇集地。这些优势都使得我国东南沿海地区经济发展迅猛,始终处于我国经济发展前列。因此,在今后的经济发展中,国家应该对于我国欠发达的中西部地区和少数中部地区加大投入力度,增加财政支持和政策倾向,尽快通过提高这些地区的经济发展水平,减轻国内经济发展不平衡问题的程度。

(2)通过以上分析可知,房地产业与工业的发展与地区生产总值关系最为密切。为使地区经济发展,应大力发展地区房地产业和工业。然而我们不能只追求眼前的经济发展而牺牲未来的发展,我们应该在尊重自然发展客观规律的基础上,大力发展工业和房地产业,同时加强对环境的保护,从而促进我国可持续发展。

猜你喜欢
变量样品水平
张水平作品
粮油检测实验室样品管理浅析*
抓住不变量解题
完善样品管理制度确保农产品抽检结果的准确性
作家葛水平
加强上下联动 提升人大履职水平
实验室样品管理
质检机构样品管理的重要性
分离变量法:常见的通性通法
不可忽视变量的离散与连续