摘"要:通过分析我国31个省、市、自治区的2013—2022年的经济发展数据,可知我国经济整体向好,且各经济指标间存在相关关系。通过主成分分析,得到了三个主成分因子,分别是总量经济指标、繁荣经济指标、消费经济指标,得到了各地区的经济发展综合排名,江苏、山东、广东三个地区位列前三。通过聚类分析,将各地区分为六类,与主成分分析结果一致。文章总结了我国各个地区经济发展特征,可为地方经济发展提供参考和借鉴。
关键词:多元统计;经济发展;聚类分析;降维分析
中图分类号:F127;F062.6""文献标识码:A"文章编号:1005-6432(2024)22-0008-04
DOI:10.13939/j.cnki.zgsc.2024.22.002
1"引言
我国改革开放持续深入,经济体制相对完善,已成为世界第二大经济体,经济发展规律呈现出不同于以往的特征[1-5]。由于历史因素和地域特征,我国31个省、市、自治区经济发展规律呈现出明显差异[6-8]。掌握我国各地区经济发展规律,能为宏观政策制定和措施实施提供依据[9-10]。由于各地区经济发展受到多因素制约,如何厘清各地区经济发展主控因素,揭示各地区经济发展一般规律,是推动城市现代化建设的前提[8-9,11]。度量我国各省、市、自治区经济发展现状需建立合理评价体系,从不同角度描述各省、市、自治区的经济发展历程[12-13]。文章总结梳理了我国近十年统计年鉴基础数据,选定11个经济相关指标,结合统计分析、相关性分析、降维分析、聚类分析等多种方法,对我国各省、市、自治区经济规律进行多元分析,全方位多角度掌握我国各个地区经济发展特征,以期为全国以及各地区高速可持续发展提供具有参考价值的基础数据。
2"各省、市、自治区经济发展分析
2.1"经济指标体系构建和数据分析
笔者结合已公开的2013—2022年全国31个省、市、自治区经济数据,选定11个经济指标评价各地区发展状况,包括年末常住人口、GDP、财政收入、财政支出、第一产业产值、第二产业产值、第三产业产值、货物进出口总额、居民消费价格指数、商品零售价格指数、居民人均可支配收入。
从年末常住人口变化趋势来看,广东省自2013年以来出现逐年递增趋势,至2022年增长趋势趋于平缓,其各地区年末常住人口基本处于稳定状态,增减量很少。从GDP变化趋势来看,全国各地区都呈现出逐年递增的趋势,广东、江苏、山东、浙江四个地区增速较快,且GDP总量位于全国前列。西藏、海南、青海等地区GDP增速缓慢。从财政收入变化趋势来看,全国各地区都呈现出逐年递增的趋势,江苏、山东、河南等地区增速较快,总量位于全国前列。宁夏、西藏、海南、青海等地区财政收入增速缓慢。
从财政支出变化趋势来看,全国各地区都呈现出逐年递增的趋势,广东、江苏等地区增速较快,总量位于全国前列。宁夏、西藏、天津等地区财政收入增速缓慢。
从第一产业产值变化趋势来看,全国各地区都呈现出逐年递增的趋势,山东、四川、甘肃等地区增速较快,总量位于全国前列。宁夏、西藏、天津等地区财政收入增速缓慢。
从第二产业产值变化趋势来看,全国各地区都呈现出逐年递增的趋势,江苏、吉林等地区增速较快,总量位于全国前列。宁夏、西藏、海南等地区财政收入增速缓慢。
从第三产业产值变化趋势来看,全国各地区都呈现出逐年递增的趋势,江苏、广东等地区增速较快,总量位于全国前列。宁夏、西藏、海南等地区财政收入增速缓慢。
从货物进出口总额变化趋势来看,上海、江苏、广东等地区总量位于全国前列,广东货物进出口总额呈现逐年下降的趋势,其余各地区处于相对平稳的趋势。从居民消费价格指数、商品零售价格指数变化趋势来看,全国各地区变化不大,整体趋于稳定,受到疫情等因素的影响,2021年全国各地区消费价格指数下降明显,但在2022年得到一定程度的恢复。从居民人均可支配收入变化趋势来看,全国各地区都呈现出逐年递增的趋势,2021年受疫情影响,增速有所放缓,上海、北京等地区增速较快,总量位于全国前列。甘肃、西藏、贵州等地区财政收入增速缓慢,总量位于全国倒数。
2.2"经济指标体系构建和历史数据分析
采用皮尔逊相关系数表达各个经济因素相关性。年末常住人口与财政支出相关性最密切,系数达到0.91;与居民消费价格指数、居民人均可支配收入不相关。GDP与第二产业产值、第三产业产值、财政支出相关性最密切,这三项对GDP贡献度最大。
财政收入与第二产业产值相关性最强,系数达到0.62,第二产业各类就业人员和工业产品对地方财政收入影响最大。财政支出与年末常住人口、GDP、第二产业产值、第三产业产值成强正相关关系,财政支出受这四项指标影响强烈。
第一产业产值与年末常住人口正相关性最强,系数达到0.89,人口在第一产业中不可替代。第二产业产值与年末常住人口、GDP、财政支出、第三产业产值成强正相关关系,与GDP相关性最强,达到了0.98。第三产业产值与年末常住人口、GDP、财政支出、第二产业产值、货物进出口总额成强正相关关系,相关系数均在0.80以上。
货物进出口总额与GDP、第二产业产值、第三产业产值成强正相关关系。居民消费价格指数与商品零售价格指数成强烈正相关性关系,与其他因素相关性较弱。商品零售价格指数与居民消费价格指数成强烈正相关关系,与货物进出口总额成较强正相关关系,与其他指标成弱相关关系。居民人均可支配收入与第一产业产值成弱负相关关系,与第三产业产值和货物进出口总额成较强相关关系。
综上所述,针对选定的11个经济指标,各指标之间呈现出一定相关性,其中居民消费价格指数、商品零售价格指数、居民人均可支配收入这3个指标与其余8个指标相关性相对较弱,其余8个指标之间相关性较强。
3"主要成分分析
通过主成分分析降维,用少数的综合指标反映原始指标的主要信息,基于主成分分析结果计算得出各地区经济实力排名。表1给出了各主因子的特征根、方差贡献率和累计方差贡献率,由此可以看出,主因子PC1、PC2、PC3累计方差贡献率为89.884%,表明选出的三个主因子对原始信息解释较少,信息遗漏较少。表2给出了旋转后的因子矩阵,为了对各因子进行严格区分,将主成分因子载荷阈值设为0.65。由此可以看出,主成分因子PC1包括经济指标年末常住人口、GDP、财政收入、财政支出、第一产业产值、第二产业产值、第三产业产值,衡量了一个地区的宏观总体指标,命名为总量经济指标;主成分因子PC2包括经济指标货物进出口总额、居民人均可支配收入,衡量了一个地区的宏观总体指标,命名为繁荣经济指标;主成分因子PC3包括经济指标居民消费价格指数、商品零售价格指数,衡量了一个地区的居民消费情况,命名为消费经济指标。
通过旋转后的因子矩阵和因子特征值贡献率表,得到三个主成分的因子方程如式(1)至式(3)。计算各地区主成分因子得分,再计算各主成分因子方差贡献率占三个因子总方差贡献率的比值为权重,通过主成分因子和权重计算各地方经济综合得分,各地区因子得分和综合得分见图1至图4。由此可以看出,总量经济指标PC1得分靠前的省、市、自治区有江苏、山东、广东,靠后的省、市、自治区有宁夏、西藏、青海;繁荣经济指标PC2得分靠前的省、市、自治区有江苏、山东、广东,靠后的省、市、自治区有宁夏、甘肃、贵州;消费经济指标PC3得分靠前的省、市、自治区有江苏、上海、广东,靠后的省、市、自治区有内蒙古、新疆、贵州。由各地区的地方经济综合得分靠前的省、市、自治区有:江苏、山东、广东,靠后的省、市、自治区有:宁夏、西藏、甘肃。由此可以看出,江苏、山东、广东在总量经济指标得分、消费经济指标得分、繁荣经济指标得分上面均排在前三,这是因为江苏、山东、广东人口基数大,工业体系相对发达。上海在消费经济指标PC3得分仅仅排在江苏、广东之后,上海作为现代化大都市,金融贸易体系完善,其消费水平处于全国前列。综上所述,降维方式得到各地区主成分因子得分和综合得分是符合经济一般统计规律的。
4"聚类分析
根据11个经济指标将相似度大的划分为一类。采用Ward法进行聚类,平方欧式距离计算如式(4)、式(5)。从聚类树形图图5可以看出,31个省、市、自治区划分为6类较合适,第一类省、市、自治区有河北、湖南、四川、安徽、湖北、福建、辽宁、陕西、云南、江西、广西;第二类省、市、自治区有黑龙江、贵州、甘肃、新疆、山西、重庆、内蒙古;第三类省、市、自治区有北京、上海;第四类省、市、自治区有海南、西藏、青海、吉林、宁夏、天津;第五类省、市、自治区有江苏、广东;第六类省、市、自治区有山东、河南、浙江。由此可知,聚类分析和降维分析得到的各地区经济综合得分排名存在一定差异和相似性,由于聚类分析将31个省、市、自治区分为6类,降维分析得到主成分为3个(PC1、PC2、PC3),两者算法导致了差异。两者也存在共性,如:聚类分析将江苏、广东分为了一类,同时进一步聚类发现,江苏、广东、山东、浙江、河南可分为一类,这与各省、市、自治区经济发展情况综合得分前5名的省、市、自治区完全一致,可知主成分分析和聚类分析两者相互验证,求得的计算结果是合理的。
5"结论
我国各地区经济发展状况良好,整体呈现逐年上涨的趋势,个别年份出现波动,如2020年受新冠肺炎疫情的影响。通过相关性分析可知,选定的11个经济指标之间呈现出一定相关性,其中居民消费价格指数、商品零售价格指数、居民人均可支配收入这3个指标与其余8个指标相关性相对较弱。通过主成分分析,给出了总量经济指标、繁荣经济指标、消费经济指标三个主成分因子,得到了各地区的经济发展综合排名,江苏、山东、广东三个地区排名前三。通过聚类分析,将各地区分为6类,与主成分分析结果一致。
参考文献:
[1]佚名.2016年国民经济和社会发展统计公报发布[J].职业技术教育,2017,38(12):"9.
[2]张美慧.国际新经济测度研究进展及对中国的借鉴[J].经济学家,2017(11):"47-55.
[3]纪宏,张宝学,任韬,等.建设新经济统计,赋能数字经济,助力智能时代——关于开展新经济统计研究与实践的思考[J].数理统计与管理,2020,39(5):"788-793.
[4]沈智扬,邵安琪,陈雪丽.中国区域绿色经济增长与资源错配[J].北京理工大学学报(社会科学版),2023,25(1):"43-54.
[5]王千.中国经济高质量发展的统计测评体系建构理路——基于全象资金流量观测系统的视角[J].河南师范大学学报(哲学社会科学版),2020,47(1):"79-86.
[6]张寒明.关于宏观经济统计指标体系的探讨[J].统计与决策,2016(17):"35-37.
[7]李敬,覃乔亦,刘洋.入世以来中国国民经济外循环格局变迁及其应对策略——基于供需结构、全球价值链、国际网络关系的三维视角[J].中国软科学,2023(3):"16-31.
[8]乔慧.关于我国31个省市自治区经济发展的多元统计分析[J].科技情报开发与经济,2011,21(1):"160-162,173.
[9]林师武.全国31个省市经济发展多元统计分析[J].经济研究导刊,2016(5):"5-10.
[10]曾冰.中国省域经济韧性发展水平评价[J].大连理工大学学报(社会科学版),2023,44(2):"28-36.
[11]李雪梅,张素琴.主成分分析在区域经济分析中的应用[J].计算机工程与应用,2009,45(19):204-206,238.
[12]王彦明,戴燕.成本效益分析法在我国地方经济立法中的适用及改进[J].学术论坛,2019,42(6):86-94.
[13]李娜,刘文敏,孟繁瑞,等.电信大数据分析下的时空区域经济可视化应用[J].北京航空航天大学学报,2022,48(2):273-281.