彭妍 周丽
摘要:本文旨在综合评价我国各省市的农业经济发展水平,通过对2016年的数据进行预处理,从农业生产条件、农业产出能力、农民生活水平、农业科技投入四个方面共选取12个指标进行主成分分析和聚类分析。结果表明:我国农业经济发展水平具有从东部平原等沿海地区向西部高原等内陆地区递减的规律。
关键词:农业经济发展主成分分析聚类分析
一、引言
长期以来,我国一直保持较快增长,但在经济社会的发展过程中出现了“三农”问题和较为严重的城乡差距。农业作为人类社会发展的基础,生态农业一直是党和政府高度重视的议题,中国虽是农业强国,但随着人口基数不断扩大、各个区域的地理位置以及有关经济发展的基础建设力度存在差异,各区域的农业经济发展也存在一定的差距,个别地区的农业经济还需大力发展。国内众多学者对农业经济发展问题进行了大量卓有成效的理论与实证研究。汪慧玲对西部地区各省市的农业经济发展水平进行综合评价和排名,将西部的十二省市按照农业经济实力分为四个层次[1];邢彩萍的研究发现:由于各区域不同的自然和经济因素,甘肃省县域农业经济水平整体显现“西高东低,北高南低”的特征[2]。吕阳对湖北省各地市综合农业经济水平做出分析,湖北地区的结果差异显著[3],本文扩大研究范围,运用主成分分析法和聚类分析法,旨在综合评价我国各省市的农业经济发展水平。
二、实证研究及结果
(一)变量说明
为分析我国各省市农业经济发展差异水平,基于2016年中国统计年鉴中的数据,根据研究区综合地域系统特征,从农业生产条件、农业产出能力、农民生活水平、农业科技投入这四个大方面[4],选取能够代表我国 31个省市农业经济发展状况的12个指标变量进行主成分分析以及聚类分析。具体指标如表1:表1具体指标
一级指标二级指标单位农业生产条件单位面积农业机械总动力X1千瓦/公顷单位面积耕地面积施肥量X2吨/公顷有效灌溉率X3%农业产出能力劳均农业增加值X4元/人人均粮食占有量X5千克/人人均肉类占有量X6千克/人土地生产率X7元/公顷农民生活水平农村居民人均可支配收入X8元农村居民消费水平X9元城镇化率X10%人均用电量X11千瓦时/人农业科技投入农业牧渔占比重X12%(二)数据处理与分析
观察到指标之间度量单位不同、取值差异非常大,为了消除量纲的影响,首先对原始数据进行标准化处理:
zxij=xij-xjSJ
式中:zxij为标准化数据; xj 为变量 j 的均值; Sj 为变量 j 的标准差
考虑到主成分分析方法适用于变量之间存在较强相关性的数据,如果原始数据相关性较弱,运用主成分分析不能很好地起到简化和降维的目的,因此对标准化后X1,X2,…,X12进行KMO和Bartlett球形检验,结果为:KMO=0601(>06),Bartlett球度检验p值为0000(<005),因此,认为本文选取的12个评价指标之间存在较多的共同因素,适合做主成分分析。
(三)模型构建
主成分分析法[5]的基本思想是在保留原始变量尽可能多的信息的前提下,将多个复杂指标综X合成少数几个互不相关的综合变量(主成分Y),使得主成分的方差尽可能的接近原始变量的总方差,基于此,建立如下模型:
Yj=β1jX1+β2jX2++βpjXp,j=1,2,,m
式中,β为相关阵的特征根对应的标准化特征向量。
(四)模型求解
主成分分析法可以由原始数据的协方差矩阵或者由原始数据的相关阵出发,由前文分析可知,本文使用的原始数据度量单位差异较大,因此采用由相关阵出发的方法计算矩阵的特征值。使用SPSS软件,选择特征值大于1的提取方法,结果如表2:
主成分Y1、Y2、Y3分别从不同的角度衡量了农业经济发展水平,但是单独从其中一个角度不足以評价整个地区的农业经济发展水平,鉴于此,为权衡各个方面做出最终的综合分析,本文以每一个主成分的方差贡献率作为权数Wi,建立一个综合评价模型:
Z=w1Y1+w2Y2+w3Y3
根据综合评价模型计算各个省市的综合得分,得到排序图1:
聚类分析主要方法有系统聚类法、K-均值分类法等,本文基于K-均值分类法分析全国农业经济发展水平,该方法的基本思想是:起始聚类时共有k个初始质心,将每一个样本依次判别到与其最近的质心,且每判别一个样本需要重新计算总体的质心,直到没有样本剩余。运用SPSS软件,输入聚类数为3,将我国省市农业经济发展水平聚为三类,得到结果表4:三、结论及原因
聚类分析的结果大致和主成分分析结果一致,结合两种方法,最终将我国各个省市的农业经济发展水平依据12个指标分为三个等级,见表5:表5综合分类结果
等级省市名称较高发展水平上海市、江苏省、北京市、浙江省、天津市中等发展水平黑龙江省、吉林省、山东省、辽宁省、内蒙古自治区、广东省、福建省、湖北省较低发展水平新疆维吾尔自治区、重庆市、宁夏回族自治区、湖南省、安徽省、河北省、河南省、江西省、海南省、四川省、陕西省、山西省、广西壮族自治区、云南省、甘肃省、贵州省、青海省从主成分分析和聚类分析的综合分类结果来看,我国农业经济发展水平具有从东部平原等沿海地区向西部高原等内陆地区方向递减的规律;基于主成分分析方法的具体结论为:江浙沪地区发展水平遥遥领先于其余地区,而云贵高原、青藏高原等高原内陆地区发展较为落后。主要原因如下。
1地理环境的制约 。我国地形复杂,地势东低西高,在我国东部主要以平原为主,土壤肥沃,降水充足,交通便利,同时东部地区的水土资源优越,城市生活水平较高。然而在我国西部,降水较少,交通不畅,常年受风沙影响,水土资源较为匮乏,农业得不到规模性的发展,东西两地的地理环境的差异导致了我国东部省市农业经济发展较快,西部省市发展缓慢。
2国家经济发展重心偏向沿海地区 。在我国东南部沿海地区,拥有着优越的地势条件,吸引了较多国内外的投资者,基于此,国家将经济发展的重心放在了东部及东南部的沿海沿江城市,有效的推动了我国经济的发展。然而在我国其他地区,国家没有引起足够的重视,以至于我国经济出现的严重的不平衡,东部省市发展迅速,西部省市发展缓慢,从而制约着我国农业经济的整体发展水平。
3教育水平的差距 。在我国西部地区,大多都是山区,离市中心地区较远,人口少且人口流动性较大,使得西部地区的教育事业受到了很大的阻碍,其次,西部地区的人均收入低,西部地区的发展缺乏人才。而在我国东部地区,经济发达,教育投资大,拥有丰富的教学资源,为东部地区经济的发展培养了大量的人才,因此加剧了我国东部省市和西部省市之间的差距。
参考文献:
[1]汪慧玲,刘淑萍基于主成分分析的西部地区农业经济发展水平研究[J].天津商业大学学报,2012,32(05):56—61
[2]邢彩萍,吴春荣甘肃省农业经济发展水平综合评价[J].中国农学通报,2014,30(11):78—82
[3]吕阳,李成标基于DEA模型的湖北省农业经济效率评价研究[J].湖北农业科学,2015,54(19):4882—4887
[4]吴钢,王涌翔,付晓,孙晓伟,刘建民,于德永区域农业经济发展的能值分析[J].生态学杂志,2008(04):607—614
[5]林海明,杜子芳主成分分析综合评价应该注意的问题[J].统计研究,2013,30(08):25—31
[6]陈艳基于主成分分析的江西低碳经济发展评价分析[J].南昌大学学报(人文社会科学版),2012,43(06):63—68,90