孙习文齐清文张岸姜莉莉
(1.山东科技大学测绘科学与工程学院青岛266590)(2.中国科学院地理科学与资源研究所北京100101)
基于系统聚类和GIS技术的农机拥有量区域差异分析
孙习文1齐清文2张岸2姜莉莉2
(1.山东科技大学测绘科学与工程学院青岛266590)(2.中国科学院地理科学与资源研究所北京100101)
论文选用2007年和2013年我国31个省份(港澳台除外)的单位耕地面积大中型拖拉机、小型拖拉机、大中型拖拉机配套农具、小型拖拉机配套农具、农用排灌机械、联合收割机和机动脱粒机的数量共8个指标,通过系统聚类分析,结合GIS的可视化技术,对我国的农机拥有量进行区域划分,并对分类结果进行差异性分析,从而为各省的农机科学发展提供相应的建议,促进我国农业现代化的实现。
系统聚类;GIS技术;农业机械拥有量;区域差异
Class NumberX821
近年来,我国农业机械装备水平处于高速发展的阶段,作为农业领域先进科技的载体和农机化发展水平的体现,农业机械具有提高生产率、增加农民收入和保护环境等作用[1]。
目前,国外对农业机械装备水平的研究较为成熟,在农业机械装备水平的特征、趋势及影响因素方面的研究较多,国内已有研究主要集中在农业机械化领域,从区域差异性出发研究农业机械拥有量的文章不多。
本文将利用系统聚类的分析方法,结合GIS技术,对我国31个省份单位耕地面积的农业机械拥有量进行分类研究,并对分类结果进行研究,对我国农业机械的区域差异性进行分析。为促进各省及全国农业机械的科学快速发展,实现农业现代化,提供因地制宜的措施和发展建议。
各省之间的农业机械拥有量有不同的发展趋势,也有规律性的特征,可以应用系统聚类分析方法对反映农业机械水平的数据进行聚类分析,划分出水平相似性较高的地区,从而深入探究区域内部和区域之间的规律性特征。
2.1 系统聚类的基本思想
系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。系统聚类过程是:假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合成一类,其他的样品(或变量)仍各自聚为一类,共聚成n-1类;第三步将“距离”最近的两个类进一步聚成一类,共聚成n-2类;……以上步骤一直进行下去,最后将所有的样品(或变量)聚成一类。为了直观地反映以上的系统聚类过程,可以把整个分类系统地画成一张谱系图。所以,系统聚类也称为谱系分析[2]。
2.2 离差平方和法
在进行系统聚类之前,我们首先要定义类与类之间的距离,由类间距离定义的不同产生了不同的系统聚类法。常用的类间距离定义有8种之多,与之相应的系统聚类法也有8种,分别为最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法。在实际应用中,离差平方和分类效果较好,分类效果也比较好[3]。以下用dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。
离差平方和法是Ward提出来的,所以又称为Ward法。该方法的基本思想来自于方差分析,如果分类正确,同类样品的离差平方和应该较小,类与类的离差平方和较大。具体做法是先将n个样品各自成一类,然后每次缩小一类,每缩小一类,离差平方和就要增大,选择使方差增加最小的两类合并,直到所有的样品归为一类为止。
设将n个样品分成k类G1,G2,…,Gt,用Xit表示Gt中的第i个样品,nt表示Gt中样品的个数,
如果Gp和Gq合并为新类Gr,类内离差平方和分别为Xˉ是Gt的重心,则Gt的样品离差平方和为
它们反映了各自类内样品的分散程度,如果Gp和Gq这两类相距较近,则合并后所增加的离散平方和Sr-Sp-Sq应较小;否则,应较大。于是定义Gp和Gq之间的平方距离为
其中,Gr=Gp∪Gq,可以证明类间距离的递推公式为
这种系统聚类法称为离差平方和法或Ward方法[2]。
3.1 指标选择与数据说明
单位耕地面积的农业机械拥有量可以比农业机械总量这类指标更深入地解释农业机械装备的应用程度。因此,综合考虑数据的完整性、可获得性与可靠性,本文选用《中国统计年鉴》2007年和2013年31个省份(港澳台除外)的大中型拖拉机数量、小型拖拉机数量、大中型拖拉机配套农具数量、小型拖拉机配套农具数量、排灌柴油机数量、排灌电动机数量、联合收割机数量、机动脱粒机数量等8个指标[4]。结合各地区耕地面积,计算得到各个指标的单位耕地面积农业机械拥有量。
由于这8个指标的数量级不一致,必须在聚类分析前对各指标数据进行处理[5]。为了消除不同数据量纲之间的差异性对聚类分析结果的影响,本文采用排序的方法,对31个省份的每项指标进行排序,最终对排序结果(如表1、表2所示)进行聚类分析。
表12007 年全国农业机械数量排序结果
3.2 SPSS系统聚类
本文使用SPSS软件(IBM SPSS Statistics 22)对数据进行聚类分析。两类之间的距离选择欧几里德平方距离方法,聚类方法采用离差平方和法。
通过树系图来直观表示分析结果,树系图可以直观地显示出聚类的整个过程,方便地了解分类结果。横坐标表示各类之间的相对距离大小,纵坐标代表进行聚类的31个省份,连接线条表示聚类的合并过程[6]。
全国农业机械拥有量聚类树系图如图1、图2所示:
将全国31个省份(港澳台除外)按照7类进行划分,聚类结果如表3所示。
图12007 年聚类树系图
表22013 年全国农业机械数量排序结果
图22013 年聚类树系图
表3 全国农业机械拥有量分类结果
3.3 GIS可视化
按照划分为7类的方案与具有可视化表达和空间分析功能的GIS软件相结合,制作相应的专题地图。这种方法克服了分类结果无法直观表达的不足,实现了农业机械拥有量区域划分的可视化表达,有利于空间分布规律的分析研究[7]。
我国农业机械拥有量的区域聚类图如图3、图4所示。
图32007 年区域聚类图
图42013 年区域聚类图
4.12007 年分类结果
第一类属于农机全面发展区域,其主要特征是小型拖拉机及其配套较多,联合收割机数量较多,省份有:河南省、安徽省、河北省、山东省、江苏省;
第二类属于农机均衡发展区域,其主要特征是小型拖拉机及其配套较少,机动脱粒机也比较少,省份有:北京市、天津市;
第三类也属于农机均衡发展区域,但整体水平低于第二类;其主要特征是小型拖拉机及其配套农具较少,省份包括:陕西省、海南省、辽宁省、上海市;
第四类属于拖拉机及其配套农具主导区,其主要特征是以大中型拖拉机及其配套农具为主,小型拖拉机及其配套农具为辅,主要省份包括:新疆维吾尔自治区、黑龙江省、内蒙古自治区、吉林省、宁夏回族自治区、湖北省;
第五类也属于拖拉机及其配套农具主导区,但其主要特征是农用排灌机械数量很少,属于非排灌区,主要省份有:山西省、甘肃省、青海省、西藏自治区;
第六类属于农机发展较弱的区域,只有农用排灌机械、机动脱粒机数量较多,其他机械数量都很少,主要省份包括:贵州省、云南省、四川省、重庆市;
第七类属于其他机械作业区,其主要特征是农用排灌、机动脱粒机和联合收割机数量较多,主要省份包括:江西省、浙江省、湖南省、广西壮族自治区、广东省、福建省。
4.22013 年分类结果
第一类属于农机全面发展区域,其主要特征是小型拖拉机及其配套农具和联合收割机为主,只有机动脱粒机数量相对较少,省份有:安徽省、河南省、河北省、山东省、江苏省、湖北省;
第二类属于大型农业机械作业区,其主要特征是大中型拖拉机及其配套农具、农用排灌机械和联合收割机数量较多,省份有:北京市、天津市、上海市、辽宁省、海南省、云南省;
第三类属于大中型拖拉机及其配套农具主导区,其大中型拖拉机及其配套农具数量尤为突出,省份包括:新疆维吾尔自治区、内蒙古自治区、黑龙江省;
第四类属于拖拉机及其配套农具主导区,其主要特征是以小型拖拉机及其配套农具为主,大中型拖拉机及其配套农具为辅,其他机械数量较少;但吉林省是大中小型拖拉机及其配套农具均衡发展,主要省份包括:甘肃省、青海省、宁夏回族自治区、山西省、吉林省;
第五类非排灌区,单位耕地面积上农业机械数量排名处于全国前列,只有农用排灌机械数量很少,省份只有:西藏自治区;
第六类属于农机发展较弱的区域,只有农用排灌机械、机动脱粒机数量较多,其他机械数量都很少,主要省份包括:贵州省、四川省、重庆市;
第七类属于其他机械作业区,其主要特征是农用排灌、机动脱粒机和联合收割机数量较多,主要省份包括:湖南省、浙江省、广东省、广西壮族自治区、江西省、福建省、陕西省。
4.3 分类结果对比
对比这两年的分类结果,只有陕西、湖北、宁夏、吉林、西藏、云南的分类结果出现了变化,深入分析发现,虽然这六个省份单位耕地面积的农业机械数量在稳步增加,但是由于其他省份的变化幅度较大,导致其排名出现了明显的下降或增长。陕西省由于在大中型拖拉机及其配套农具排名上的下降和机动脱粒机排名的显著增加,使其从均衡发展区域划分到其他机械作业区;湖北省由于大中型拖拉机及其配套农具排名的显著下降和联合收割机的排名上升,从拖拉机及其配套农具主导区划分到全面发展区;近年来政府不断加强对西部地区农业机械的投资和补贴,西藏自治区的农业机械数量和排名显著增加,因其单位耕地面积的排灌机械数量明显低于其他各省,故将其单独划分为非排灌区;而云南省因其大中型拖拉机数量的快速增长,而划分为大型农业机械作业区,但是其农用排灌机械和联合收割机数量仍然很少。
同时可以发现,各类农业机械均衡发展的省份越来越少,同一省份的各类农业机械数量的差距越来越大。这也证明,随着农业问题的深入研究和农业领域的科技进步,近年来各个省份都在根据其自身的经济水平、自然环境和科技力量等因素,逐步确定主推农业机械,完善产业结构和发展方向,在科学实现现代化的道路上前进了一大步。
农机全面发展区域的山东、河南、河北、安徽等省份拥有悠久的农业发展历史,自然条件较好,经济科技水平高,政府对农业机械的投资和补贴也在不断加强,拥有适合发展农业机械优良的多方面条件。而大中型拖拉机及其配套农具主导区的新疆、内蒙古和黑龙江各个省份,地广人稀,适合大型农机作业,而且人均耕地面积也大,农业机械弥补了农村劳动力短缺的不足,因此促进了大型农业机械的发展[8]。北京、上海、天津等地区,虽然农业机械规模是全国较小的地区,但是凭借发达的科技和雄厚的经济实力,农业机械装备实力不断加强。南方大部分地区丘陵山地面积比例明显高于全国平均的水平,不利于农机作业;从种植结构来看,水稻种植区的农机水平要比小麦种植地区的农机水平低[9],因此,南方地区农机发展普遍低于东部地区。贵州、四川和重庆等地区地形比较复杂,包括高原、山地、盆地、沙漠、丘陵等,严重影响了农业机械化的应用,因此这些地区农机发展较弱。
因此,全面发展地区要积极推动农业改革,探索农业发展的新模式,以科学技术和经济实力为依托,争取率先基本实现农业现代化。针对欠发达地区,政府部门要进一步加强科技投入,研发小型和轻便型的农业机械,保证丘陵地区因地制宜地提高农业机械化水平;学习国外土地改良的先进经验,对土地进行标准化和规格化,加强农业综合开发[10];同时,完善和落实对农业装备的扶持政策,促进农业装备的推广与应用。
[1]李惠洁.关于农业机械的作用和发展[J].知识经济,2010(15):65-65.
LI Huijie.The Function and Development of Agricultural Machinery[J].Knowledge Economy,2010(15):65-65.
[2]朱建平.应用多元统计分析[M].北京:科学出版社,2016.
ZHU Jianping.Multivariate Statistical Analysis[M].Beijing:The Science Publishing Company,2016.
[3]胡雷芳.五种常用系统聚类分析方法及其比较[J].统计科学与实践,2007(4):11-13.
HU Leifang.Five Commonly Used Hierarchical Clustering Analysis Methods and Their Comparison[J].Statistical Science and Practice,2007(4):11-13.
[4]中华人民共和国.中国统计年鉴2014[M].北京:中国统计出版社,2014.
People's Republic of China.China Statistical Yearbook 2014[M].Beijing:China Statistics Press,2014.
[5]李卫.区域格局划分与农业机械化发展不平衡定量研究[D].杨凌:西北农林科技大学,2015.
LI Wei.Research on Regional Landscape Division and Imbalance of Agricultural Mechanization Development in China[D].Yangling:Northwest A&F University,2015.
[6]李志辉,罗平.SPSS常用统计分析教程.第4版[M].北京:电子工业出版社,2015.249-255.
LI Zhihui,LUO Ping.SPSS Common Statistical Analysis. the 4th edition[M].Beijing:Publishing House of Electronics Industry,2015.249-255.
[7]郑文钟,何勇.基于GIS的浙江省农业机械化发展水平的地区比较[J].浙江大学学报农业与生命科学版,2004,30(6):668-672.
ZHENG Wenzhong,HE Yong.Study on Regional Rontrast in Development of Agricultural Mechanization in Zhejiang Province Based on GIS[J].Journal of Zhejiang University(Agric.&Life Sci.),2004,30(6):668-672.
[8]颜廷武,王瑞雪.我国现代农业装备发展的地区差异及其优化——基于省际和区域层面的比较[J].中国海洋大学学报(社会科学版),2011(4):42-46.
YAN Tingwu,WANG Ruixue.Regional Differences of China's Modern Agricultural Equipment Development and Its Improvement—Based on Comparison of Different Provinces and Regions[J].Journal of Ocean University of China(Social Sciences Edition),2011(4):42-46.
[9]刘玉梅,田志宏,姜雪琴.我国农业装备水平区域性特征及其影响因素研究[J].中国农业大学学报社会科学版,2005(4):54-57.
LIU Yumei,TIAN Zhihong,JIANG Xueqin.Study on the Characteristic and Determinations of Agricultural Equipment in China[J].Journal of China Agricultural University(Social Sciences Edition),2005(4):54-57.
[10]易中懿,曹光乔,张宗毅.我国南方丘陵山区农业机械化宏观影响因素分析[J].农机化研究,2010,32(8):229-233.
YI Zhongyi,CAO Guangqiao,ZHANG Zongyi.The Analysis on Macro-affected Factors for Agricultural Mechanization in Chinese Southern Mountain and Hill Areas[J]. Journal of Agricultural Mechanization Research,2010,32(8):229-233.
Analysis on Regional Difference of Agricultural Machinery Possession Based on Hierarchical Clustering and GIS
SUN Xiwen1QI Qingwen2ZHANG An2JIANG Lili2
(1.College of Geomatics,Shandong University of Science and Technology,Qingdao266590)(2.Institute of Geographical Sciences and Natural Resources Research,Chinese Academy of Sciences,Beijing100101)
In this paper,eight factors of 31 provinces of China in 2007 and 2013 are selected,including the number of large and medium-sized tractors,small tractors,large and medium-sized tractor tools,small tractor tools,agricultural irrigation machinery,combine harvester and motorized threshing machine per unit cultivated land area.By hierarchical cluster analysis,combined with GIS visualization technology,the regional division of the China agricultural machinery possession and the difference analysis of the classification results are made,so as to provide some suggestions for the development of agricultural science,and promote the realization of agricultural modernization in China.
hierarchical clustering,GIS,agricultural machinery possession,regional difference
X821
10.3969/j.issn.1672-9722.2017.06.018
2016年12月20日,
2017年1月23日
国家自然科学基金项目“城市PM2.5的人群暴露-反应关系的时空格局与机理方法研究”(编号:41471414)资助。
孙习文,女,硕士研究生,研究方向:地理信息系统应用与开发。