基于多元数据的云南省水土保持区划方法研究

2017-09-12 13:26弥智娟朱艳艳姜宏雷黄俊文
水土保持研究 2017年2期
关键词:区划水土保持云南省

弥智娟, 朱艳艳, 姜宏雷, 赵 成, 黄俊文

(1.云南省水利水电勘测设计研究院, 昆明 650021; 2.云南秀川环境工程技术有限公司, 昆明 650021)

基于多元数据的云南省水土保持区划方法研究

弥智娟1,2, 朱艳艳1,2, 姜宏雷1,2, 赵 成1, 黄俊文1

(1.云南省水利水电勘测设计研究院, 昆明 650021; 2.云南秀川环境工程技术有限公司, 昆明 650021)

为了增强全国水土保持三级区划在云南省的适用性和指导性,更有效地开展水土保持预防治理工作。针对云南省开展水土保持四级区划,选取自然、社会经济、土地利用、水土保持4类要素的86个指标构建了云南省水土保持区划指标体系,通过SPSS软件对指标体系进行主成分分析和聚类分析,结合GIS软件将聚类分析结果绘制成自然要素分布图、社会经济要素分布图、土地利用要素分布图、水土保持要素分布图,并对这4个要素分布图进行空间叠置,初步完成了云南省水土保持四级分区工作。该方法大大提高水土保持区划的效率和准确性,以期为不同层次水土保持区划工作提供借鉴。

水土保持; 区划; SPSS; GIS; 多元数据

水土保持区划是水土保持规划的基础和重要组成部分,也是实施水土流失综合防治和行业管理的重要依据。水土保持区划是在全面了解区域自然地理、生态环境、水土流失特征和区域发展条件等基础上,做到水土保持工作分区、分类指导,因地制宜,分层次,有重点地监控和管理,为区域可持续发展制定科学规划[1],实现水土保持措施合理布局和资源最优配置,促进区域生态环境、经济和社会可持续发展。

国内外学者在这方面做了大量的研究,也获得了一定的经验和不足。国外学者关于区划的研究大部分主要是从自然因素出发,都很少涉及人类活动对生态环境和生态系统的作用[2],且采用的方法较为单一,如Bailey等[3-4]、Rowe等[5]。我国的水土保持区划工作早期主要集中在黄土高原,20世纪50年代,黄秉维[6-7]、朱显谟[8]等均对黄河中游地区建立区划系统,并编制了不同尺度的土壤侵蚀图;之后随着先进的统计学技术和计算机技术广泛应用到水土保持区划的工作中,使区划工作逐步向数字化方向发展。张汉雄[9]、胡志勇等[10]采用模糊数学模型对黄土高原丘陵沟壑区进行水土保持分区;邓根松等[11]考虑自然因素和人为因素的影响,利用灰色系统理论对福建省邵武市进行水土保持区划研究;吴海波等[12]采用Bayes判别分析理论对黄土丘陵沟壑区内的3个省份建立水土保持区划的数学模型;王新军等[13]将“降维”的指标体系结合GIS工具进行江苏省水土保持区划研究。这些方法在不同层面都取得了很好的应用效果,但均存在指标单一、人为因素影响较多等特点。加之云南省山区较多,地形复杂多样,区域差异较大,全国性的大尺度、单一指标的水土保持区划不能客观、全面了解云南省自然、社会经济及水土流失防治需求的差异性和统一性。

因此,本文在全国水土保持三级区划(全国水土保持区划(试行)》(办水保[2012]512号))的基础上,收集全省129个县级行政单元的多元统计数据,采用SPSS与GIS相结合的方法,从自然、社会经济、土地利用和水土保持4个方面对云南省水土保持四级区划进行研究。

1 研究数据及来源

云南省水土保持区划四级分区是以县级行政单元统计相关数据,全省县级行政单元共129个,其中自然、社会经济数据采用1980—2014年的平均数据,土地利用数据采用2009年第二次全国土地调查数据,水土保持现状数据采用2014年前累计数据。

区划所需要的基础数据包括指标层数据和图件数据(30 m分辨率的云南省数字高程模型图;2013年云南省行政区划图)。研究数据主要来源于云南省统计年鉴(包括各州市统计年鉴)、云南省水文年鉴、云南省水资源公报、云南省水土保持公报、全国水土保持规划数据上报系统和全国水土保持区划协作平台,云南省各级水利部门上报的数据。

2 数据分析原理

2.1 指标体系分析原理

2.1.1 主成分分析原理 主成分分析法(Principal Component Analysis,PCA)作为指标重要性分析的常用方法,其运用“降维”的思想将多个指标用少数几个具有代表性,包含原始数据大量信息的综合指标代替的方法,其所带信息量的大小代表了指标的重要性高低。主成分分析能够通过特征值、贡献率、得分情况删除在所有指标中反映信息量最少的指标,进而保存最具重要性的指标,以保证信息的完整性。因此本研究筛选过程中对特征值较低且对总方差累计贡献率影响较大的主成分指标进行剔除,将剩余指标再次进行主成分分析,再次剔除,重复操作,直至剩余指标的特征值不变且总方差累计贡献趋于稳定,不能再进行指标筛选。

水土保持区划中采用多元数据进行分析,不同数据往往具有不同的单位和量纲,且数值差异可能很大,由于区划时需要尽量保留实际值中的数值关系,因此需要选用原始数据进行标准化处理,本次选用最为常用的标准差标准化方法进行数据标准化处理。分析时抽取的主成分因子应保证抽取的主成分累积贡献率大于85%,方可达到降维的目的。

2.1.2 层次聚类分析原理 聚类分析(Cluster Analysis)是一种常用的定量化方法,按“物以类聚”的原则研究事物分类的一种多元统计分析方法[14],它为了把互相差异的自然地理区域或现象进行分类和归纳,用相似系数与差异系数反映被分类对象之间亲疏程度的数量指标。层次聚类分析是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样本(或者变量)各自看成1类,共有n类;再按照选定的方法计算每2类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的2类合为1类,其余不变,即得到n-1类;然后按照前面的计算方法计算新类与其他类之间的距离(或相似系数),将关系最为密切的2类合并为1类,其余不变,即得到n-2类;如此下去,每次重复都减少1类,直到最后所有的样品(或者变量)都归为1类为止。

应用层次聚类分析进行水土保持区划时,把多元数据最小统计单元(县级行政单元)称为样本,样本与样本之间的距离一般采用欧式距离或欧式距离平方,类与类之间聚类主要有类平均法、最短距离法、最远距离法、离差平方和法(ward法)等。通过反复试验比较,确定样本与样本之间的距离采用欧式距离平方法和类与类之间的聚类采用Ward法在云南省水土保持四级区划中具有较好的效果。

2.2 空间叠置原理

空间叠置分析法(Overlay Analysis)是GIS空间分析的一种,叠置分析是将两层或多层地图要素进行叠加产生一个新要素层的操作,其结果将原来要素分割生成新的要素,新要素综合了原来两层或多层要素所具有的属性。空间叠置分析分为点与多边形、线与多边形以及多边形与多边形的叠加,这种叠置属空间合成叠加,是对叠加后产生的多重属性进行重新分类。叠置法可以减少主观性和随意性,并有助于发现一些自然现象之间的联系。套叠的图幅数不能过多,否则,往往会出现难以综合的局面。在主导要素不明显的情况下,选取适当的专题图进行叠加会取得了令人满意的结果。

3 运用多元数据分析云南省水土保持区划

3.1 指标体系的构建

作为一项复杂的系统工程,水土保持不仅受自然要素的影响,也受社会经济要素的影响,土地利用变化也能引起一系列自然现象和生态过程的变化。另外,对影响因子的分析也是一个多指标、多要素综合作用旳系统分析。根据水土保持区划指标体系建立的原则,将水土保持区划指标体系分为四个层次,包括目标层(A)、要素层(B)、因子层(C)和指标层(D)。其中,要素层(B)包括自然要素(B1)、社会经济要素(B2)、土地利用要素(B3)和水土保持要素(B4);因子层(C)由各项指标构成,如地形因子(C1)等,指标层(D)根据云南省水土保持各影响要素的具体情况进行选择确定(表1)。

表1 云南省水土保持区划指标体系及量化指标

续表1

目标层(A)要素层(B)因子层(C)指标层(D)云南省水土保持区划指标体系土地利用要素(B2)土地利用类型面积比例因子(C4)坡耕地面积比例(D41)<5°面积比例(D42)坡耕地5°~8°面积比例(D43)坡耕地8°~15°面积比例(D44)坡耕地5°~15°面积比例(D45)坡耕地15°~25°面积比例(D46)坡耕地>5°面积比例(D47)坡耕地>15°面积比例(D48)坡耕地>25°面积比例(D49)坡耕地25°~35°面积比例(D50)耕地面积比例(D51)园地面积比例(D52)林地面积比例(D53)草地面积比例(D54)水域面积比例(D55)未利用面积比例(D56)社会经济要素(B3)社会因子(C5)总人口(D57)人口密度(D58)农业人口比例(D59)非农业人口比例(D60)人均土地面积(D61)人均耕地面积(D62)人均园地面积(D63)人均粮食面积(D64)年粮食总产量(D65)经济因子(C6)人均GDP(D66)农村人均纯收入(D67)国民生产总值(D68)第一产业比例(D69)第二产业比例(D70)第三产业比例(D71)人均生产总值(D72)水土保持要素(B4)土壤侵蚀程度因子(C7)水土流失面积(D73)轻度水土流失面积比例(D74)中度水土流失面积比例(D75)强烈水土流失面积比例(D76)极强烈水土流失面积比例(D77)剧烈水土流失面积比例(D78)水土保持现状因子(C8)水土流失治理面积(D79)坡改梯面积(D80)小型蓄水工程(D81)田间道路(D82)坡改梯配套引排水(D83)保土耕作(D84)经果林造林面积(D85)封育治理面积(D86)

3.2 要素层指标体系简化

本研究采用SPSS 21软件分别对原始要素层指标进行主成分分析,以自然要素主成分分析为例。提取的前8个主成分的累积贡献率为86.315%,满足贡献率>85%的要求。其中自然要素第1,2,3,4,5,6,7,8主成分贡献率分别为29.230,18.079,12.093,8.359,5.508,5.251,4.206,3.589,由此计算各主成分的权重分别为0.34,0.21,0.14,0.10,0.06,0.06,0.05,0.04。

根据表2可知,第1主成分中有6个指标占据较大载荷,分别为多年平均气温的因子载荷是0.869,一月平均气温的因子载荷是0.819,七月平均气温的因子载荷是0.789,无霜期的因子载荷是0.748,海拔的因子载荷是-0.902,极端最低气温的因子载荷是0.778。其中只有海拔与主成分呈负相关关系,其他均与主成分呈正相关关系。由此表明,第1主成分主要与温度、海拔因子有关。第2主成分中有3个指标占据较大载荷,分别为8°~15°坡面面积比例的因子载荷是-0.851,>25°坡面面积比例的因子载荷是0.859,山地面积比例的因子载荷是0.776。其中8°~15°坡面面积比例与主成分呈负相关关系,其他均与主成分呈正相关关系。由此表明,第2主成分主要反映地形地貌变化的差异。第3主成分中4个指标占据较大载荷,分别为多年平均暴雨日数的因子载荷是-0.580,多年平均蒸发量的因子载荷是0.534,年平均降水量的因子载荷是-0.624,多年平均汛期降水量的因子载荷是-0.629。其中多年平均蒸发量与主成分呈正相关关系,其他均与主成分呈负相关关系。由此表明,第3主成分主要反映水文循环等方面的影响。第4主成分中2个指标占据较大载荷,分别为日照时数的因子载荷是0.716,森林覆盖率的因子载荷是0.640,均与主成分呈正相关关系。由此表明,第4主成分主要反映光照、植被等综合方面的影响。第5主成分中3个指标占据较大载荷,分别为>15 °坡面面积比例的因子载荷是-0.445,紫色土面积比例的因子载荷是-0.451,黑毡土面积比例的因子载荷是0.509。其中>15 °坡面面积比例、紫色土面积比例与主成分呈负相关关系,黑毡土面积比例与主成分呈正相关关系。由此表明,第5主成分主要与坡度及土壤类型等方面的影响有关。第6主成分中只有大风日数指标占据较大载荷,大风日数的因子载荷是0.646,且与主成分呈正相关关系。由此说明,第6主成分主要与风因素有关,可体现土壤侵蚀中的风力侵蚀造成水土流失的影响。第7主成分中只有褐红土面积比例指标占据载荷较大,即褐红土面积比例的因子载荷是-0.610,且与主成分呈负相关关系,由此说明,第7主成分主要与土壤类型因子有关。第8主成分中2个指标占据较大载荷,分别为最大日降水量的因子载荷是0.497,紫色土面积比例的因子载荷是0.491,且均与主成分呈正相关关系。由此表明,第8主成分主要与土壤类型因子、降水的特定时段统计有关。

总体来看,第1主成分上集中的指标最多且指标载荷最重,第5主成分、第8主成分中最大载荷数值偏低,第6,7主成分载荷较大指标均为1个且在该两个主成分中选出的较大载荷指标与该两个主成分中的其他指标载荷有一定差距。由此表明,虽然每个主成分所集中的指标多少、荷载大小均不同,但却代表整个自然要素的所有信息,即自然要素指标经过主成分分析提取的8个主成分尽可能保留原有多个变量的信息,将原来的多因子极大简化,有力提高了后续计算的效率。

将主成分分析后自动另存的各主成分的综合得分乘以相应的权重得出各行政单元自然要素的综合得分。

3.3 层次聚类分析及空间叠置

通过SPSS 21软件进行主成分分析,获得自然要素综合得分、社会经济要素综合得分、土地利用要素综合得分、水土保持要素综合得分,在该软件中进行层次聚类分析,分别获得各要素聚类树状图。依据云南省水土流失情况的特点和保证全国水土保持三级区划(云南省部分)(办水保[2012]512号)的完整性,选择适当的步长距离,确定分类的类别数目。自然要素选择步长距离为10时,将云南省县级行政单元分为8类;社会经济要素选择步长距离为5时,将云南省县级行政单元分为8类;土地利用要素选择步长距离为10时,将云南省县级行政单元分为8类;水土保持要素选择步长距离为5时,将云南省县级行政单元分为7类。

通过ArcGIS 10.2将各要素分类结果绘制成图(图1),分析图1可知,从全省角度来看,图A、图B、图C、图D分类结果较为集中,离散区域较少,各要素对云南省县级行政单元的划分总体较为一致。从局部角度来看,云南省西北部3个斑块在图A、图B、图D中分类完全一致,且全国水土保持三级区划(云南省部分)对该斑块的分区亦是如此。

之后,采用ArcGIS 10.2将图1中图A、图B、图C、图D四张图进行空间叠置,即可初步完成云南省水土保持区划四级分区的划分。

表2 自然要素指标主成分分析因子载荷矩阵

图1 云南省自然要素、社会经济要素、土地利用要素、水土保持要素分区

4 结 论

(1) 运用SPSS 21软件采用主成分分析对多元数据进行“降维”,本文以自然要素为例,从自然要素的40个指标中抽取8个主成分且主成分累积贡献率达到86.315%,满足要求。经分析每个指标均具有很好的代表性,计算各主成分的权重及各自然要素的综合得分,其他三个要素依此类推。

(2) 根据各要素的综合得分分别进行层次聚类分析,选择适当的步长距离,确定自然要素、社会经济要素、土地利用要素均分为8类,水土保持要素分为7类。通过ArcGIS 10.2软件将各要素聚类分析结果绘制出自然要素分区图、社会经济要素分区图、土地利用要素分区图和水土保持要素分区图,并利用该软件进行空间叠置,即可初步完成云南省水土保持四级分区的划分。

(3) 基于多元数据的云南省水土保持四级区划综合了自然要素、社会经济要素、土地利用要素和水土保持要素四个方面,采用多指标、多层次进行云南省水土保持四级分区分析,并与全国水土保持三级分区(云南省部分)进行比较。该方法不仅弥补了以往水土保持区划指标单一、代表性差、主观定性强的问题,而且提高了水土保持区划分析的效率、客观性和准确性。

(4) 该方法具有很强的可操作性,但不足之处在于对多元数据的依赖性较高,数据收集难度较大,数据的准确性对结果有一定影响。

[1] 夏继红,胡玲.生态河岸带功能区划的定性与定量研究[J].水利学报,2007(S1):542-546.

[2] 傅伯杰,陈利顶,刘国华.中国生态区划的目的、任务及特点[J].生态学报,1999,19(5):591-595.

[3] Bailey R G. Ecosystem Geography:from ecoregions to sites[M]. New York: Springer, 2009.

[4] Bailey R G. Explanatory supplement to ecoregions map of the continents[J]. Environmental Conservation, 1989,16(4):307-309.

[5] Rowe J S, Sheard J W. Ecological land classification: A survey approach[J]. Environmental Management, 1981,5(5):451-464.

[6] 黄秉维.编制黄河中游流域土壤侵蚀分区图的经验教训[J].科学通报,1955(12):15-21.

[7] 黄秉维.中国综合自然区划的初步草案[J].地理学报,1958(4):348-365.

[8] 朱显谟.有关黄河中游土壤侵蚀区划问题[J].土壤通报,1958(1):1-6.

[9] 张汉雄.模糊聚类在水土保持区划中的应用[J].中国水土保持,1990(11):52-54.

[10] 胡志勇,严鹏,程颐农,等.用模糊—动态聚类法对青海省东部进行水土保持综合治理亚区划分[J].水土保持研究,1994,1(1):37-44.

[11] 邓根松,危煦春.灰色系统理论在水土保持区划中的应用:邵武市水土保持区划方法初探[J].福建水土保持,1995(4):14-18.

[12] 吴海波,赵晓慎,王治国,等.基于Bayes判别分析模型的水土保持区划[J].中国水土保持科学,2012,10(2):88-91.

[13] 王新军,曹磊,吴颖超,等.基于GIS的江苏省水土保持区划方法[J].水土保持通报,2014,34(3):130-134.

[14] 汪冬华.多元统计分析与SPSS应用[M].武汉:华东理工大学出版社,2010.

RegionalizationMethodofSoilandWaterConservationinYunnanProvinceBasedonMultivariateData

MI Zhijuan1,2, ZHU Yanyan1,2, JIANG Honglei1,2, ZHAO Cheng1, HUANG Junwen1

(1.YunnanInstituteofWater&HydropowerEngineeringInvestigation,DesignandResearch,Kunming650021,China; 2.YunnanXiuChuanEnvironmentalEngineeringTechniqueCompanyLimited,Kunming650021,China)

In order to boost up the applicability and guidance of the third level of national regionalization in Yunnan Province and thus to prevent and manage effectively soil and water conservation in the province. In virtue of the multivariate data, we deeply explored the four regionalization of soil and water conservation in Yunnan Province. According to the characteristics of soil erosion in Yunnan Province, there are 86 indicators including natural, socio-economic, land use and soil erosion which were selected in the index system. All indicators in the index system were analyzed using principal component analysis and cluster analysis by SPSS software, then with the help of GIS, it turned the result of cluster analysis into the distribution of map about four major factors, namely nature, socio-economic, land use and soil erosion. The four maps were used for spatial overlay analysis, the Yunnan Province soil and water conservation comprehensive evaluation map was preliminarily

. This method can greatly improve the efficiency and accuracy of the regionalization of soil and water conservation in Yunnan Province, and provide reference for the different levels of the regionalization of soil and water conservation work.

soil and water conservation; regionalization; SPSS; GIS; multivariate data

2016-03-17

:2016-04-01

弥智娟(1987—),女,陕西蒲城人,硕士,助理工程师,主要从事生态水文、水土保持研究,E-mail:mzj_sh@163.com

S157

:A

:1005-3409(2017)02-0064-06

猜你喜欢
区划水土保持云南省
水土保持探新路 三十九年写春秋
民国初期云南省议会述论
《水土保持通报》征稿简则
对云南省“农危改”工作若干问题的思考
水土保持
林芝市雷电风险区划
基于“三线一单”的环境功能区划实证研究
川渝传统民居区划的环境蕴意
水土保持
云南省瑞丽市老年大学之歌