李 瑞,李 勇
(1.贵州省水土保持技术咨询研究中心,贵州贵阳 550002;2.贵州省水土保持监测站,贵州 贵阳 550002)
层次聚类分析法在贵州省水土保持四级区划中的应用
李 瑞1,2,李 勇2
(1.贵州省水土保持技术咨询研究中心,贵州贵阳 550002;2.贵州省水土保持监测站,贵州 贵阳 550002)
层次聚类分析法;水土保持区划;四级区划;贵州省
通过贵州省水土保持四级区划试验,探讨层次聚类分析法在水土保持区划中的应用,为贵州省水土保持四级区划及其他水土保持规划工作提供参考。根据划分结果,将国家水土保持三级分区中的滇黔川高原山地保土蓄水区划分为黔西北山地河谷农田保护与水质维护区和黔西南高原山地保土蓄水区,并依据行政区划连续性原则进行人工调整得到最终分区结果。最后,对比数学模型法和定性定量分析法,验证了层次聚类分析法的应用效果。
根据水利部批复的《全国水土保持规划任务书》(水规计[2010]540号),全国水土保持规划的首要任务是制定全国水土保持区划方案,目前已经完成了全国水土保持一级、二级及三级区划工作。贵州省全境涉及1个国家一级分区(西南岩溶区)、1个二级分区(滇黔桂山地丘陵区)和4个三级分区(滇黔川高原山地保土蓄水区、黔中山地土壤保持区、黔桂山地水源涵养区和滇黔桂峰丛洼地保土蓄水区)。考虑到国家三级分区中的黔中山地土壤保持区和滇黔川高原山地保土蓄水区涉及贵州省的县级行政区多、面积大,需对这两个三级分区进行进一步区划,完成贵州省水土保持四级分区。借鉴国内水土保持区划方法[1-2],笔者以滇黔川高原山地保土蓄水区为例,探讨层次聚类分析法在水土保持区划中的应用,以期为贵州省水土保持四级区划及其他水土保持规划工作提供参考。
层次聚类是目前应用最为广泛的一种聚类方法,其基本思想是:先将待聚类的n个样品(或者变量)各自看成1类,共有n类;再按照选定的方法计算每2类之间的聚类统计量,即某种距离(或者相似系数),将关系最为密切的2类合为1类,其余不变,即得到n-1类;然后按照前面的计算方法计算新类与其他类之间的距离(或相似系数),将关系最为密切的2类并为1类,其余不变,即得到n-2类;如此下去,每次重复都减少1类,直到最后所有的样品(或者变量)都归为1类为止[3]。
应用层次聚类分析法进行水土保持区划的基本步骤:①数据标准化。水土保持区划中被聚类的对象是由多个要素构成的,不同要素的数据往往具有不同的单位和量纲,且数值差异可能很大,这会对分类结果产生较大影响。因此,在分类要素的对象确定后、进行聚类分析前,要先对各聚类要素数据进行处理,主要方法有总和标准化、标准差标准化及极大值标准化等。②样品与样品之间的距离。在应用层次聚类法进行水土保持区划实践中,把每个分类对象(一般以县级行政区为单元)称为样品,样品与样品之间的距离一般采用欧式距离或欧式距离平方。本研究采用欧式距离平方计算样品与样品之间的距离。③聚类方法。主要有直接聚类法、最短距离聚类法、最远距离聚类法、ward聚类分析法等。通过反复试验,发现ward聚类法在贵州省水土保持区划中分类效果最好,因此本研究拟采用ward聚类分析法进行贵州省水土保持四级区划。
层次聚类分析法具有分类客观、科学等优点,但同时该方法是将各样本的不同要素(指标)进行计算后按照一定规则聚类,在水土保持区划中难以保障行政区划的连续性,因此运用层次聚类分析法计算后需对分类结果进行人工调整,以保证县域行政区的连续性。
根据贵州省水土保持区划纲要,其水土保持四级区划将在国家水土保持三级区划的基础上进行,主要任务是对涉及县域较多的三级分区——黔中山地土壤保持区和滇黔川高原山地保土蓄水区进行四级区划。本研究以滇黔川高原山地保土蓄水区为例,探讨层次聚类分析法在贵州省水土保持四级区划中的应用。
滇黔川高原山地保土蓄水区涉及贵州省21个县级行政区。以这21个县级行政区为样本,区划指标主要有海拔、人均GDP、多年平均气温、≥10℃活动积温、人口密度、坡耕地占土地利用面积比例、森林覆盖率、石漠化面积比例、水土流失面积比例、水土流失治理面积比例等。根据各县上报的区划指标最新数据,进行校正后作为最后划分依据。因各指标观测值具有不同的数量级和单位,直接计算距离常使数值较小的指标失去作用,为提高分类效果,本研究采用总和标准化法进行数据预处理。
采用ward聚类分析法,基于统计分析软件平台IBM SPSS 19进行贵州省水土保持四级区划。
依据SPSS平台输出的树状图,将滇黔川高原山地保土蓄水区初步划分为2个四级分区,再进一步根据涉及县区的水土流失、保土蓄水、地形地貌等特征,将初步划分结果分别命名为黔西北山地河谷农田保护与水质维护区和黔西南高原山地保土蓄水区。按照贵州省行政区划图,根据区划连续性原则,对初步划分的四级分区进行调整,即将普安县从黔西北山地河谷农田保护与水质维护区调整到黔西南高原山地保土蓄水区,将赫章县从黔西南高原山地保土蓄水区调整到黔西北山地河谷农田保护与水质维护区,调整后的水土保持四级区划结果见表1。
表1 滇黔川高原山地保土蓄水区四级区划结果
本次划分结果比较理想,符合《全国水土保持区划导则》中水土保持区划保持县级行政区完整性和连续性的基本原则。黔西北山地河谷农田保护区与水质维护区包括遵义市的桐梓、习水、赤水、仁怀以及毕节市的威宁、赫章、毕节、大方、黔西、金沙、织金、纳雍,共计12个县级行政区;黔西南高原山地保土蓄水区包括六盘水市的钟山、六枝、水城、盘县,安顺市的关岭以及黔西南州的兴仁、晴隆、贞丰、普安,共计9个县级行政区。两个四级分区的地形地貌、水土流失及石漠化特征明显不同。黔西北山地河谷农田保护与水质维护区海拔约1 000 m,石漠化面积约占30%,坡耕地占土地利用面积的30%以上,森林覆盖率在40%以上,坡耕地面积大是造成该区水土流失的重要原因。黔西南高原山地保土蓄水区位于贵州省西南部,西接云南,海拔约1 500 m,森林覆盖率约30%,石漠化面积比例在40%以上,坡耕地占土地利用面积的20%左右,植被破坏及石漠化是导致该区水土流失的主要原因。
以国家水土保持三级分区——滇黔川高原山地保土蓄水区为例,采用层次聚类分析法中的ward聚类分析法进行贵州省水土保持四级区划,划分结果较为理想。一方面层次聚类分析法计算方法较客观,各指标取值确定后不受人为因素干扰;另一方面基于SPSS等统计软件平台,划分过程高效快捷,且易掌握。不足之处是行政区划连续性相对较差,要对区划结果进行人工调整。从本次试验结果看,选取恰当的聚类方法可提高区划准确度,例如本研究选用ward聚类分析法进行区划时仅需对2个县级行政区进行人工调整。
此外,为了验证不同计算方法的区划效果,笔者还采用数学模型法和定性定量分析法等进行了区划试验。其中,数学模型法的主要优点是计算方法比较客观,引入权重可以使指标的重要性得以体现,缺点是县级行政区连续性不好解决,权重的取值具有一定的主观性,会影响最终区划结果的准确性;定量定性结合分析法的优点是行政区划的连续性较好,缺点是不能全面体现各指标的贡献率,主观性较大,工作人员的实践经验和相关知识储备将直接影响最终的划分结果。对比发现,相比数学模型法和定性定量分析法,层次聚类分析法计算简单、区划效果好,并决定选择层次聚类分析法作为最终的区划方法。
[1]韩成军.关于青海省水土保持区划的思考[J].中国水土保持,2011(9):45-47.
[2]景可.黄土高原生态经济区划研究[J].中国水土保持,2006(12):11-13.
[3]言迎,王应龙,杨延.层次聚类分析法在土地利用分区中的应用——以益阳市南县为例[J].内蒙古农业科技,2009(5):83-85.
S157
A
1000-0941(2013)02-0021-02
李瑞(1979—),男,贵州盘县人,高级工程师,博士,主要从事水土保持研究及管理工作。
2012-10-30
(责任编辑 李杨杨)