吴海波,赵晓慎†,王治国,张超
(1.华北水利水电学院,450011,郑州;2.水利部水利水电规划设计总院,100011,北京)
水土保持区划是水土保持规划的基础工作和关键技术环节。为了使水土资源得以充分利用,水土流失得到有效控制,水土资源在经济、社会和生态的效益达到最大化,为科学开展水土保持工作提供决策依据,对水土保持区划的研究具有十分重要的现实意义。近些年,随着社会经济发展与生产实践需求,水土保持区划以辛树帜等[1]于1982 年提出土壤侵蚀类型对中国水土流失进行分区后,经过调整和补充,为其他全国水土保持区划研究提供基础理论[2-3]。王治国等[4-5]根据我国水土保持区划存在的实际问题,提供解决办法和提出水土保持区划基本框架理论;魏晓等[6]依据宁夏地域差异类型及防治措施进行了水土保持区划。以土壤侵蚀类型、地域差异类型等进行区划指导水土保持工作,取得了较好的实际应用效果,但存在方法指标单一、主观定性偏重等不足。随着现代数理统计分析理论和计算机技术的快速发展,引入了主成分分析法、聚类分析法、遥感技术等方法和技术[7]。笔者采用多元统计知识的Bayes 判别分析理论建立水土保持区划综合判别模型,以定性指标选择与定量数据计算相结合,用主成分分析法对指标进行选择,对已有观测样本的若干数量特征对新样本进行识别,判别新样本所属类型,并将该方法应用于甘肃、宁夏、青海3 省份的黄土丘陵沟壑区进行区划分析。
甘肃、宁夏、青海(甘宁青)3 省份的黄土丘陵沟壑区属于我国第二级地形阶梯中西北黄土高原区的一个二级区。该区位于日月山以东,大阪山、乌鞘岭至白于山一线以南,六盘山以西,秦岭以北的西北黄土高原,主要位于黄河流域范围内,面积为12 万6 087.8 km2,涉及甘肃、青海及宁夏3 省份共50 个县(市、区)。区内地面坡度较缓,以丘陵为主,有部分高地草原区和小盆地,其中山地占52.21%、平原占22.54%、其他占25.25%。因该区地处西北内陆,气候条件干旱少雨,年均降雨量约为386 mm,干旱指数约为1.1,年均气温约为4.5℃,是一个气候比较敏感的生态脆弱地带[8]。甘宁青地区位于黄土高原、内蒙古高原和青藏高原交汇处,是一个地缘辽阔的少数民族积聚地,经济条件落后,生产水平低下,由于特殊地形、地质和气象条件,加上当地百姓毁林开垦及过度放牧,植被破坏严重,林草覆盖率约为38.45%,土壤侵蚀非常严重,加大了水土流失发生的频率、灾害的程度及治理的难度[9]。
Bayes 判别分析模型是根据已有的样本建立判别函数对测试样本进行识别,判定测试样本所属类别的一种方法。其基本思想是充分利用各类先验信息,考虑已有样本先验概率,利用Bayes 公式按照一定准则构造判别函数,以测试样本在各判别函数中所得最大值的一类为测试样本所属类别[10]。
式中:μi为第i 个总体的均值;Σi为第i 个总体的方差。
对于一个新样本x 到其中任意2 个总体Gm和Gn的马氏距离的平方差[12],具体形式为
gm和gn分别为2 个总体Gm和Gn的概率密度函数,具体形式为:
式中:μm,μn为2 个总体的均值向量;Σm,Σn为2 个向量的协方差矩阵。
当Σm=Σn=Σ 时,根据式(2)、式(3)和式(4)可得Bayes 判别函数,具体形式为
当存在Σ1=Σ2=…=Σg=Σ 时,则得到多正态总体的Bayes 判别函数
式中qi为总体Gi的先验概率。
通过Wi(x)可得x 属于Gi的后验概率P(Gi/x),具体形式为
由式(7)可知,后验概率P(Gi/x)与概率密度exp(Wi(x))成正比关系,则对于给定的样本x∈Gi,Bayes 判别准则表示为
本文对Bayes 判别分析算法的实现进行编程计算,其结构流程如图1 所示。
图1 Bayes 判别分析算法流程Fig.1 Flow chart of bayes discriminant analysis
为了对甘宁青黄土丘陵沟壑地区进行更加合理的区划,更好地规划并利用水土资源服务于当地社会生产和生活,使得区域间相似性最小,区域内差异性最小。根据以地形地貌、土壤侵蚀等内部因素为主[13-14]进行区划的结果,甘宁青黄土丘陵沟壑地区由陇中高原区、甘肃中部黄土丘陵沟壑区及黄土高原西缘区等3 部分组成,分别记为G1、G2和G3。文中考虑该地区自然资源条件、社会经济情况和水土资源流失等外部特征,选取每个研究单元的综合农业生产、土地生产力、水文气象及土壤侵蚀等方面为研究内容,对土地总面积、耕地面积、林地面积、草地面积、人口总数、粮食总产量、降雨量和蒸发量等10 个影响因素进行数据分析和整理,采用主成分分析法对影响指标进行处理,得到垦殖率x1、林草覆盖率x2、人口密度x3/(人/km2)、单位面积粮食产量x4/(kg/hm2)、降雨量x5/mm 和蒸发量x6/mm 等6 个主要影响指标作为Bayes 判别分析算法因子,根据式(6)建立区划分类判别的Bayes 判别分析函数,对甘宁青黄土丘陵沟壑地区进行区划分析。
以甘宁青黄土丘陵沟壑区中的50 个县(市、区)作为研究对象,其中陇中高原区G1有23 个,甘肃中部黄土丘陵沟壑区G2有10 个,黄土高原西缘区G3有17 个。为了对甘宁青黄土丘陵沟壑地区进行准确的划分,检验土壤侵蚀类型区划的合理性。将处于3 个区域边界上的10 个县(市、区)提取用作Bayes 判别分析的测试样本,其数据见表1。
表1 待判别的县(市、区)Tab.1 Undiscriminanted county(city,area)
对剩余40 个县(市、区)的各因子数据进行分析,可得G1、G2、G3的样本容量分别为n1=18,n2=8,n3=14,且其相应的先验概率分别为q1=9/20,q2=1/5,q3=7/20。利用Bayes 判别分析理论建立区划Bayes 判别函数,根据式(6)计算,得到甘宁青黄土丘陵沟壑地区的区划数学模型,见式(9)~(11)。
将表1 中待测数据代入式(9) ~(11),计算Bayes 判别函数Wi(x)(i=1,2,3),结果见表2。
表2 Bayes 判别分析测试结果Tab.2 Test results of discriminant analysis by Bayes
利用式(8)对表2 中判别数据Wi(x)(i=1,2,3)进行判别分析,与测试样本在土壤侵蚀类型下所进行的区划结果进行比较,Bayes 判别分析区划模型判断正确率为100%。Bayes 判别分析区划模型论证了甘宁青黄土丘陵沟壑区划按照土壤侵蚀类型进行水土保持区划的合理性,同时也说明对水土保持区划存在着多种方法。甘宁青黄土丘陵沟壑区建立的Bayes 判别分析区划模型结果与实际情况吻合,其准确率大于80%,可推广至其他地区进行水土保持区划[10]。
通过Bayes 判别分析理论对甘宁青黄土丘陵沟壑区进行区划分析,采用垦殖率、林草覆盖率、人口密度、单位面积粮食产量、降雨量、和蒸发量作为判别因子,提出了Bayes 判别分析甘宁青黄土丘陵沟壑地区的区划数学模型。实例结果表明,该模型具有操作简单易懂、计算速度快及准确率高等特点,与按土壤侵蚀类型进行区划的结果一致,正确率为100%。说明Bayes 判别分析是一种判别效果较好的数学区划判别技术,可以应用于水土保持区划中。
[1] 辛树帜,蒋德麟.中国水土保持概论[M].北京:中国农业出版社,1982:35-42
[2] 关君蔚.水土保持原理[M].北京:中国农业出版社,1995:130-133
[3] 水利部.SL 190—1996 土壤侵蚀分类分级标准[S].北京:中国水利水电出版社,2007
[4] 王治国,王春红.对我国水土保持区划与规划中若干问题的认识[J].中国水土保持科学,2007,5(1):105-109
[5] 张超,王治国,王秀茹,等.我国水土保持区划的回顾与思考[J].中国水土保持科学,2008,6(4):100-104
[6] 魏晓,孙峰华.宁夏水土保持及区划研究[J].水土保持研究,2005,12(6):119-121
[7] 尹辉.澧水流域水土保持区划与综合治理模式配置[D].长沙:湖南师范大学,2009
[8] 刘春艳,白永平.甘宁青段黄河经济带发展研究[J].地域研究与开发,2005,24(1):62-65
[9] 黄正林.近代甘宁青农村市场研究[J].近代史研究,2004(4):123-156
[10]郑国强,张洪江,刘涛,等.基于Bayes 判别分析法的密云县山洪泥石流预报模型[J].水土保持通报,2009,29(1):83-87
[11]宫凤强,李夕兵.隧洞围岩稳定性评价的Bayes 判别分析法及应用[J].地下空间与工程学报,2007,3(6):1138-1141
[12]王学民.应用多元分析[M].上海:上海财经大学出版社,2009
[13]水利部,中国科学院,中国工程院.中国水土流失防治与生态安全:西北黄土高原区卷[M].北京:科学出版社,2010:26-39
[14]唐克丽,熊贵枢,梁季阳,等.黄河流域的侵蚀与径流泥沙变化[M].北京:中国科学技术出版社,1993