滑坡危险度制图中一种新型的负样本采样方法

2016-06-05 14:57敏,朱兴,2,3,杨,白彪,曾
地理与地理信息科学 2016年4期
关键词:危险度训练样本制图

缪 亚 敏,朱 阿 兴,2,3,杨 琳 ,白 世 彪,曾 灿 英

(1.虚拟地理环境教育部重点实验室(南京师范大学);江苏省地理环境演化国家重点实验室培育建设点;江苏省地理信息资源开发与利用协同创新中心,江苏 南京 210023;2.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101;3.Department of Geography,University of Wisconsin-Madison,Madison,WI 53706,USA)

滑坡危险度制图中一种新型的负样本采样方法

缪 亚 敏1,朱 阿 兴1,2,3,杨 琳2*,白 世 彪1,曾 灿 英1

(1.虚拟地理环境教育部重点实验室(南京师范大学);江苏省地理环境演化国家重点实验室培育建设点;江苏省地理信息资源开发与利用协同创新中心,江苏 南京 210023;2.中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京 100101;3.Department of Geography,University of Wisconsin-Madison,Madison,WI 53706,USA)

滑坡负样本在基于统计模型的滑坡危险度制图中具有重要作用,能够抑制模型的高估,以合理区划滑坡危险区与非危险区。目标空间外向化采样法(Target Space Exteriorization Sampling,TSES)是一种代表性的基于环境特征空间的负样本采样方法,以往研究表明,TSES在基于广义加性模型的滑坡危险度制图中的应用效果较好,但是其采集的负样本是“虚拟”的样本,只存在于环境特征空间中,无法映射到地理空间,因而无法通过野外检核验证所采集负样本的可靠性。针对这一问题,该文提出一种改进TSES方法,不仅可以在环境特征空间中进行负样本采样,而且使得采集的负样本可以映射到地理空间中。以甘肃省油房沟流域为研究区,在TSES与改进TSES两种负样本采样方法下分别对油房沟流域构建基于支持向量机(Support Vector Machine,SVM)的滑坡危险度推测模型,对比并分析两种负样本采样方法下的滑坡危险度制图精度。结果发现,改进TSES方法采集的负样本在基于SVM的滑坡危险度制图中应用效果比TSES好,表明改进的TSES是一种有效的负样本采样方法。

负样本采样方法;环境特征空间;滑坡危险度制图

0 引言

滑坡灾害的频繁发生对人类的生命财产与环境资源等构成极大威胁,鉴别未来可能发生滑坡的区域,有针对性地实施相关措施,可有效减少滑坡带来的损失。滑坡危险度是指在当地地形等条件下区域发生滑坡的可能性,即回答“什么地方容易发生滑坡”[1-3]。对研究区滑坡危险度进行评价,生成滑坡危险度空间分布图,可有效识别滑坡高危险区,对地区规划和建设有重要参考意义[3-5]。统计模型是滑坡危险度制图中最常使用的模型[6-9],其基本思想是:与过去发生过滑坡的区域具有相似地理环境的地区也极易发生滑坡[10,11]。统计模型通常是从滑坡点(正样本)和非滑坡点(负样本)以及这些点所在的影响因素中获取滑坡发生可能性与影响因素之间的关系,然后将这种关系应用到整个研究区,实现区域滑坡危险度的推测与制图。

滑坡负样本在基于统计模型的区域滑坡危险度制图中具有重要作用,能够抑制统计模型对滑坡危险度的高估,以合理区划滑坡高危险区与低危险区,因此滑坡负样本的研究越来越引起研究者的关注[12]。真实的负样本数据无法直接获取,一般是在未发生滑坡的地区采集“伪”负样本(pseudo-absence data)作为滑坡负样本[13,14]。目前滑坡负样本的采样方法可分为两大类:第一类是在地理空间中采集负样本[15],其原理是认为滑坡灾害点附近一定范围内的地理环境与滑坡点所在地的地理环境相似,因而其孕育滑坡灾害的可能性非常大。因此,在采集滑坡负样本时,需要避开滑坡点,在滑坡点一定距离(缓冲区)之外的区域随机采样。基于地理空间的负样本采样方法包括缓冲区控制采样法(Buffer Controlled Sampling,BCS)、迭代精确采样法(Iteratively Refined Sampling,IRS)等[15,16]。然而,由于现有的滑坡点不能包含地理空间中的所有潜在滑坡点,在地理空间中采集负样本时,极有可能将那些本该是滑坡高危险点错选为负样本,这些高危险点与滑坡点的地理环境相似,只是因为以往缺少诱发条件而未发生滑坡。这些假的负样本(潜在滑坡点)的存在会降低训练样本集的质量,进而影响统计型滑坡危险度制图的精度。第二类是在环境特征空间中采集负样本[16]。滑坡危险度制图的基本原理认为,与滑坡发生区地理环境相似的地区也极易发生滑坡,反之,与滑坡发生地区地理环境不相似的区域应不易发生滑坡。在这样的认知下,滑坡正负样本在环境特征空间中是分离的,可以在环境特征空间中区分开。目标空间外向化采样法(Target Space Exteriorization Sampling,TSES)是一种代表性的基于环境特征空间的负样本采样方法,其在基于广义加性模型的滑坡危险度制图中应用效果好于BCS与IRS[16]。但是TSES采集的负样本是“虚拟的”负样本,只能存在于环境特征空间中,无法映射到地理空间,因而无法通过野外核验所采集负样本的可靠性。

本文通过对TSES方法存在的问题进行研究,提出一种改进TSES方法,不仅可以在环境特征空间中进行负样本采样,而且使得采集的负样本可以映射到地理空间。

1 负样本采样方法

1.1 TSES方法

TSES方法的基本假设是:现有的滑坡灾害点可以代表滑坡发生的典型地理环境条件,但不能包含地理空间中的所有潜在滑坡点[16]。本方法通过在由影响因素构成的环境特征空间中将滑坡灾害点外向化,以获得负样本数据。其基本思想为:在研究区中选择n个影响滑坡发生的环境因素,构成一个描述研究区地理环境的n维环境特征空间,整个研究区会在该环境特征空间中占据一定的范围(研究区环境特征闭包圈)。将研究区中的滑坡点映射到该n维环境特征空间中,滑坡点会在该空间中占据一定的范围(正样本环境特征闭包圈)。根据滑坡危险度制图原理,正负样本应具有不相似的地理环境,即正负样本在环境特征空间中形成的闭包圈是分离的,则负样本应该在正样本环境特征闭包圈以外进行采样。其具体实现为:随机选择研究区中的一个滑坡点,在环境特征空间中对滑坡点进行外向化负样本采样,即将该滑坡点上的某一个影响因素值修改为正样本环境特征闭包圈以外、研究区环境特征闭包圈以内的任意一个值,保持该滑坡点上的其他n-1个影响因素值不变,此时这个滑坡点就可生成一个负样本。依此方法类推,即可生成一套负样本集。TSES基本思想的示意图如图1所示。

图1 TSES的基本思想

TSES的伪码如下所示:

输入:滑坡点集S

输出:生成的滑坡负样本集N

1)初始化:

e= 滑坡点个数

d= 环境特征空间的维数(即影响因素的个数)

N=φ

2)遍历每一个影响因素A:

b)计算影响因素A中唯一值的个数c,令:

c)由1到m遍历:

i)在滑坡点集S中随机选择一个滑坡点s;

iii)N=N∪{s},将修改后的滑坡点s加入到拟生成的负样本集N中。

3)返回生成的滑坡负样本集N。

1.2 改进TSES方法

改进TSES方法的基本假设与基本思想和TSES方法类似,在具体实现上与TSES有所不同。首先将整个研究区映射到环境特征空间中,形成研究区环境特征闭包圈;将研究区中的滑坡点都映射到环境特征空间中,形成正样本环境特征闭包圈。然后遍历研究区中所有栅格点,如果该栅格点至少有一个影响因素的值在正样本环境特征闭包圈以外,则该栅格点可进入到负样本集中。改进TSES基本思想的示意图如图2所示。本方法下生成的负样本都是研究区中实际的有地理位置的点,可以映射到地理空间中验证所采集负样本的可靠性。

改进的TSES的伪码如下所示:

输入:滑坡点集S

输出:生成的滑坡负样本集N

1)初始化:

N=φ

2)对于每一个影响因素A:

3)遍历研究区中的每一个栅格点i:

遍历每一个影响因素A:

ii)N=N∪{i},将i加入到拟生成的负样本集N中。

4)返回生成的滑坡负样本集N。

图2 改进TSES的基本思想

2 应用案例

2.1 研究区与数据

油房沟流域位于甘肃省武都县安化镇(图3,彩图见封3),流域面积49.74 km2。油房沟处于衰败期,其上游分水岭为石灰岩溶蚀夷平面,是天然草场,下游堆积着来自沟口的河流冲积物。区域内地势北高南低,平均海拔高程2 000 m以上,地势起伏较大,河谷深切,平均坡度在20°以上。油房沟内泥盆系、志留系分布广泛,岩性多为千枚岩、板岩、粉砂岩、泥岩等。该研究区亚热带季风气候显著,气候温暖湿润,受山地地形效应的影响,全年降水量达400~900 mm[17],降水集中在5-9月,且多以暴雨的形式出现。受特殊地质环境和气候环境的影响,流域内滑坡灾害频繁发生,造成极大的经济损失和人员伤亡,严重制约着该区工农业生产和社会经济的发展。

图3 油房沟流域地理位置和滑坡灾害点分布

根据室内遥感解译与野外检核,构建油房沟流域历史滑坡编目数据库。经调查,共识别65个滑坡体,分别为12个基岩滑坡、17个崩塌和36个黄土滑坡[18,19]。本文用滑坡发生初始面的顶部中心点代表滑坡灾害点,构成滑坡正样本,不仅可以避免由于面状滑坡的边界难以确定而带来的误差,也可以兼顾不同大小的滑坡[20]。基于这一正样本采样方法,油房沟流域共采集79个滑坡正样本(图3)。

根据研究区的地质环境特征和前人已有研究成果[21],选取高程、坡度、坡向、平面曲率、剖面曲率、距河流的距离、距道路的距离、岩性、距断层线的距离、土地利用类型10个影响因素(表1),用以对研究区内的滑坡孕灾环境进行定量描述。

表1 影响因素与数据源

对研究区1∶50 000地形图数字化,生成30 m分辨率的数字高程模型(DEM),在ArcGIS10.1软件下基于DEM派生出一系列地形因子,包括:高程、坡度、坡向、平面曲率、剖面曲率,以描述研究区的地形地貌条件;同时获得矢量格式的河流和道路数据。对研究区1∶25 000地质图数字化,获得地层分布和断层构造数据。同时代的地层可由不同成因的岩石类型组成,根据相似的物质组成和物理力学特征,可以把研究区的地质层组合并划分为粉砂岩、泥岩、薄砂砾岩岩组,厚石灰岩、板岩岩组,以及千枚岩、板岩、薄石灰岩岩组3类岩性单元。断层构造对滑坡的影响是根据距断层线的距离表达。对研究区的TM影像进行遥感解译,获得本研究区的土地利用类型,并将其分为4类:农田、林地、居民地与工业用地、未利用地。

本研究中,为避免因离散型影响因素(如:坡向、岩性和土地利用类型)而导致哑变量过多的问题,使用滑坡发生频率表达离散型影响因素[22],例如岩性数据包括3类岩性单元,每一类岩性单元可以表达为该单元中出现滑坡数量与所有岩性单元中出现滑坡数量的比值。此外,为方便空间分析与计算,需要保证影响因素数据尺度的一致性,本文根据研究区的尺度和数据源的尺度,选择30 m作为所有影响因素数据的分辨率。

2.2 基于SVM的滑坡危险度制图

SVM是Vapnik等提出的一种新的机器学习方法[23,24]。其基本思想是:将训练样本通过某一核函数映射到一高维特征空间,在高维特征空间中建立线性回归函数,寻找最优分类超平面,使得该超平面能尽可能多地将两类训练样本正确分开,同时使得分开的样本距离分类超平面最远(图4)[25,26]。

图4 SVM的基本思想

给定训练样本集{xi,yi},i=1,2,…,n;xi∈Rm,yi∈{-1,+1};n为训练样本数,m为输入向量的维数(本研究中是指影响因素的个数),假设有一个线性分类超平面可以将这两类训练样本完全分开,定义该超平面为:w·x+b=0。

SVM要求构建分类面将所有样本正确分类,同时使得分开的两类训练样本距离分类超平面最远,这是一个最优化问题,构造如下目标函数:

s.t.yi((w·xi)+b)≥1 i=1,2,…,n

此外,考虑到有些训练样本会被错误分类,Vpanik和Cortes等引入非负的松弛变量ξi,则上述带约束的最优化问题修改成如下目标函数:

s.t.yi((w·xi)+b)≥1-ξiξi≥0,i=1,2,…,n

当样本分类错误的时候ξi就会大于0。C是对误判样本的惩罚程度,C>0,是一可调常数,C越大代表对分类错误样本惩罚越重。因此,在求分类超平面时,C∑iξi的值越小越好[23]。

通常训练样本集是线性不可分的,SVM通过引入核函数将线性不可分的训练样本集映射到高维空间中,使其线性可分。SVM中常使用的核函数包括:线性核函数、多项式核函数和高斯核函数。

基于训练样本集构建SVM时,需要选择适宜的核函数并设置相应的参数。高斯核函数由于其具有较强的非线性映射能力,在滑坡危险度制图中广泛使用[27-29]。本文选择高斯核函数作为SVM的核函数。γ参数是高斯核函数中的重要参数,其大小关系着高斯核函数的形状。惩罚因子 C 是对分类错误样本的惩罚程度。这两个参数的组合直接影响支持向量机的泛化能力。本文采用交叉验证寻求最小MSE的方法,基于台湾大学林智仁教授开发的LIBSVM工具[30],通过网格搜索方法对训练样本进行分组交叉验证,找到SVM的最优参数 C 和γ。

根据训练样本和最优参数,构建基于SVM的滑坡危险度推测模型。将整个研究区的影响因素数据输入到构建好的基于SVM的滑坡危险度预测模型中,即可推测整个研究区的滑坡危险度空间分布。根据上述负样本采样方法中获得的不同训练样本集分别构建SVM滑坡危险度预测模型,推测不同训练样本集下的滑坡危险度空间分布。

2.3 滑坡危险度制图的精度和有效性评价

本文通过以下3个指标对滑坡危险度制图的精度和有效性进行评价,评价指标一、二是对统计方法的精度进行评价,评价指标三是对滑坡危险度制图的有效性进行评价:评价指标一为建模精度,是统计模型将训练样本正确分类的比率,用以衡量模型对训练样本的拟合程度。评价指标二为验证精度,是验证样本的分类正确率,用以衡量统计模型的预测能力。本文旨在探讨不同采样方法下的负样本对制图精度的影响,由于负样本数据的质量无法直接判断,因此只使用正检验样本来衡量模型的验证精度。通过对正检验样本设置一个滑坡危险度阈值(本文设置阈值为0.5),认为大于该阈值的样本分类正确,否则分类错误,如此即可度量检验样本分类正确的比率。评价指标三为滑坡危险区面积所占比重与落在该危险区域内的滑坡点比重之间的关系(下文简称“危险面积-滑坡点关系”)。一个有效的推测模型不仅应该具有高验证精度,还应该使得推测出的滑坡高危险区面积尽可能小,即应具有“使更多的滑坡灾害点落在有限面积的高危险区域内”这一特点[16],这样的模型可以高效地识别出真正的滑坡危险区域,有利于土地资源的充分利用和价值实现。本文使用滑坡发生初始面1 491个栅格点作为滑坡灾害点,将研究区内的所有栅格点按滑坡危险度由大到小排序,统计不同滑坡危险度值域下的累积面积比重,并统计落在该滑坡危险度值域范围内的滑坡灾害点比重,以获得危险面积-滑坡点关系,基于这一关系评价模型的有效性。

3 结果分析

本研究基于油房沟流域历史滑坡编目获得79个滑坡点(滑坡正样本),将滑坡点分为滑坡正训练样本63个(80%)和正检验样本16个(20%)。以所有滑坡点(79个滑坡点)为数据源,使用TSES和改进TSES方法分别采集63个负样本作为负训练样本,组合63个正训练样本,以构成训练样本集。每种负样本采样方法下,重复采样20次,得到同一负样本采样方法下20套不同的训练样本集,并分别应用于滑坡危险度制图,以避免偶然现象,真实反映同一负样本采样方法下基于SVM的滑坡危险度制图的一般规律。根据不同的训练样本集,分别构建基于SVM的滑坡危险度推测模型,以分析不同负样本采样方法下20次重复负样本采样的滑坡危险度制图精度和有效性。图5(彩图见封3)为不同负样本采样方法下基于SVM推测的滑坡危险度空间分布图。

图5 不同负样本采样方法下的滑坡危险度空间分布

3.1 不同负样本采样方法下的建模精度和验证精度

建模精度是指模型对参与建模的126个训练样本的分类正确率。统计不同负样本采样方法下20次重复负样本采样的建模精度(图6)可以发现,TSES下的SVM建模精度较低(多分布在65%~75%之间),改进的TSES下的SVM建模精度较高(多分布在80%~90%之间)。这说明改进的TSES方法下的SVM对训练样本集的分类准确率要高于TSES方法。

图6 建模精度盒

验证精度是指模型对未参与建模的16个正样本的分类正确率。统计不同负样本采样方法下20次重复负样本采样的验证精度(图7)可以发现,TSES下的SVM验证精度较低,且变异较大;改进的TSES下的SVM验证精度较高,且变异较小。这说明TSES方法下的SVM预测能力较低,模型的预测能力对训练样本的敏感性较高,预测能力的稳定性较差;而改进的TSES方法下的SVM预测能力较高,其预测能力的稳定性也较好。

图7 验证精度盒

3.2 不同负样本采样方法下的模型有效性

不同负样本采样方法下重复20次采样的危险面积-滑坡点关系如图8所示,图8a为TSES方法下的危险面积-滑坡点关系曲线,关系曲线大都呈线性,甚至有下凹趋势,某些实验中甚至要在100%的研究区面积内才能识别出所有的滑坡点,说明滑坡危险度空间分布图对滑坡点的预测有效性较差。此外,关系曲线分布没有统一的规律,说明统计模型对该方法采集的负样本敏感性较大。

图8b为改进TSES方法下的危险面积-滑坡点关系曲线,关系曲线大都呈现明显的上凸趋势,说明SVM滑坡危险度推测模型可以在较小的滑坡高危险面积内高效地识别出部分滑坡点,模型可以在较小的面积内(60%)识别出所有滑坡点,滑坡点多落在推测滑坡危险度高的区域,表明该采样方法下SVM推测模型的有效性较高,也印证了在该采样方法下模型较高的建模精度与验证精度。此外,关系曲线分布具有较强的规律性和一致性,说明统计模型对该方法采集的负样本敏感性较小。

4 结论

本文通过对TSES方法存在的问题进行研究,提出一种改进的TSES方法,不仅可以在环境特征空间中进行负样本采样,而且使得采集的负样本可以映射到地理空间中。本研究以SVM为推测模型,选择陇南市油房沟流域为研究区,在TSES与改进的TSES两种负样本采样方法下分别对油房沟流域构建基于SVM的滑坡危险度推测模型,推测油房沟的滑坡危险度空间分布;对比分析两种采样方法下滑坡危险度制图精度,以验证改进的TSES方法的有效性。研究发现,改进的TSES方法在基于SVM的滑坡危险度制图中的应用效果好于TSES方法,其采集的负样本可以极大提高SVM的建模精度和验证精度,也极大提高基于SVM的滑坡危险度推测模型的有效性,表明改进的TSES是一种有效的负样本采样方法。

图8 不同负样本采样方法下的危险面积-滑坡点关系曲线

[1] GUZZETTI F,CARRARA A,CARDINALI M,et al.Landslide hazard evaluation:A review of current techniques and their application in a multi-scale study,Central Italy[J].Geomorphology,1999,31:181-216.

[2] GUZZETTI F,REICHENBACH P,CARDINALI M,et al.Probabilistic landslide hazard assessment at the basin scale[J].Gepmorphology,2005,72(1-4):272-299.

[3] GUZZETTI F,REICHENBACH P,ARDIZZONE F,et al.Estimating the quality of landslide susceptibility models[J].Gepmorphology,2006,20(1-2):166-184.

[4] DAI F C,LEE C F,ZHANG X H.GIS-based geo-environmental evaluation for urban land-use planning:A case study[J].Engineering Geology,2001,61(4):257-271.

[5] 尹志华.基于RS和GIS技术对区域滑坡进行高效快速敏感性评价的模型研究——以北川县为例[D].成都:成都理工大学,2011.

[6] CARRARA A,CARDINALI M,DETTI R,et al.GIS techniques and statistical models in evaluating landslide hazard[J].Earth Surface Processes and Landforms,1991,16:427-445.

[7] SUZEN M L,DOYURAN V.Data driven bivariate landslide susceptibility assessment using geographical information systems:A method and application to Asarsuyu catchment,Turkey[J].Engineering Geology,2004,71(3-4):303-321.

[8] DAS I,SAHOO S,CEES V W,et al.Landslide susceptibility assessment using logistic regression and its comparison with a rock mass classification system,along a road section in the northern Himalayas (India)[J].Geomorphology,2010,114:627-637.

[9] YILMAZ I.The effect of the sampling strategies on the landslide susceptibility mapping by conditional probability and artificial neural networks[J].Environmental Earth Sciences,2010,60:505-519.

[10] CARRARA A,CARDINALI M,GUZZETTI F,et al.GIS-based techniques for mapping landslide hazard[A].CARRARA A,GUZZETTI F.Geographical Information Systems in Assessing Natural Hazards[C].Kluwer Academic Publishers,Dordrecht,The Netherlands,1995.135-175.

[11] 祁元,刘勇,杨正华,等.基于GIS的兰州滑坡与泥石流灾害危险性分析[J].冰川冻土,2012,34(1):96-104.

[12] GUO Q H,MAGGI K,CATHERINE H G.Support vector machines for predicting distribution of Sudden Oak Death in California[J].Ecological Modelling,2005,182:75-90.

[13] HIRZEL A H,HELFER V,METRAL F.Assessing habitat-suitability models with a virtual species[J].Ecological Modelling,2001,145:111-121.

[14] HIRZEL A H,HAUSSER J,CHESSEL D,et al.Ecological-niche factor analysis:How to compute habitat-suitability maps without absence data [J].Ecology,2002,83:2027-2036.

[15] 方苗,张金龙,徐瑱.基于GIS和Logistic回归模型的兰州市滑坡灾害敏感性区划研究[J].遥感技术与应用,2011,24(6):845-852.

[16] XIAO C C,TIAN Y,SHI W Z,et al.A new method of pseudo absence data generation in landslide susceptibility mapping with a case study of Shenzhen[J].Science China Technological Sciences,2010,53(1):75-84.

[17] 谌文武,赵志福,刘高,等.兰州-海口高速公路甘肃段工程地质问题研究[M].兰州:兰州大学出版社,2006.19-22.

[18] 陈耀乾.甘肃省武都县地质灾害调查与区划报告[R].甘肃省地质环境监测总站,2001.

[19] 董抗甲.甘肃省舟曲县地质灾害调查与区划报告[R].甘肃省地质环境监测总站,2003.

[20] ATKINSON P M,MASSARI R.Autologistic modelling of susceptibility to landsliding in the Central Apennines,Italy[J].Geomorphology,2011,130(1-2):55-64.

[21] BAI S B,LU P,WANG J.Landslide susceptibility assessment of the Youfang catchment using logistic regression[J].Journal of Mountain Science,2015,12(4):816-827.

[22] BAI S B,WANG J,LU G N,et al.GIS-based and data-driven bivariate landslide-susceptibility mapping in the Three Gorges Area,China[J].Pedosphere,2009,19:14-20.

[23] 傅文杰.GIS支持下基于支持向量机的滑坡危险性评价[J].地理科学,2008,28(6):838-841.

[24] 李秀珍,孔纪名,王成华.多分类支持向量机在滑坡稳定性判识中的应用[J].吉林大学学报(地球科学版),2010,40(3):631-637.

[25] XU C,XU X W,DAI F C.Comparison of different models for susceptibility mapping of earthquake triggered landslides related with the 2008 Wenchuan earthquake in China[J].Computers & Geosciences,2012,46:317-329.

[26] XU C,DAI F C,XU X W,et al.GIS-based support vector machine modeling of earthquake-triggered landslide susceptibility in the Jianjiang River watershed,China[J].Geomorphology,2012,145:70-80.

[27] PRADHAN B.A comparative study on the predictive ability of the decision tree,support vector machine and neuro-fuzzy models in landslide susceptibility mapping using GIS[J].Computers & Geosciences,2013,51:350-365.

[28] 姜琪文,许强,何政伟.基于SVM多类分类的滑坡区域危险性评价方法研究[J].地质灾害与环境保护,2005,16(3):328-330.

[29] 胡德勇,李京,陈云浩,等.GIS支持下滑坡灾害空间预测方法研究[J].遥感学报,2007,11(6):852-859.

[30] CHANG C C,LIN C J.LIBSVM:A library for support vector machines[J].ACM Transactions on Intelligent Systems and Technology (TIST),2011,2(3):27.

A New Method of Pseudo Absence Data Generation in Landslide Susceptibility Mapping

MIAO Ya-min1,ZHU A-xing1,2,3,YANG Lin2,BAI Shi-biao1,ZENG Can-ying1

(1.KeyLaboratoryofVirtualGeographicEnvironment(NanjingNormalUniversity),MinistryofEducation;StateKeyLaboratoryCultivationBaseofGeographicalEnvironmentEvolution(JiangsuProvince);JiangsuCenterforCollaborativeInnovationinGeographicalInformationResourceDevelopmentandApplication,Nanjing210023,China;2.StateKeyLaboratoryofResourcesandEnvironmentalInformationSystem,InstituteofGeographicSciencesandNaturalResourcesResearch,ChineseAcademyofSciences,Beijing100101,China;3.DepartmentofGeography,UniversityofWisconsin-Madison,Madison,WI53706,USA)

Landslide absence data plays an important role in statistical methods for landslide susceptibility mapping.It can constrain the overestimation of predicted landslide susceptibility value and distinguish landslide susceptible areas from safe areas reasonably.Target Space Exteriorization Sampling (TSES) is the representative one of the methods of pseudo absence data generation in environment feature space.It has been demonstrated to have good performance in landslide susceptibility mapping.However,the pseudo absence data it generated is virtual,which can only exist in the environment feature space and cannot be mapped into the geographic space,making it impossible to validate in the field work.In this paper,an improved method based on TSES is proposed to generate pseudo absence data.The improved method generates pseudo absence data in the environment feature space and the generated data can be mapped into the geographic space.To verify the validity of the improved TSES,Youfang catchment,in the south of Gansu Province,is used as the study area and Support Vector Machine (SVM) is used to predict landslide susceptibility value across the study area.Moreover,TSES is also applied in the study area to be compared with the improved TSES in the aspects of the predictive accuracy and validity for landslide susceptibility mapping.Results show that pseudo absence data generated from the improved TSES has better performance than that from TSES in landslide susceptibility mapping based on SVM.This indicates that the improved TSES is an effective method in generating pseudo absence data.

method of pseudo absence data generation;environment feature space;landslide susceptibility mapping

2015-12-05;

2016-01-27

国家自然科学基金项目(41431177、41471178);江苏省高校自然科学研究重大项目(14KJA170001);国家重点基础研究发展计划973项目(2015CB954102);中国科技部与欧洲空间局对地观测领域重大国际科技合作项目“龙计划”三期项目(10606);2015江苏省重点研发计划(社会发展)项目(BE2015704)

缪亚敏(1991-),女,硕士研究生,从事滑坡危险度评价研究。*通讯作者E-mail:yanglin@lreis.ac.cn

10.3969/j.issn.1672-0504.2016.04.011

P208;P642.22

A

1672-0504(2016)04-0061-07

猜你喜欢
危险度训练样本制图
胃间质瘤超声双重造影的时间-强度曲线与病理危险度分级的相关性研究
无声手枪如何消音?
胃间质瘤的MRI诊断及侵袭危险度分析
人工智能
能谱CT定量参数与胃肠道间质瘤肿瘤危险度的关系
小明巡山记
二向反射模型在土地覆被制图中的应用
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法