多种组合模型的区域滑坡易发性及精度评价

2021-05-27 01:43王高峰丁伟翠李荣建高幼龙

自然灾害学报 2021年2期

杨强，王高峰，丁伟翠，李荣建，高幼龙，邓兵

(1.西安理工大学岩土工程研究所，陕西西安 404100； 2.中国地质环境监测院，北京 100081；3.中国地质调查局水文地质环境地质调查中心，河北保定 071051； 4.中国地质科学院，北京 100037)

滑坡易发性是自20世纪90年代以来地质灾害领域的研究热点之一，并已成为世界各国防灾减灾战略体系的重要组成部分，在开展城镇规划建设、地质灾害风险管理和预警预报等方面取得了较好的应用效果。从研究区域可见我国在滑坡易发性评价研究主要分布在三峡库区、汶川地震区及西北黄土区等西部山区，并形成了较为详细的评价方法体系[1-3]。有学者针对白龙江流域开展了滑坡、泥石流发育环境、危险性评价等方面的研究[4-7]，研究对象多集中在白龙江干流或中游某一重要区段或国道212沿线。而关于整个流域尺度(甘肃段)的滑坡易发性评价研究甚少，目前仍然缺乏区域性国土空间用途管制规划必需的滑坡灾害易发性分区成果地图，特别是针对评价模型的适用性和精度评价方法的对比研究鲜有案例。

滑坡易发性是指一定区域内由孕灾地质条件控制的滑坡发生的可能性，而滑坡易发性不同于危险性，不考虑地震、降水等诱发因素。目前，区域滑坡灾害易发性评价主要依靠启发式推断法、数理统计分析法和非线性方法等，后两类评价方法具有运算效率高和因子权重易于客观获取的优势而被广泛运用[8]。其中，数理统计分析法包括基于原始数据，对其规律进行基础处理的信息量模型、确定性系数模型、证据权法模型等[9-12]，非线性方法包括基于人工智能学习的人工神经网络模型、决策树模型、支持向量机模型及逻辑回归模型等[13-14]。但由于单一的评价模型方法存在对参评因子不能客观地确定其权重、模型运算过程中因主观干扰而无法消除评价因子之间的相关性等问题，难以客观、准确、定量地进行区域滑坡灾害易发性评价。为获得切合实际的评价结果，有学者开展了多种模型组合对滑坡易发性进行评价，总结分析了模型的优劣[15-16]。此外，评价因子选取不当或彼此相关性强或个数较多，及评价因子状态分级方面客观性影响较高，没有科学合理的划分依据，评价过程过于繁琐，而且会影响模型评价结果的合理性和准确性。然而在评价结果分析方面很少有人关注这些评价模型和方法评价精度的对比与检验，事实上评价结果的准确性、分析精度及与实际情况的吻合程度是使用者最关注的问题，在数据有限条件下的评价结果更需要对精度进行分析。

本文在研究白龙江流域滑坡发育特征及孕灾环境的基础上，结合数据源的可获取性，选取了坡度、坡高、距断层距离、地层岩性、流域沟壑密度、归一化植被指数(NDVI)等6个影响滑坡灾害发生的致灾因素作为参评因子。首先，结合2 093处滑坡灾害及隐患点数据，并依据各指标条件下的信息量值、确定性系数值和证据权重值曲线突变规律、滑坡面积及分级面积频率比曲线对各评价因子的状态进行分级。然后通过应用信息量模型、确定性系数模型和证据权模型分别与逻辑回归模型进行滑坡易发性评价。最后采用4种不同方法进一步检验评价结果的合理性，来开展研究区滑坡灾害易发性及结果精度评价分析。力求从模型适用性和预测精度2方面选择适合于该流域的最优滑坡易发性评价方法，真实地反映出滑坡易发性的空间分布特征，以期为地质灾害突发、高发、频发的白龙江流域地质灾害防灾减灾预警决策提供参考。

1 研究区及数据源

1.1 研究区概况

根据甘肃省白龙江流域滑坡发育特征及现有滑坡灾害数据，选取白龙江流域受滑坡灾害影响最严重的白龙江中游及岷江支流段作为本文的研究区域。地理范围在103°42′55.1″E～105°19′00.7″E，33°01′17.5″N～34°22′37.6″N之间，面积约6 128 km2，图1为研究区地理概况及位置示意图。

图1 研究区位置示意图Fig.1 Schematic diagram of study area location

该区位于青藏高原东部、秦岭山地西缘，我国纵横向地震带在此交汇穿过，地质构造复杂，发育一系列活动的逆冲断裂和走滑断裂，且局部次级断裂和小型褶皱集中发育，新构造运动强烈和地震活动频繁。该区滑坡灾害密布于软弱浅变质岩地层区，尤其在分布有志留系、泥盆系等软弱千枚岩区域最为突出，滑坡灾害密度达0.48个/km2，是区内滑坡灾害易发多发岩组。白龙江中游及其岷江支流贯穿整个区域，地貌类型复杂，属中深切割中高山地貌区，地形海拔高度范围为768～4 244 m，相对高差3 476 m。该区属于亚热带向北温带的过渡区，气候垂向上随海拔变化具有差异性，在时空分布上降水分布不均匀[17]。受以上条件的影响使得该区地质灾害发生的频率高、规模大、种类多、范围广，且具有“群发性、突发性、隐蔽性、叠加性”的特点，每年造成的经济损失巨大，其中滑坡灾害的严重性亦是众所周知，如锁儿头滑坡、泄流坡滑坡、江顶崖滑坡等。

1.2 数据源

本文开展滑坡易发性评价的数据源主要包括：(1)滑坡灾害点的基础数据主要来自陇南白龙江流域地质灾害调查成果数据；(2)研究区1∶50 000地形图和30 m×30 m分辨率DEM数据，用于提取坡度、坡高、流域沟壑密度等信息；(3)1∶100 000构造地质图，用于提取地层、距断层距离等信息；(4)2016年获取的精度为0.5 m的Pléiades卫星遥感数据和2014年30 m×30 m的landsat8 OLI，用于提取归一化植被指数。

研究区滑坡共2 093处，总面积224.54 km2，约占整个研究区面积的3.66 %。图2为根据野外调查和已有滑坡资料整理得到的白龙江中游段滑坡发育面积分布曲线图。可以看出：滑坡面积与滑坡分布个数呈双峰曲线规律，整体上滑坡面积越大，分布个数越少。研究区最大滑坡面积为4.36 km2，最小为210 m2，在滑坡面积为0.001～0.015 km2和0.035～0.153 km2范围内滑坡共有1 258处，占研究区滑坡总数和滑坡总面积的比例分别为60.11 %和25.64 %。

图2 滑坡发育面积分布曲线Fig.2 Distribution curve of landslide development area

2 评价模型

目前较为常用的滑坡易发性评价模型均具有各自的优点和不足。信息量模型是采用条件概率的统计分析方法获取评价因子的权重值，一定程度减小主观因素的影响，也是目前国内地质灾害易发性评价的通用模型，但不能反映不同评价因子对滑坡发生的贡献权重或影响程度的差异。确定性系数模型计算过程严密，既能解决多层数据类型的归并，又能较好地解决评价因子之间不同特征分级对滑坡易发性的影响，但未能体现各评价因子对滑坡易发性的差异性。证据权模型对评价因子个数无要求，但各评价因子之间需满足独立性检验，且要求滑坡样本数据足够多。逻辑回归模型能用简单的线性回归来描述滑坡致灾因子之间复杂的非线性关系，且计算便捷，对多层数据类型的合并却无法解决。本文获取的滑坡样本数据详实，评价因子基础数据易获得且精度较高，在基于数理统计进行易发性评价时可取得较理想的结果[18]。但滑坡灾害孕育过程是一个非线性系统，线性的数理统计很难精确地对其进行预测。为了提升评估成功率或准确性，可综合各自模型的优点对研究区的滑坡易发性进行建模，不仅能在GIS平台的支持下快速得出评价结果，而且较理想地解决采用单一模型在滑坡易发性评价中的不足，使评价结果更满足实践和应用需求。

2.1 信息量模型

信息量模型是以信息论和工程地质类比法为理论依据。通过对历史滑坡灾害样本数据统计，分析孕灾地质环境与其时空分布关系，来获取滑坡灾害发育规律，从而推算出不同工程地质环境对滑坡孕育和产生的影响程度，其作用大小用“信息量”来衡量，其值越大，滑坡易发性越高，其公式如下：

(1)

式中，y为滑坡事件；xi(i=1,2,…n)为不同影响因子，n为影响因子个数；I(y,x1x2…xn)为影响因子组合(x1x2…xn)对滑坡所起作用大小的信息量；P(y,x1x2…xn)为影响因子组合下滑坡发生的概率；P(y)为滑坡发生的概率。

2.2 确定性系数模型

确定性系数模型是由Buchanan和Shortliffe提出一种概率函数方法[19]。利用确定性系数进行滑坡灾害的易发性评价可以根据已发生滑坡灾害与影响因子数据集之间的统计关系进行确定获取，计算公式为：

(2)

式中：CF为滑坡发生的确定性系数；PPa为滑坡影响因子分类a中包含的滑坡灾害个数与数据分类a面积的比值；PPs为整个研究区内滑坡发生个数与研究区总面积的比值。由式(2)可知CF的值域是[-1，1]，CF值为正值代表滑坡变形失稳的确定性高，表明孕灾地质环境易于发生滑坡灾害；CF值为负值代表滑坡变形失稳的确定性低，表明孕灾地质环境不易发生滑坡灾害。

2.3 证据权模型

证据权法是以贝叶斯双变量统计模型为基础的，综合各种证据来证明一种假设的定量方法。通过对已知滑坡与其孕灾地质环境因子进行空间关联分析，计算影响因子中不同等级区间对滑坡事件的贡献权重值，得到滑坡易发性指数，该指数的高低代表研究区发生滑坡可能性的大小。当各评价因子之间满足独立性假设，其公式如下：

Wf=W+-W-.

(3)

式中：W+表示影响因子分布区的正相关权重值；W-表示影响因子分布区的负相关权重值，如果W+<0或W->0时，影响因子与滑坡事件呈负相关，如果W+>0或W-<0时，影响因子与滑坡事件呈正相关，如果W+=0或W-=0是，影响因子与滑坡事件不相关；Wf为综合权重，来表示该影响因子等级对滑坡变形失稳的影响权重值。

2.4 逻辑回归模型

逻辑回归模型是研究二值分类因变量与其多个互不相关的自变量之间关系的多元回归统计分析方法，在滑坡灾害分析中，它能较好地解决滑坡易发性评价出现的二分类因变量的问题(1代表发生，0代表未发生)。设某滑坡事件发生的概率为P，不发生的概率为1-P，x1x2…xn表示滑坡发生的n个评价因子，其发生和未发生概率可用Logistic回归函数公式表示为：

P=eβ0+β0x1+…+βnxn/(1+eβ0+β0x1+…+βnxn).

(4)

该模型中β0为截距，βi为回归系数，即反映的是滑坡不同影响因子的相对贡献大小。模型输出结果P的范围为[0，1]，1表示滑坡发生的概率为100%，0表示滑坡发生的概率为0%。对式(4)两边取自然对数，进行Logit转换，并作为因变量，将评价因子xi(i=1,2,…n)作为自变量，建立线性回归方程：

(5)

式中P值反映了在影响因子x1x2…xn的共同作用下，滑坡的发生的可能性大小和敏感程度。

2.5 多种组合模型

将信息量模型、确定性系数模型和证据权模型计算出的各个评价因子等级的I值、CF值和Wf值作为逻辑回归模型中的指标值，构建不同组合回归方程，得出逻辑回归系数βi，以此为依据开展研究区滑坡易发性评价。

因此本文随机选取滑坡灾害点总样本的80%作为训练样本(即1 680个发生滑坡灾害点)进行建模分析，相应的随机选取1 680个未发生滑坡的样本点，共计得到3 360个具有独立属性的样本数据，并将其作为因变量样本集。结合评价因子，分别采用信息量模型I+逻辑回归模型LR(组合1)、确定性系数模型CF+逻辑回归模型LR(组合2)和证据权模型WF+逻辑回归模型LR(组合3)3种组合模型评价研究区的滑坡灾害易发性并进行分区，分析3种组合模型得到的研究区滑坡易发性评价结果。利用20%的滑坡样本点，采用多种方法检验评价结果的合理性，结合滑坡实际分布规律及发育情况讨论并比较3种组合模型的适用性和准确性。

3 评价因子的选取与状态分级

3.1 因子提取

滑坡的发生是孕灾环境因子和诱发环境条件共同作用的结果，其中孕灾环境因子是指斜坡自身的属性特征，在经过剥蚀或风化等作用逐渐使斜坡趋于变形失稳状态。诱发环境因子是指在降雨、地震、人类工程扰动等影响下导致斜坡失稳的外界条件。通常，滑坡易发性评价主要考虑对滑坡发生发展起控制性作用的孕灾环境因子，来揭示斜坡未受外界条件影响工况下的失稳概率。促使滑坡产生的孕灾环境因子主要包含：地形地貌、基础地质、地表覆被和水文环境因子等4大类。在评价因子的选取中既要合理灵活又要体现因子对滑坡的影响，同时要确保各因子之间互不影响且不具有强相关性。因此，本文基于野外实地调查及收集到的数据库与前人研究成果，选取坡高、坡度、地层岩性、距断层距离、沟壑密度、归一化植被指数(NDVI)等6个孕灾环境因子，采用30 m×30 m分辨率的栅格单元作为研究区滑坡易发性的基本评价单元，在此基础上进行滑坡指标因子的状态分级及易发性评价。

3.2 影响因子状态分级

影响指标因子状态分级是指数据类型为离散型和连续型的单因子指标遵循一定的划分标准分为多个不同范围的二级状态。其中离散型数据主要根据野外调查滑坡孕灾工程地质条件类比制定划分标准。而连续型数据是以一定步长的因子信息与预测单元个数分布曲线和综合式(1)、式(2)及式(3)计算各步长在各因子中的I值、CF值、Wf值分布曲线为依据。对比2类曲线的分布规律，确定分布曲线的突变点为等级划分的界限值，突变点范围内的数值不仅体现了预测单元空间上的各等级之间的差异性，也体现了评价单元预测的相对集中性。

3.2.1 地形地貌因子

本文地形地貌因子主要包括坡高、坡度，均是应用ArcGIS的空间分析工具从DEM中提取的栅格数据。统计坡高、坡度2个影响因子不同区间内的滑坡面积比和分级面积比，如图3所示，可以看出发生滑坡的坡度主要集中在[25°，45°]区间，研究区坡度从15°到40°内的面积最大，且在[10°，35°]区间滑坡面积比大于分级面积比，表明滑坡的相对面密度较大。坡高在100～200 m范围时滑坡发育较多，在75～175 m区间对滑坡影响较大。

图3 地形地貌因子状态分级统计图Fig.3 Classification statistical map of topographic and geomorphic factors

3.2.2 水文环境和地表覆被因子

(1)水文环境因子

流域沟壑在一定程度上反映了该地区地形切割程度、起伏程度和岩土体松散程度，亦能反映土壤侵蚀的严重程度，也能反映地貌的演化阶段。通常水系发育程度和分布密度越高对地表侵蚀能力就越强，就越易于发生地质灾害。在对区域滑坡易发性评价研究中，很难揭示地下水对斜坡的稳定性的影响，因此，本文以任一单元内沟壑密度大小来表达水系对区域滑坡发育的影响。

根据研究区DEM数据提取出的水系分布图，采用ArcGIS的空间分析工具，制作研究区流域沟壑密度栅格图层，分别对其影响范围内的滑坡频率进行统计，结果如图4所示。结果显示随着流域沟壑密度的增大，滑坡面积及滑坡灾害点密度呈现先增大后急剧降低，最后以微弱趋势递减。这主要原因，一是随着沟壑密度的增大，水土流失程度也随之增强，导致坡体表面松散物质已全部滑移，大多数基岩出露；第二，当沟壑密度大于3.2 km/ km2时，其覆盖区域主要分布于白龙江及岷江支流河谷地带，零星发育小型河岸塌滑，滑坡基本不发育。故滑坡面积在0.8～1.6 km/km2范围内相对较大，在([0.8，2.2]、[2.4，3.2])km/ km2区间对滑坡影响较大。根据曲线规律，将流域沟壑密度分为<0.8km/ km2、0.8～1.2 km/ km2、1.2～2.4 km/ km2、2.4～3.2 km/ km2、3.2～3.489 km/ km2等5个状态。

图4 流域沟壑密度状态分级统计图Fig.4 Statistical map of gully density classification in river basin

(2)地表覆被因子

植被覆盖度的变化主要影响地表水对岩土体的入渗侵蚀程度，造成斜坡稳定性降低，进而导致滑坡变形失稳概率增加，因此本文采用归一化植被指数(NDVI)来表征地表覆被。

从图5中滑坡面积比和分级面积比曲线可以看出，发生滑坡的NDVI主要集中在[0.25，0.40]区间，研究区NDVI从0.18到0.45内的面积最大，且在[0.10，0.35]区间滑坡面积比大于分级面积比。根据图5模型频率值曲线分析可知，随着流NDVI的增大，滑坡面积呈现先急剧增大后逐渐较小的趋势，NDVI在 [0.1，0.3]区间对滑坡影响最大。根据曲线规律，将NDVI分为<0.1、0.1～0.3、0.3～0.45、0.45～0.5、>0.5等5个状态。图6为连续型指标坡度、坡高、流域沟壑密度、植被归一化指数(NDVI)因子状态分级图。

图5 地表覆被状态分级统计图Fig.5 Statistical map of land cover classification

图6 连续型因子状态分级图Fig.6 Continuous factor state grading chart

3.2.3 基础地质因子

通常认为地层岩性与断裂构造是影响滑坡孕育的两个重要基础地质因子。以往研究成果认为，白龙江流域滑坡主要沿断裂带成群成带分布，在沿区域性活动断裂一般发育大型或巨型滑坡，据统计70.6%的滑坡分布在距断裂2.5 km范围内，在距离断层小于5.0 km范围分布有90%以上的大型滑坡[20-22]。而在地层岩性软弱区或软硬相间岩层区内滑坡成片发育，此次调查共有1132处滑坡发育于软弱岩层区，441处滑坡发育于软硬相间岩层区，占滑坡总数的75.2%。故选取岩性与构造活动作为滑坡易发性评价的基础地质条件。

(1)地层岩性

地层对滑坡孕育起着重要的影响作用，主要是通过影响堆积体和基岩的物理力学性质及其渗透性来促使滑坡变形失稳，同时，它决定了滑坡发育的规模、类型特征。研究区地层岩性极为复杂，属西秦岭地层区，从前震旦系到第四系均有出露，共出露30套地层。

图7 研究区控滑地层岩性因子状态分级统计图Fig.7 Statistical map of stratum lithology classification of slip-controlling strata

表1 研究区控滑地层岩性分级Table 1 Classification of stratum lithology

(2)地质构造条件

滑坡发育和发生与断裂构造活动有着密切的关系，距断层的距离是滑坡易发性分析的一个重要影响因子[23]。研究区滑坡的发育主要受到活动断裂控制，最为典型的是坪定-化马活动断裂(带)，沿该断裂破碎带发育一系列特大型滑坡，呈现出滑坡后壁至分水岭的长条状、“背滑”、“对滑”相间线状分布特征，其物质结构、成分、成因复杂，次级断裂发育。

研究区内滑坡沿断裂呈带状分布的特征非常明显，通过对区内滑坡的分布随距断层的距离统计表明：滑坡灾害的分布随其距断层距离呈急剧衰减的趋势，滑坡灾害个数与断裂的地表破裂面的垂直距离满足以下关系：

N=1062e-0.365Dr(R2=0.8839).

(7)

图8与式(7)说明研究区内滑坡分布与断层有着显著的关系，即：距断层越近，断层活动对斜坡的作用越强烈，就越容易诱发滑坡；反之，随着距断层距离增大，断层活动对斜坡作用迅速减弱。在统计的2 093处滑坡中有1 220处分布在距断层距离小于1.0 km范围内，约占滑坡总数的58.29%。

图8 研究区滑坡个数与断层距离关系图Fig.8 The relation map of landslides amount and fault distance

通过对区内498条断层，利用距断层的欧氏距离来表示地质构造活动对滑坡的影响，分别对各缓冲区内的滑坡进行频率统计，结果如图9所示，可以得出在距断层[0，1.0 km]区间滑坡面积比大于分级面积比，且滑坡主要发育在距断层距离小于2.2 km范围内。利用与地层岩性影响因子相同的分级方法将研究区断层影响带划分为4个级别，因为在这4个构造影响带之外仍有滑坡发育，故将该范围定义为第5级影响带，分级结果如表2所示。

图9 距断层距离状态分级统计图Fig.9 Statistical map of the state classification of the distance from fault

表2 研究区距断层距离对滑坡发育影响分级统计Table 2 Classification statistics of the influence of fault distance on landslide development in study area

地层岩性、地质构造条件等属于离散型指标，因子状态分级结果如图10所示。

图10 离散型因子状态分级图Fig.10 Discrete factor state classification diagram

3.3 评价因子I值、CF值和Wf值计算

首先，根据2 093个滑坡样本点在各评价因子分级状态中的分布情况，分别采用公式(1)～公式(3)计算各分类级别在各评价因子中的I值、CF值和Wf值，结果见表3。上述数值不仅可以进行各个评价因子的分类级别之间比较，而且可揭示同一评价因子内各分类级别的相对重要性。

表3 各评价因子分类级别I值、CF值和Wf值计算结果Table 3 Calculation results of I Value、CF Value and WF Value for each evaluation factor classification level

3.4 评价因子共线性诊断

尽管基于工程地质类比法选定的影响因子能在一定程度上正确反映滑坡发育和因子的空间关系，但是受区域地质环境条件空间分布多样性和差异性的影响，这些因子可能具有一定的相关性，彼此之间并不是完全相互独立的。若因子之间存在高度的相关性或盲目选取更多的参评因子而不对其重叠性和共线性进行处理，会使模型评价结果失真或难以估计准确性。

因此，为了确保各参评因子互不影响和达到评价模型输入参数准确性的要求，需对所选各指标因子进行筛选。本文首先选取滑坡灾害点总样本的80%(即1 680个发生滑坡点)和1 680个未发生滑坡的样本点作为训练样本。然后提取每个样本的各分级后因子等级值，采用SPSS软件中进行多重共线性诊断，获取其方差膨胀系数VIF和相关性系数R(表4)。表4计算结果显示分级后确定的6个指标因子VIF值基本接近，表明因子之间存在共线性的可能性较小；同时各因子之间的相关矩阵R≤0.3，可认为所选各因子之间相关性微弱或不相关。因此这6个指标因子满足相互独立的要求，均可参与模型评价。

表4 评价因子的相关矩阵及VIF计算结果Table 4 Relevance matrix of evaluation factor and VIF calculation results

3.5 评价因子权重值计算

通过GIS分析计算工具中的栅格计算器将所得的各评价因子I值、CF值和Wf值赋予各图层，获得18张新的评价因子的模型值图。然后提取3 360个训练样本各赋值后因子等级值作为自变量，是否发生滑坡灾害作为因变量(0代表未发生滑坡灾害，1代表滑坡灾害点)，分别输入SPSS软件中进行多项逻辑回归分析。把分析结果中得到的各因子的回归系数B作为该因子的权重，各个变量在方程中的重要程度通过sig值(或wals值)来体现，sig值小者(或wals值大者)变量的显著性就越高，在方程中贡献就越大，当sig值小于0.05时才具有统计意义。

回归结果显示，3种组合模型计算出的各因子sig值均小于0.05(表5)，说明选取的6个因子都是有效的，同时各因子之间的相关系数都小于0.3，表明所选因子是合理的。组合1模型计算出的因子权重大小依次为植被指数、地层岩性、坡高、流域沟壑密度、坡度、距断层距离；组合2模型计算出的因子权重大小依次为植被指数、地层岩性、坡高、坡度、流域沟壑密度、距断层距离；组合3模型计算出的因子权重大小依次为植被指数、地层岩性、坡高、流域沟壑密度、坡度、距断层距离。可见3种组合模型中各因子对模型贡献大小变化很小。

表5 3种不同模型逻辑回归分析结果Table 5 Logical regression analysis results of the three models

4 评价结果分析及精度评价

4.1 易发性评价分区与评价结果

从各因子的回归系数与不同组合模型得到的各分类级别的I值、CF值和Wf值乘积可以看出，结果均表现是在以千枚岩、炭质板岩为主的浅变质岩区、距离断层1.5km内、流域沟壑密度在2.4～3.2 km/km2区段、坡度25～45°和坡高为75～175 m范围内、植被裸露区即NDVI为0.1～0.3分布区最容易发生滑坡灾害的地方。

在ArcGIS软件中，根据3种组合得到的各因子回归系数结合公式(4)～(5)计算出研究区滑坡灾害发生的概率P，生成研究区滑坡发生概率分布图，在此基础上采用似然比模型对滑坡易发性概率结果按P值大小分为四类：低易发区(0～0.25)、中易发区(0.25～0.45)、高易发区(0.45～0.65)和极高易发区(0.65～1)，最终得到研究区滑坡易发性评价分区图(图11)。结合滑坡训练样本数据，统计各易发性等级区域内滑坡灾害点个数(表6)显示：组合1模型中，76.07%的滑坡灾害落入高易发区和极高易发区，落入中易发以上的滑坡占滑坡总数的93.69%；而组合2模型和组合3模型滑坡灾害点划分到高易发以上区域的滑坡比例分别为73.33%、74.76%。大量的滑坡灾害点集中发育在易发性较高的区域内，而易发性较低的区段滑坡发育相对较少，表明采用3种组合方法所得到的评价结果与实际滑坡灾害点的分布情况基本吻合。

表6 不同模型易发性分区内滑坡点个数Table 6 The number of landslide points in the prone zones of different models

图11 不同模型的易发性评价结果Fig.11 Susceptibility assessment results of different models

从图11不同组合模型易发等级图分布状况来看，研究区滑坡极高易发区主要分布白龙江两岸，尤其分布在两河口至桔柑乡段白龙江左岸区域。易发性高的区域滑坡分布有以下特征：1)沿活动性断裂呈线状分布，组合1模型较明显地揭示坪定～化马断裂对滑坡发育的控制性作用，而在研究区南部滑坡集中分布在次级断裂和小型褶皱密集区；2)受易滑地层控制明显，易发程度极高的区域主要是由软弱千枚岩、炭质板岩组成志留系1段地层及由灰岩、千枚岩互层构成泥盆系6、7段易滑地层区，该类岩组受内外营力影响强烈，在断裂带沿线或新构造运动活跃区域，常形成具有塑性流特性且厚度小于5m的浅层残坡积堆积物斜坡，在降水的作用下易发生中小型滑坡；3)在流域沟壑密集区呈串珠状连片分布；4)地表为基岩出露与裸土地带且坡面侵蚀程度强的区域，滑坡集中分块、分区发育。

4.2 精度评价

模型精度评价是检验评价结果精准性和合理性的重要手段。本文采用4种方法对不同组合模型进行精度评价，一是根据实际发生的滑坡灾害点在各易发等级区间内的分布情况来检验其合理性；二是通过Sridevi Jadi经验概率法[24]、Cohen′sKappa系数法[25]、ROC成功概率法对模型评价的精度进行检验。

(1)为了避免主观因素影响，使得构建的不同组合模型具备良好的稳定性，选取未参与模型训练的415个滑坡灾害点(约占样本总数的20%)作为预测样本进行预测率检验。滑坡灾害易发性评价结果的合理性需满足2个检验准则：一是检验样本点落在高易发区的百分比应最大和不易发区占整个研究区面积的百分比应该最小；二是检验样本点落在各易发等级区的百分比和各等级区的面积占整个研究区的总面积的百分比的比值即频率比应该随易发区等级的增高而增大。从表7可以看出，3种组合模型计算结果都完全满足上述2个准则，说明滑坡易发性程度划分结果是合理的。

表7 不同模型易发性的检验结果对比Table 7 Comparison of susceptibility test results of different models

(2)Sridevi Jadi经验概率法，是1997年由Sridevi Jadi提出的以经验概率形式来表达精度评估的方法，属于受临界值约束的准确性统计方法，其临界值不唯一，表达式为：

(8)

式中，N为评价单元总数；S为存在滑坡的单元总数；K是斜坡易发性为中等和高的单元总数；KS为存在滑坡的斜坡易发性为中、高的单元总数。

(3)Cohen′s Kappa系数法属于典型的受临界值约束的准确性统计方法且计算方法便捷，但临界值的选取具有较大的随意性和主观性，定义式为：

(9)

式中T为评价单元总数，其它各参数见表8，其中当为K>0.61精度较好的评价模型；0.41≤K≤0.60为中等评价模型；K<0.41为精度较差的评价模型[4]。

表8 滑坡模型评价列联表Table 8 Contingency table of landslide model assessment

(4)ROC成功概率曲线法是区域地质灾害易发性评价精度检验且不受临界值约束的图形化方法。可直观准确地反映易发性从低到高，落在不同易发性区间内的滑坡数量(滑坡面积)的变化情况，其曲线下的面积AUC越大，表明模型成功率越高、预测效果越准确，具有很好的客观性和有效性。

(5)评价结果检验。评价计算结果显示组合1模型、组合2模型、组合3模型Kappa系数值分别为0.431、0.416、0.424。而运用Sridevi Jadi经验概率法的3种模型的预测结果精度分别为57.39%、54.07%、56.11%。以发生滑坡数量被正确预测的比例-易发性指数比累积曲线下面积法对检验样本的评价结果预测准确性进行检验，可得组合1模型、组合2模型、组合3模型的检验样本的被正确预测的准确率AUC值分别为0.946、0.826、0.897(图12)。

图12 3种组合模型滑坡易发性评价预测率ROC曲线Fig.12 The prediction rate ROC curves of landslide susceptibility assessment for the three models

3种评价结果检验显示，组合1模型预测精度和准确性要优于其它两组模型，主要是因为信息量模型能较好地处理多因子组合带来的复杂性和解决海量数据的差异性，再者研究区滑坡灾害点信息资料详细，能很好的适用自变量即可是连续的亦可是离散的逻辑回归模型，二者组合的模型评价结果与实际吻合度较高。

5 结论

(2)在评价指标状态分级划分过程中，根据各指标条件下的I值、CF值和Wf值曲线突变点，同时结合滑坡面积及分级面积频率曲线作为等级划分的临界值来确定因子分级状态。该方法同时适用于连续型和离散型两类指标，其本质是将对滑坡易发性相近区间进行组合，即充分考虑各因子状态对滑坡的差异性影响，又避免了对状态分级的主观性划分，体现了指标状态分级的多样性和合理性。

(3)通过对比3种模型的不同易发区内滑坡频率比，利用Sridevi Jadi经验概率法、Cohen′s Kappa系数法和ROC成功预测概率曲线法比较发现，组合1模型预测精度和准确性要优于其它两组模型，说明采用信息量和逻辑回归组合模型能够较为客观准确地对白龙江流域滑坡灾害易发性进行评价。

(4)研究区滑坡极高易发区主要分布白龙江两岸，尤其分布在两河口至桔柑乡段白龙江左岸区域。滑坡易发性受坪定～化马断裂控制作用明显，沿断裂带发育强烈；极高易发区多集中软弱千枚岩、炭质板岩组成志留系1段地层及由灰岩、千枚岩互层构成泥盆系6、7段，上覆残坡积层的易滑地层区。易发性评价结果可为地质灾害防治、国土空间规划及用途管制提供有效支撑。