基于CF与Logistic回归模型耦合的永嘉县滑坡易发性评价*

2021-10-11 02:30刘璐瑶高惠瑛
关键词:永嘉县易发滑坡

刘璐瑶,高惠瑛**,李 照

(1.中国海洋大学工程学院,山东 青岛 266100;2.中国海洋大学城市与工程管理信息化山东高校重点实验室,山东 青岛 266100)

中国地质环境脆弱、地理条件复杂,是地质灾害多发的国家之一。滑坡灾害作为主要的地质灾害之一,具有分布范围广、发生频率高、灾害损失严重等特点。浙江省永嘉县具有独特的地形地貌条件、水文地质环境以及地理位置,在降雨因素的诱发下,极易发生滑坡灾害,仅在2019年8月10日利奇马台风期间,发生的山体滑坡就造成了27人死亡,5人失联的严重人员伤亡。故在研究该地区孕灾环境的基础上,开展滑坡易发性评价对当地防灾减灾、土地利用规划具有十分重要的参考价值[1]。

近年来,随着地理信息系统的发展,区域地质灾害评价模型日渐完善,从过去的直接地形地貌地质制图、基于专家经验定性分析发展到现在的统计模型及机器学习的定量分析[2]。目前,常用的滑坡易发性评价模型主要有:层次分析法、信息量模型、Logistic回归模型、证据权模型、确定性系数模型、决策树、随机森林、BP神经网络、支持向量机等[3-4]。国外学者,Guillard C等[5]对葡萄牙卢尔斯市进行了滑坡灾害易发性评估研究,基于GIS数据库,以栅格单元为基础,采用基于统计分析的信息量法对特定的地形单元进行了滑坡易发性评估。Zhang K等[6]将机器学习与遥感和GIS技术结合,基于地形、地质、水文、土地覆盖与环境触发因素,采用随机森林模型对三峡地区进行滑坡灾害易发性制图,并与决策树模型的评价结果进行比较,结果表明,随机森林具有更高的精确度,其评价结果与实际情况更加吻合。Bahareh 等[7]采用坡度、坡向、高程、曲率、地形湿度指数、距河流的距离、距断层的距离、土地利用、岩性等因子,利用支持向量机、逻辑回归、人工神经网络方法对伊朗马赞达兰省萨里县多丹格河流域的滑坡易发性进行了分析,分析表明,逻辑回归模型对多丹格河流域的滑坡易发性分析的精度比支持向量机、人工神经网络的精度高。国内学者,沈玲玲等[8]用Shannon熵对信息量模型进行改进,并与模糊逻辑模型进行比较,对甘肃岷县地震滑坡进行了易发性研究评价。武雪玲等[9]通过融合多源数据以选取孕灾环境与诱发因子为评价指标,采用PSO-SVM模型,定性预测滑坡易发性,并通过对网格单元与对象单元的易发性预测精度进行分类精度比较,得到与野外调查一致的预测结果。

确定性系数模型原理简单、操作性强、易于实现,能够进行一级评价因子各分类级别对滑坡灾害的影响大小的评价,故可进行影响因素的内部比较[2-3];Logistic回归模型能够根据不同因子与灾害点之间的关系,确定各因子的权重。二者的耦合模型解决指标因子权重确定及不同因子分类级别的权重计算问题,以实现各评价单元滑坡易发性概率的计算[10]。故本文采用确定性系数与Logistic回归耦合模型,选取高程、坡度、坡向、距水系距离、距道路距离、距断层距离、地质岩性与NDVI八个评价因子开展永嘉县滑坡灾害易发性评价,制作其易发性区划图,为当地防灾减灾工作提供参考。

1 研究区概况

永嘉县位于浙江省东南部,地理坐标为东经120°19′34″—120°59′19″,北纬28°01′08″—28°36′54″,总面积为2 674.3 km2(见图1)。该地区属亚热带季风气候,四季分明,雨量充沛,雨热同步,年均气温19.6 ℃,多年平均降雨量为1 743.9 mm。其中,楠溪江是贯穿全县的水系,流域总面积达2 489.97 km2。县域内地势南低北高,分布有中山、低山、丘陵及河谷平原四种地貌。境内NE向、NW向断裂最为发育,如NE向温州—镇海大断裂、永嘉—黄岩大断裂,NW向淳安—温州断裂[11]。区内岩脉发育,断裂分布,岩石破碎;出露的地层以早白垩世和晚侏罗世的火山岩、火山沉积岩为主;第四纪的冲积物、洪积物主要分布在河流两岸及沟谷地带;局部出露小范围的早二叠世变质岩——芝溪头杂岩。同时,该区位于亚热带常绿阔叶林区,分布多为次生林及人工幼林,森林覆盖率约为77.27%[11]。

图1 研究区概况图Fig.1 Overview of the study area

永嘉县主要发育有滑坡、崩塌、泥石流及斜坡等地质灾害。从地域上看,整个研究区均分布有地质灾害,且分布密度自北向南逐渐增大[11];从地形上看,主要分布在海拔较低、坡度较缓的县域南部地区;从水文地质环境上看,历史灾害点主要分布在河流沿岸的断层密集区。由此可见,频繁的人类工程活动、软弱的地质岩组及河流切坡均可能导致滑坡灾害发生,造成严重的灾情事故,威胁人民生命与财产安全[12]。

2 研究方法

2.1 数据来源

本次研究的基础数据主要来源于遥感、规划与统计三个方面[13],其中滑坡历史灾害点的数据来源于中国科学院资源环境科学数据中心,共包含203个灾害点数据。滑坡易发性评价指标因子的基础数据有永嘉县DEM(Digital Elevation Model,数字高程模型,简称DEM)数据、地质数据、水文交通和归一化植被指数(Normalized Difference Vegetation Index,简称NDVI)数据4类,主要来源见表1。

表1 数据来源Table 1 Sources of data

2.2 指标因子选取与分级

指标因子的选取需与滑坡灾害的发生有密切关系[14],故对浙江永嘉县的滑坡灾害发育特征及时空分布规律进行分析,选择合适的孕灾环境因子作为滑坡易发性评价的指标因子。

通过研究发现:不同的高程范围内,植被覆盖率、降雨量及人类工程活动强度均具有明显差异性,直接或间接地影响着滑坡灾害的发生[14-15];坡度的大小则影响着地表松散岩土体发生位移形成滑坡灾害的可能性,影响着坡体应力分布、地表径流及地下水补给、排泄等情况[2,12];不同的坡向,植被类型、覆盖率、降雨量、蒸发量的大小的不同,影响着斜坡体的稳定性[12,14-15]。河流对斜坡坡脚的冲刷、掏蚀,改变了坡体的形态结构,使得边坡的临空面增大,为滑坡的发生提供了诱发条件[12,14-15];道路交通是研究区内最具代表性的人类工程活动,道路的修建通过切坡、开挖边坡实现,这改变了坡体的应力状态,使得边坡临空面积增大,加剧了滑坡发生可能[16]。断层导致了岩体破碎,致使边坡自稳性下降,形成了有利于滑坡灾害形成和发育的构造条件;出露的地层为滑坡的发生提供了物质基础[17],不同性质的岩石坚硬程度不同、抗剪能力不同,对于滑坡失稳变形的影响不同,对滑坡的影响程度也不同[2,15]。与此同时,越来越多的学者把归一化植被指数(NDVI)看作用来描述土地覆盖类型特征影响滑坡灾害发生的一个指标因子[2],不同的植被覆盖率下,人类活动密集程度、地表蒸发量、植被根茎根固程度有所不同,对滑坡灾害的影响程度不同[16]。

根据以上分析,选取高程、坡度、坡向、距水系距离、距道路距离、距断层距离、地层岩性、NDVI八个评价因子构成本次滑坡易发性评价的指标体系。为进一步研究各评价因子对滑坡发生的影响,在前人的研究基础上,根据滑坡发生的特点和分布规律[1],且结合研究尺度和研究区的实际情况[2],对各因子进行分级处理(见图2)。

图2 评价因子分级图Fig.2 Classification maps of assessment factors

2.3 滑坡易发性评价

本文对浙江省永嘉县开展滑坡易发性评价,基于上节对各评价因子的分类级别处理,首先采用确定性系数模型计算出各评价因子各分类级别的权重值,即CF值。然后各因子分类级别的CF值作为自变量,将是否发生滑坡灾害(“1”代表滑坡灾害发生,“0”表示滑坡灾害未发生)作为因变量[18],导入SPSS 25.0软件中进行二元Logistic回归分析,以得到各评价因子的回归系数即因子之间的权重。基于GIS平台计算得到各评价单元的滑坡发生概率,最终运用自然间断点法实现研究区滑坡灾害易发性区划[1,18]。本文选取的基本栅格单元大小为30 m×30 m,对各评价因子栅格图层进行重采样[19],与之匹配进行分析。

(1)评价因子各分类级别CF值计算

通过对各个评价因子进行分类级别处理,与203个历史滑坡灾害点进行叠加处理,分析滑坡灾害点在各评价因子不同分类级别中的分布情况,根据下式:

(1)

计算出评价因子各分类级别的CF值,即权重值。该权重可实现评价因子内部各分类级别之间的重要性比较,也可实现不同评价因子各分类级别之间的比较[2,10]。评价因子各分类级别的CF值见表2。

表2 各评价因子分类级别的CF值Table 2 Values of CF for different classes of assessment factors

(2)评价因子权重值的计算

本文采用的评价单元为30 m×30 m的栅格单元,通过GIS的重采样功能[15],共计得到2 976 478个独立的评价单元。随机选取203个非灾害点,与同等数量的历史灾害点构成永嘉县滑坡灾害易发性评价的统计样本。其中,406个样本点8个评价因子的CF值为自变量,滑坡发生与否为因变量(“1”代表滑坡灾害发生,“0”代表滑坡灾害未发生)[18]。运用GIS的多值提取至点功能,依次提取各样本点的CF值,并将提取的样本值导入至SPSS 25.0中进行二元Logistic回归分析,结果见表3。

表3 Logistic回归分析结果Table 3 Results of logistic regression analysis

在滑坡灾害易发性评价过程中,回归系数B代表各指标因子的权重[2,18],每个变量在方程的重要性可以通过比较sig值(显著性)的大小来判断,当sig<0.05时,变量具有统计意义[20]。回归结果显示,高程、坡度、坡向等8个评价因子的sig均小于0.05,说明8个指标因子的回归系数在误差允许的范围内是准确的,耦合模型得到的各因子权重由大到小分别是:距断层距离、坡度、高程、坡向、NDVI、地层岩组、距河流距离和距道路距离。

(3)各因子独立性检验

变量之间存在高度相关性会使模型估计失真或难以估计准确[10],故为使所选的评价因子更加合理,需要对各因子进行独立性检验,剔除相关性较大的评价因子[2]。各评价因子的相关系数矩阵见表4。

表4 评价因子相关系数矩阵Table 4 Correlation matrix of assessment factors

由表4可知,各评价因子之间的相关系数均小于0.3,根据胡燕等对相关性大小的划分标准[21],相关性系数小于0.3时,所选因子之间的相关性较小,故8个评价因子均可进入模型。

(4)易发性评价计算与区划

根据计算所得的各因子回归系数,结合Logistic回归公式,可得下式:

(2)

式中:P为滑坡灾害发生的概率值,x1~x8为各评价因子的CF值。根据式(2),利用GIS的栅格计算功能[1,4],得到每个评价单元的滑坡发生概率P,采用自然间断点分级法[1,18],将研究区易发性划分为极高易发区、高易发区、中易发区、低易发区、极低易发区5类,见图3。

图3 研究区滑坡易发性分区图Fig.3 Landslide susceptibility map of study area

3 结果与检验

3.1 易发性评价结果分析

根据确定性系数模型与Logistic回归模型的计算过程及研究区易发性分区图,可以得出:

(1)从各评价因子的回归系数及各分类级别的CF值,可以看出:滑坡灾害主要发生在高程0~100 m,坡度5°~10°,距河流和道路距离400 m内的区域,该区域地势平缓、人类工程活动密切,受河流冲刷、掏蚀及道路开挖、开凿的影响,使得斜坡的临界面大大增加,滑坡灾害易发性明显提高。同时,断层的密集分布与软弱的芝溪头杂岩、高坞组等为滑坡灾害的发生提供了丰富的物质来源与充足的物质基础。

(2)从永嘉县的易发性分区图,可以看出:极高易发区与极高易发区主要分布在永嘉县的南部地区,并沿河流和道路向北分布,约占县域面积的28%;极低易发区和低易发区主要分布在县域地北部区域,该区域海拔高、坡度陡,人类工程活动稀少,约占研究区总面积的55%。

3.2 合理性与精度评价

本文采用历史滑坡点落在各等级易发区的比例对易发性分区的合理性进行检验[2,12],采用受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)对模型评价精度进行检验[2-3,12]。

将历史滑坡点与易发性分区结果进行叠加分析[2-3],得到分析结果,见表5。检验结果显示,有74.88%的历史滑坡点落在极高易发区和高易发区的范围内,而二者的栅格数量占总栅格数量的28.03%;分别有4.93%和5.42%的历史滑坡点落在占研究区总栅格数量32.41%和22.59%的极低易发区和低易发区内;且随着易发性由低到高,栅格比逐渐减小,滑坡比与频率比均逐步增加,这均符合实际情况,由此说明易发性区划结果是合理的[2]。若用历史滑坡点落在较高易发区域内的比例表征精度[12],则本研究的预测精度达74.88%。

表5 耦合模型易发性分区结果Table 5 Susceptibility zoning results of coupling model

再进一步采用ROC曲线对耦合模型的评价精度进行检验。以滑坡灾害单元被正确预测的比例(真阳性率,也称敏感度)为纵坐标,以未发生滑坡单元被正确预测的比例(假阳性率,也称1-特异性)为横坐标绘制曲线[2-3],ROC曲线越靠近左上角,曲线下的面积(Area Under the Curve,AUC)越大,模型的准确率越高[1,3]。耦合模型的ROC曲线如图4所示,AUC值为0.814,说明确定性系数与Logistic回归耦合模型能够较为准确客观地对浙江省永嘉县滑坡易发性进行评价。

图4 耦合模型的ROC曲线Fig.4 ROC curve of coupling model

4 结论

(1)本文采用了确定性系数和Logistic回归耦合模型对浙江省永嘉县开展了滑坡易发性评价。确定性系数模型通过计算评价因子各分类级别的CF值,客观地揭示了评价因子各分类级别与滑坡灾害发育的关系,避免了人为主观的不合理赋值情况;Logistic回归模型通过计算各评价因子间的权重,客观地揭示了不同评价因子对滑坡作用的影响程度差异。二者的耦合模型实现了各因子权重和各因子分类级别权重的客观计算,避免了主观因素对权重评估的干扰。

(2)基于前人研究成果,从地形地貌、地质构造、水文交通、其他因子等方面,选取高程、坡度、坡向、距水系距离、距道路距离、距断层距离、地层岩组及NDVI 8个评价因子,采用了确定性系数与Logistic回归耦合模型,对永嘉县开展滑坡易发性区划研究。其中,距断层距离、坡度、高程、坡向、NDVI这5个因子对研究区滑坡易发性影响相对较大。

(3)根据耦合模型下滑坡易发性区划结果,将研究区划分为极高易发区、高易发区、中易发区、低易发区和极低易发区。并将滑坡点与分区图叠加分析,发现分区图与研究区实际情况较为一致。其中极高易发区和高易发区主要分布在县域南部,并沿河流、道路、断层相对发育;极低易发区和低易发区主要分布在研究区北部海拔高、坡度陡峭的区域。

(4)通过采用历史滑坡点落在各易发性分区的比例与ROC曲线分别对分区结果合理性和耦合模型评价精度进行了检验。有74.88%的滑坡点落在极高易发区和高易发区范围内,且ROC曲线的AUC值达到为0.814,说明分区结果合理,模型评价精度较高。由此可知,确定性系数和Logistic回归耦合模型能够客观准确地实现永嘉县滑坡灾害易发性评价,且能在滑坡易发性及其风险评价工作中起到一定的作用。

猜你喜欢
永嘉县易发滑坡
2001~2016年香港滑坡与降雨的时序特征
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
冬季鸡肠炎易发 科学防治有方法
【文学社巡礼】浙江省永嘉县上塘城关中学鹅浦文学社
永嘉县中学生闲暇体育现状调查
浙江省永嘉县旅游融合发展思考
浙江省永嘉县旅游融合发展思考
浅谈公路滑坡治理