基于CF与Logistic回归模型耦合的地质灾害易发性评价

2023-06-05 04:30张群冯辉贾三满张沁瑞贾磊
城市地质 2023年1期
关键词:易发隐患因子

张群 冯辉 贾三满 张沁瑞 贾磊

摘 要:在北京市大清河流域生态涵养区1450 km2的区域内,以遥感影像解译为基础,结合1∶50 000地质灾害详细调查,获取全区888个地质灾害隐患点作为样本数据库,选取基岩类型、地貌类型、地形坡度、河流、公路、断裂6个评价因子,采用确定性系数(CF)与Logistic回归耦合模型评价地质灾害易发性,依照自然间断点分级法(Jenks)将研究区划分为极高易发区、高易發区、中易发区、低易发区和极低易发区。将未参与模型训练的20%地质灾害隐患点作为检验点与易发性分区结果进行叠加分析,通过频率比和ROC曲线进行精度检验。结果显示:基岩类型对地质灾害的发育具有控制作用;公路、断裂对地质灾害的空间分布影响明显;CF与Logistic回归耦合模型在实际应用中具有较高的准确性,是一种地质灾害易发性评价可靠性高的模型。

关键词:地质灾害;易发性评价;确定性系数模型;Logistic回归模型;耦合模型:生态涵养区

Geologic hazards susceptibility assessment based on coupling of CF model and Logistic regression model in the ecological conservation area of the Daqinghe river watershed of Beijing

ZHANG Qun1, FENG Hui1, JIA Sanman1, ZHANG Qinrui1, JIA Lei2

(1.Beijing Institute of Ecological Geology, Beijing 100120, China;

2.Beijing Jingcheng Geological Exploration Co., Ltd., Beijing 102488, China)

Abstract: In the ecological conservation area of the Daqinghe river watershed of Beijing, 888 geological hazard points are selected as analysis samples in an area of 1450 km2 through interpreting the remote sensing map and conducting a detailed field investigation of geological hazards. Based on the relationship analysis between geological hazards distribution and 6 factors i.e. bedrock type, geomorphic type, slope gradient, drainage, highway and fracture, this paper adopts coupling of CF model and logistic regression model to determine the weight coefficient of each factor. Using the Jenks method, the study area is divided into areas with extremely high, high, moderate, low and extremely low hazards susceptibility. The susceptibility maps are validated and compared using the frequency ratio and ROC to represent respective success rates. The results indicate that the development of geological disasters is controlled by bedrock types and the geological distribution of the disasters is obviously influenced by highway and fracture. The coupling model of CF and logistic regression is highly rational, accurate and reliable in the evaluation of ecological hazard susceptibility.

Keywords: geological hazard; susceptibility assessment; certainty factor model; logistic regression model; coupling model; ecological conservation area

北京市生态涵养区包括门头沟区、平谷区、怀柔区、密云区、延庆区以及房山区和昌平区的山区,根据流域划分为大清河流域、潮白河和蓟运河流域、永定河和北运河流域,区内60%以上为山区(贾三满等,2019;张莉,2009;谢一鸣等,2018),地形复杂,生态功能脆弱(孙芳等,2018),在汛期通常容易发生崩塌、滑坡、泥石流等地质灾害。

地质灾害是指在自然因素或者人为活动的作用或影响下形成的自然灾害,包括滑坡、崩塌、泥石流、岩溶塌陷、踩空塌陷、地裂缝、地面沉降、不稳定斜坡。地质灾害易发区与其所处的地质环境、气象水文和人类活动等因素有着紧密的联系,因此在评价地质灾害易发性时,评价因子的选取应当综合考虑各类因素的影响(孟祥瑞等,2016;杨德宏等,2015)。

地质灾害易发性是指一定范围内由孕灾地质条件控制的地质灾害发生的可能性,通常采用统计模型方法以栅格单元开展易发性评价。常见的地质灾害易发性评价模型主要包括:层次分析模型(王哲等,2007)、综合指数模型(施成艳等,2016)、信息量模型(罗守敬等,2021)、多元线性回归模型(张超等,2016)、确定性系数模型(刘艳辉等,2015)、Logistic回归模型(黄健敏等,2016)、人工神经网络模型等(向喜琼等,2000)。在地质灾害易发性评价中,确定性系数模型(CF)与Logistic回归模型(LR)耦合的CF-LR模型相对于单一模型,预测成功率有所提高(程斌等,2021),能够较好地解决使用单一模型在地质灾害易发性分析中的不足,使评价结果更为精确合理。

本文以北京市大清河流域生态涵养区作为研究案例,以遥感影像解译为基础,结合野外地质灾害调查资料,选取基岩类型、地貌类型、地形坡度、河流、公路、断裂6个影响因子,采用确定性系数与Logistic回归耦合模型评价地质灾害易发性,为大清河流域生态涵养区的农业生产、防灾减灾工作提供了基础数据,为区内城镇建设适宜性评价中的灾害评价提供了修正依据。

1  研究区概况

大清河流域生态涵养区位于北京市西南部山区,华北平原与太行山脉的交界地带,地理坐标为东经115°25′~116°15′,北纬39°30′~39°55′,总面积1450 km2。地貌形态以山地为主,约占总面积的2/3,整体地势自西北向东南逐渐降低,阶梯明显(图1),地貌类型包括中山、低山、丘陵和平原。全区地层出露较完整,其中,中元古代碳酸盐地层最为发育、分布范围最广;西北侧发育有石炭—二叠纪煤系地层,大安山矿区、史家营矿区、宝儿水矿区均沿该煤矿带分布。区内属温带大陆性季风气候,夏季炎热多雨,冬季寒冷干燥,多年平均降雨量山区为644.1 mm,平原区为588.8 mm,降雨多集中在6—8月,占多年平均降雨量的80%以上,汛期多暴雨。区域内水系纵横,共有干、支河流10余条,途经区域多为中、低山区,是地质灾害的多发区。区内印支期、燕山期构造活动强烈,形成了一系列较大规模的褶皱构造及逆冲推覆断裂构造,南北向、东西向、北北东向断裂构造均有发育。

截至2018年底,大清河流域各类突发地质灾害隐患点共计888处,同比2017年增长8.4%,主要分布在西部山区。其中,崩塌隐患点427处,不稳定斜坡隐患点276处,泥石流隐患点146处,地面塌陷隐患点32 处,滑坡隐患点7处。区内突发地质灾害隐患类型齐全,崩塌灾害隐患数量最多,但险情多为小型,泥石流及地面塌陷隐患数量相对较少,但影响范围大、威胁人数多,危害较大。从威胁对象来看,主要以威胁群众人身安全和道路财产为主。同年8月,区内大安山乡军红路(X209)K18+350 m处发生的崩塌灾害,造成军红路双向阻塞,落石砸毁道路路面、路基及护栏,被毁路段长约80 m,严重影响大安山乡村民出行安全,频发的地质灾害严重威胁到区内人民生命和财产安全。

2  研究方法

2.1  数据来源

本次研究的基础数据主要来源于“北京生态涵养地区地质环境综合调查”项目的遥感解译资料以及“北京市突发地质灾害应急调查技术服务”(2018年)项目的突发地质灾害应急调查统计数据,共888个地质灾害隐患点(图1)。地质灾害易发性评价指标因子的基础数据有大清河流域生态涵养区地形地貌数据、地质构造数据和水文交通数据3类,主要数据来源见表1。

2.2  指标因子选取与分级

2.2.1  基岩类型

地层的岩性是地质灾害发生的物质基础,基岩在空间上的展布还会对地质灾害发育的分布起到一定的约束。不同的岩性硬度不同,对各类地质灾害的影响也有差异,软岩或者软硬互层的地层中易发生滑坡,硬质岩发育的地层通常容易发生崩塌(马思顺等,2017)。通过对地层岩性硬度大小的划分,结合不同地层岩性的空间分布特征,本次将区内基岩类型划分出5大类:页岩和砂岩、火山碎屑岩、碳酸盐岩、花岗岩以及第三纪、第四纪松散堆积物(图2-a)。

2.2.2  地貌类型

地貌类型的变化对地质灾害发育的影响主要体现在2个方面,一是区域内的降雨量、温度、植被以及岩石风化程度的變化与地貌有着密不可分的联系;二是地貌的变化通常会伴随着高程的改变,随着高程的增加,地貌周围的自然环境会变得越发恶劣,人类活动随之减弱(马思顺,2018)。一般情况下,低山地区更容易发生地质灾害(张刘柱等,2019)。从地质灾害隐患点与地貌类型的空间分布特征出发,考虑到区内碳酸盐岩广泛分布,岩溶作用发育,本次将地貌共划分出8种类型:岩溶中山、岩溶低山、岩溶丘陵、中山、低山、丘陵、平原、河谷平原(图2-b)。

2.2.3  地形坡度

地形坡度是影响地质灾害形成和发育的主要因素,尤其是对滑坡、崩塌这类斜坡地质灾害。坡度的大小不仅在一定程度上确定了斜坡变形破坏的形式与机制,同时还影响着斜坡的稳定性,随着坡度的逐渐增大,斜坡的稳定性逐渐降低(田春山等,2016)。通过研究区的DEM数据,利用ArcGIS表面分析功能提取得到坡度数值,根据地质灾害隐患点的数量与地形坡度之间的统计分析可知,隐患点主要集中在坡度为15~35°的区域内,本次将坡度划分为5个等级:≤2°,>2~5°,>5~15°,>15~35°,>35°(图2-c)。

2.2.4  河流

山区地势起伏,河流对边坡的侵蚀、冲刷作用强烈,致使地质灾害与河流的关系比较密切。此外,山区河流两侧通常为交通要道,人类工程活动加剧了斜坡的不稳定(杨迎冬等,2021)。本文以200 m作为间距对河流做多缓冲分析,根据距离河流的远近,将其分为6 类:≤200 m,>200~400 m,>400~600 m,>600~800 m,>800~1 000 m,>1 000 m(图2-d)。

2.2.5  公路

道路交通是典型的人类工程活动,是地质灾害发生的诱发因素之一。在公路施工过程中,坡体内部应力发生改变,稳定性下降;外部边坡临空面积增大,加剧了地质灾害的发生(刘任鸿等,2021)。通过ArcGIS的多环缓冲区工具对区内主要的公路建立多环缓冲区,并根据距离公路的远近,将其分为6类:≤200 m,>200~400 m,>400~600 m,>600~800 m,>800~1 000 m,>1 000 m(图2-e)。

2.2.6  断裂

断裂构造通常与地质灾害的发育密切相关,其直接影响主断面及周边的岩体致其破碎,降低边坡的稳定性,为地质灾害的形成和发育提供了构造条件。此外,破碎带局部发育的软弱面或者软弱带岩体强度较低,透水性较强,在降雨条件下易发生各类地质灾害(贺小黑等,2017)。通过ArcGIS的多环缓冲区工具对区内主要的断裂建立多环缓冲区,并根据距离断裂的远近,将其分为6类:≤900 m,>900~1 500 m,>1 500~1 900 m,>1 900~2 400 m,>2 400~3 900 m,>3 900 m(图2-f)。

3  地质灾害易发性评价

采用确定性系数与Logistic回归耦合模型对北京市大清河流域生态涵养区进行地质灾害易发性评价,首先通过确定性系数模型计算不同评价因子的各分类级别的CF值,然后将各分类级别的CF值作为协变量,将是否发生地质灾害作为因变量,导入SPSS 21.0软件中进行二元Logistic回归分析,将分析结果中得到的各评价因子的回归系数(B)作为该因子的权重,再对各评价因子之间的独立性进行验证,将符合条件的因子作为变量代入逻辑回归方程中计算出各评价单元的地质灾害发生概率,最终通过自然间断点分级法(Jenks)对运算结果进行分级,从而得到北京市大清河流域生态涵养区地质灾害的易发性分区。具体计算步骤如下:

1)  评价因子的各分类级别的CF值计算

通过将各评价因子的不同分类级别与区内888处地质灾害隐患点进行空间叠加处理,计算不同评价因子的各分类级别的CF值。CF计算公式为:

式中:PPa为影响因子a中存在的地质灾害隐患点的个数与影响因子a的面积二者的比值;PPs为区内地质灾害隐患点的总数与研究区面积的比值,代表地质灾害在区内发生的先验概率。

由式(1)可知,当CF值大于0时,表示在该影响因子下容易发生地质灾害,且CF值越大代表地质灾害越容易发生。通过计算得出的CF值,不仅可以反映各分类级别在同一评价因子下的相对重要程度,还可以与不同评价因子下的各分类级别进行对比(刘璐瑶等,2021)。评价因子各分类级别的CF值见表2。

2)  评价因子权重值的计算

结合数据精度,本文将100 m × 100 m的单元格作为基本研究对象,共得到146 718个独立的评价单元。随机选取地质灾害隐患点中的80%作为训练样本(即随机选取710个历史地质灾害隐患点),相应地随机选取710个非地质灾害隐患点共同组成本次评价的统计样本。利用SPSS 21.0软件进行二元Logistic回归分析,结果见表3。

在地质灾害易发性评价过程中,回归系数B代表各评价因子的权重大小,sig值代表显著性,当sig<0.05时,回归系数具有统计学意义。从回归分析结果中可以看出,本次选择的6项评价因子的sig值均小于0.05,表明选择的各评价因子均通过检验,可以写入方程,其中权重大小依次为基岩类型、断裂、公路、地貌类型、地形坡度和河流。

为了确保选择的各评价因子的合理性,需要对各因子进行相关性分析,各评价因子之间的相关矩阵见表4。从表4可以看出,各评价因子之间的相关系数都小于0.3,属于弱相关,均可以写入模型。

将回归分析结果中各项因子的回归系数代入Logistic回归公式,可得下式:

式中:Y为累计分布函数;P为发生地质灾害概率,值为0~1;x1为基岩类型的CF值;x2為地貌类型的CF值;x3为坡度中各分类级别的CF值;x4为河流的CF值;x5为公路的CF值;x6为断裂的CF值。

根据式(2)可以计算出各评价单元地质灾害发生的概率P,将所得结果按照自然间断点分级法(Jenks)进行分区,由于四分区的结果显示各易发区的面积基本相同,无法满足后续评价,故本次共划分出地质灾害极高易发区、高易发区、中易发区、低易发区和极低易发区5类,得到地质灾害易发性分区,见图3。

4  结果与检验

4.1  易发性评价结果

通过评价因子的回归系数B和其各分类级别的CF值乘积可以看出:地质灾害主要发生在低山,坡度为0.5~2°,距河流和公路200 m内,距断裂900 m内的区域。这些低山区域地势较平缓,人类工程活动频繁(多为山区公路的开挖、开凿),易受河流冲刷、掏蚀,斜坡的不稳定性大大增加,地质灾害易发程度明显上升。同时,断裂与软弱层(页岩、砂岩)的发育为地质灾害的发生提供了构造条件和物质基础。

从各易发性等级分布状况来看,北京市大清河流域生态涵养区地质灾害极高易发区和高易发区主要呈西北-东南向的条带状展布,约占区内总面积的21%;极低易发区和低易发区主要分布在西北部的中山地区以及东部平原地区,约占区内总面积的57%。

4.2  合理性和精确性检验

为确保本次地质灾害易发性分区能够较为准确真实地反映实际情况,需要检验评价结果的合理性和精确性。其中,合理性依据各易发区内地质灾害隐患点的分布数量来进行检验;精确性依据接受者操作特征曲线(ROC曲线)来进行检验。

将未参与模型训练的178个地质灾害隐患点(占总样本的20%)作为检验点与易发性分区结果进行叠加分析,得到分析结果,见表5。检验结果显示,共有108 个检验点(占总检验点的60.68%)落在地质灾害极高易发区和高易发区(占区内总面积的21.67%);38个检验点(占总检验点的21.35%)落在地质灾害低易发区和极低易发区(占区内总面积的58.22%)。随着地质灾害易发性由高到低,栅格比逐渐增大,地质灾害隐患点比与频率比均逐渐减小,评价结果与实际情况相符合。

ROC曲线是一种评价分类有效性的图形化方法,其中横坐标是伪阳性率(也称1-特异性),纵坐标是真阳性率(也称敏感度),绘制的曲线下方面积(AUC)常被用来评价模型的精度,AUC值越大,模型的精度越高。将评价数据导入SPSS 21.0软件中绘制ROC曲线(图4),其中纵坐标敏感度为发生地质灾害的单元被正确预测的比例,横坐标特异性为未发生地质灾害单元被正确预测的比例(李剑锋等,2021)。运用SPSS软件计算AUC的值为0.773,说明本次CF与Logistic回归耦合模型能够较为精确客观地评价北京市大清河流域生态涵养区地质灾害易发性。

4.3  评价结果检验

本次参与评价的各项数据均来源于2018年项目成果资料。为更加直观地研判模型在实际应用中的预测效果,本次研究将新增突发地质灾害隐患点(2019—2020年)与地质灾害易发性分区图进行空间叠加分析。

2019—2020年,北京市突发地质灾害应急调查技术服务在房山、门头沟、丰台区累计开展应急调查工作29次,判定新增地质灾害隐患点27个,其中落在本次研究区内的地质灾害隐患点共计23处。将新增突发地质灾害隐患点与易发性分区进行叠加统计(图5、表6),共有19个地质灾害隐患点(占总检验点的82.61%)落在地质灾害极高易发区和高易发区,仅4个地质灾害隐患点落在其他易发区,说明本次易发性分区在实际应用中具有良好的指导意义。

5  结论

1)采用确定性系数与Logistic回归耦合模型,对北京市大清河流域生态涵养区地质灾害易发性程度进行评价。通过确定性系数模型计算评价因子的各分类级别的CF值,解决了Logistic回归模型中对评价因子进行处理时的主观因素;通过Logistic回归模型能够很好地确定各评价因子之间的相对权重,揭示了不同评价因子对地质灾害易发程度的影响差异。通过二者的耦合模型能够客观地计算出各评价因子的权重以及各评价因子分类级别的权重,避免了主观因素对权重计算的影响。

2)从选取的基岩类型、地貌类型、地形坡度、河流、公路、断裂6个评价因子的CF值和回归系数可以看出,基岩类型、断裂和公路3个因子对北京市大清河流域生态涵养区地质灾害易发性影响较大,特别是在距断裂900 m内、距公路0~200 m内以及页岩和砂岩地区,这些地区是最易诱发地质灾害的。

3)依据确定性系数与Logistic回归耦合模型下地质灾害易发性分区结果,将北京市大清河流域生态涵养区划分为极高易发区、高易发区、中易发区、低易发区和极低易发区。其中,极高易发区和高易发区主要呈西北-东南向的条带状展布,受河流、公路、断裂分布影响明显,约占区内总面积的22%;极低易发区和低易发区主要分布在西北部的中山地区以及东部平原区,约占区内总面积的58%。

4)采用随机选取的未参与模型训练的178个地质灾害隐患点落在各易发性分区的频率比和ROC曲线,分别对分区结果的合理性和精确性进行检验。其中,地质灾害易发性分区的频率比从极低易发区到极高易发区显著增大,ROC曲线的AUC值达到0.773,说明分区结果合理,模型评价精度较高。由此可知,确定性系数与Logistic回归耦合模型能够较为合理、准确地对北京市大清河流域生态涵养区地质灾害易发性进行评价。

参考文献

程斌,杨根兰,覃乙根,黄凯杰,史文兵,易庆波,吴运武,2021. 基于CF-LR模型的典型红层地区地灾易发性评价:以赤水市为例[J/OL]. 河南理工大学学报(自然科学版):1-14[2023-01-28]. http://kns.cnki.net/kcms/detail/41.1384.n.20211117.1053.002.html.

黄健敏,赵国红,廖芸婧,何朝阳,2016. 基于Logistic回归的降雨诱发区域地质灾害易发性区划及预报模型建立:以安徽歙县为例[J].中国地质灾害与防治学报,27(3):98-105.

贺小黑,谭建民,裴来政,2017.断层对地质灾害的影响:以安化地区为例[J].中国地质灾害与防治学报,28(3):150-155.

贾三满,张群,路璐,2019.北京大清河流域生态涵养区生态环境敏感性评价[J].城市地质,14(3):1-6.

李剑锋,芦艳丽,邹治亮,2021.确定性系数法的海城市地质灾害易发性评价[J].首都师范大学学报(自然科学版),42(4):62-68.

刘璐瑶,高惠瑛,李照,2021.基于CF與Logistic回归模型耦合的永嘉县滑坡易发性评价[J].中国海洋大学学报(自然科学版),51(10):121-129.

刘任鸿,李明辉,邓英尔,朱华平,黄勇,胡淑杰,2021.基于GIS的华蓥市地质灾害易发性评价[J].沉积与特提斯地质,41(1):129-136.

罗守敬,王珊珊,付德荃,2021.北京山区突发性地质灾害易发性评价[J].中国地质灾害与防治学报,32(4):126-133.

刘艳辉,刘传正,唐灿,温铭生,连建发,2015.基于确定性系数模型的地质灾害多因子权重计算方法[J].中国地质灾害与防治学报,26(1):92-97.

马思顺,陈志雄,王瑞雪,常琳,2017.遥感技术在地质灾害调查中的应用[J].地质灾害与环境保护,28(4):80-86.

马思顺,2018.基于遥感对云南省牟定县地质灾害易发性评价研究[D].昆明理工大学.

孟祥瑞,裴向军,刘清华,张雄,胡云华,2016.GIS支持下基于因子分析法的都汶路沿线地质灾害易发性评价[J].中国地质灾害与防治学报,27(3):106-115.

施成艳,鹿献章,刘中刚,2016.基于GIS的安徽黄山市徽州区地质灾害易发性区划[J].中国地质灾害与防治学报,27(1):136-140.

孙芳,韩江雪,王馨玮,王怡然,2018.京津冀生态涵养区生态与产业协调发展影响因素分析[J].中国农业资源与区划,39(5):68-76.

田春山,刘希林,汪佳,2016.基于CF和Logistic回归模型的广东省地质灾害易发性评价[J].水文地质工程地质,43(6):154-161+170.

王哲,易发成,2007.基于层次分析法的绵阳市地质灾害易发性评价[J].水文地质工程地质(3):93-98.

向喜琼,黄润秋,2000.基于GIS的人工神经网络模型在地质灾害危险性区划中的应用[J].中国地质灾害与防治学报(3):26-30.

谢一鸣,陈怩,张彩虹,蔡飞,赵陟峰,贾子靖,2018.生态涵养区农民人均纯收入格局时空演变分析:以北京市怀柔区为例[J].林业经济,40(3):107-112.

杨德宏,范文,2015.基于ArcGIS的地质灾害易发性分区评价:以旬阳县为例[J].中国地质灾害与防治学报,26(4):82-86+93.

杨迎冬,晏祥省,王宇,汤沛,魏蕾,赵鹏,黄成,2021.云南省地质灾害特征及形成规律研究[J].灾害学,36(3):131-139.

张超,陈艳,张宇飞,孙秀娟,2016.基于多元线性回归模型的云南昭通地质灾害易发性评价[J].水文地质工程地质,43(3):159-163.

张莉,2009.北京市生态涵养发展区的功能类型划分及发展对策[J].经济地理,29(6):989-994.

张刘柱,陈雪梅,郑立博,席恺,李宗洋,2019.易发程度指数法在宣州区地质灾害易发区划分中的应用研究[J].地质灾害与环境保护,30(2):92-96.

收稿日期:2022-08-25;修回日期:2022-11-08

基金项目:北京政府公益性项目“北京生态涵养地区地质环境综合调查”(PXM2018-158307-000005)资助

第一作者簡介:张群(1991- ),男,硕士,工程师,主要从事环境地质、地质灾害防治工作。E-mail:qiguanyou@163.com

引用格式:张群,冯辉,贾三满,张沁瑞,贾磊,2023.基于CF与Logistic回归模型耦合的地质灾害易发性评价[J].城市地质,18(1):17-25

猜你喜欢
易发隐患因子
隐患随手拍
隐患随手拍
互联网安全隐患知多少?
隐患随手拍
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
因子von Neumann代数上的非线性ξ-Jordan*-三重可导映射
冬季鸡肠炎易发 科学防治有方法
一些关于无穷多个素因子的问题