基于GIS 和CF-Logistic 回归模型地质灾害易发性评价:以青海湟中县为例

2024-01-05 05:59张晓博刘宝山
沉积与特提斯地质 2023年4期
关键词:岩组易发滑坡

张晓博,周 萍,张 焜,张 兴,刘宝山,邓 辉*

(1.青海省地质调查院,青海省青藏高原北部地质过程与矿产资源重点实验室,青海 西宁 810012;2.成都理工大学地球科学学院,四川 成都 610059;3.自然资源青海卫星应用技术中心,青海 西宁 810012)

0 引言

在地球自身运动或者人类的工程实践等因素的影响下,发生的危害人类生命财产、生产生活活动或破坏人类赖以生存与发展的资源与环境的地质事件被称为地质灾害。中国是全球地质灾害高发区之一,地质灾害不但会严重破坏该区域的生态环境,而且还会严重威胁人类的生命财产安全。近年来,国内外众多学者对地质灾害易发性评价模型进行了深入研究,并取得了丰硕成果。贺鹏等(2016)利用层次分析法对西藏札达地区重大滑坡灾害进行易发性评价;洪增林等(2020)利用主成分分析法对榆神府地区进行地质灾害危险性分级评估;向喜琼和黄润秋(2000)运用人工神经网络的方法,结合GIS 对长江三峡示范区(巴东—新滩)地区的地质灾害进行了危险性区划;饶品增等(2017)利用地理加权回归模型对云南省地质灾害进行易发性评价;胡凯衡等(2012)采用聚类分析和最大似然法对汶川重灾区震后地质灾害进行易发性评价;沈玲玲等(2016)应用模糊逻辑法、信息量模型及熵改进的信息量模型,对岷县地震诱发的滑坡灾害进行了易发性评价;刘艳芳等(2014)基于确定性系数分析方法对秭归县滑坡灾害进行易发性评价;覃乙根(2020)等采用确定性模型和Logistic 回归模型两种模型耦合的方法对贵州省开阳县的地质灾害易发性进行评价。各项研究表明,多模型耦合在评价精度、合理性等方面比单一模型具有更明显的优越性。

东接青藏高原,西连黄土高原,地处二者结合部的湟中县生态环境极为脆弱,而青藏高原独特的地质构造以及湟中县所处地段的特殊性,使得此处外力地质作用极易形成并诱发各种地质灾害。由外力地质作用所诱发的灾害现象主要包括崩塌、滑坡、泥石流、不稳定斜坡等。本研究区地处青海省东部,人口密集。该区域的人类工程经济活动强烈,导致湟水河谷及其较大支沟谷与丘陵交接部位地质灾害频繁发生,形成这一地区最为严重的环境地质问题。本文结合湟中县地质灾害的空间分布状况,共选取高程、坡度、坡向、地形起伏度、工程地质岩组,以及断裂距离、距水系距离7 个地质灾害孕灾因子,并运用CF 模型和Logistic 回归模型对研究区内的地质灾害易发性进行分析,最终得到湟中县地质灾害易发性分级图。合理判断湟中县地质灾害的易发程度,可以有效地规避地质灾害发生的风险,同时可以为该区域的地质灾害防治与管理提供可靠的科学理论依据(陈绪钰等,2019)。

1 研究区概况

本研究以青海省西宁市湟中县(以下简称湟中县)为研究区域。该研究区地处青海省东部,地理坐标为36°13'32″~37°03'19″N,101°09'32″~101°54'50″E,总面积达2 570 km2。湟中县西起扎麻隆峡口,东至小南川,北起娘娘山,南至拉脊山,总体地势呈东西走向,海拔向东降低,同时南北两侧高于中央腹地,地形条件复杂,高差大。从山区到河谷平原,现代地貌景观反映了强烈的上升运动和地区性垂直气候分布而产生的深切作用。海拔3 900 m 以下为水网强烈切割,河谷呈“V”字形,峡谷,谷坡呈直线形;基岩山区和中高山、低山丘陵区交接线外观十分平直;中高山除大的河谷形成狭长冲积平原外,均为冈峦起伏的丘陵。该区的地貌可划分为剥蚀中高山区、侵蚀低山丘陵区、侵蚀堆积平原区三个不同的地貌单元。其中剥蚀中高山集中分布在县境南北两侧拉脊山和娘娘山一带,海拔在3 500 m 以上,主要由元古界白云岩、石英岩、片岩、片麻岩和花岗岩组成,山体侵蚀强烈,沟谷形态为“V”型谷,由于本区人类工程活动较少,地质灾害以局部崩塌为主,规模较小;剥蚀低山丘陵区主要分布于拉脊山北侧、娘娘山南侧的中高山山前地带,主要由古近纪砂岩组成,上覆风积黄土。丘陵区蒸发量大,地形极不平坦,沟壑纵横,水土流失比较严重。总体上,该地人类活动较强烈,植被覆盖率低,是崩塌、滑坡和泥石流等地质灾害最容易发生的地区;侵蚀堆积平原主要分布于湟水、西纳川、康城川和南川等河谷区,地势相对低平,植被较发育。本区地质灾害不发育,但在高阶地前缘,崩塌、滑坡灾害较常见。县域内大部分乡、镇分布在湟水河河谷及一级支流谷底与山间丘陵,属于典型的山间河谷型县区。

湟中县内地质灾害十分严重,主要的地质灾害为滑坡、崩塌、泥石流等,如图1 所示,区内地质灾害以滑坡和崩塌为主,泥石流发育较少,该区域共有地质灾害417 处,其中滑坡374 处,崩塌29 处,泥石流14 处。研究区滑坡和崩塌分为土质和岩质两类,其中以土质滑坡为主,共355 处,占总滑坡数量的94.92%,岩质滑坡共19 处,其中有213 处滑坡处于不稳定状态,161 处滑坡有轻微活动特征,处于基本稳定状态;崩塌也以土质崩塌为主,规模以中小型为主,小型崩塌14 处,中型崩塌11 处。

2 研究方法

逻辑回归模型在对地质灾害易发性评价时能够根据评价因子和灾害点之间的关系确定评价因子的权重,但在变量处理时存在很大的主观性;确定性系数模型能够解决多因子数据的定量化问题,并且计算出评价因子各分级的相对权重。前人经验表明,将两种方法结合能得到更客观准确的结果,因此本文采取两种模型结合的方法,将计算得到的CF 值作为自变量代入逻辑回归公式中进行二元逻辑回归分析,得到湟中县地质灾害的易发性概率,以此作为易发性分区的依据。

2.1 确定性系数模型

确定性系数模型(CF)是1975 年由Shortliffe和Buchanan(1975)提出的一个概率函数,Heckerman(1985)对其进行改进。同其他统计模型一样,确定性系数模型假设其将来发生地质灾害的原因和过去发生地质灾害的原因相同。CF 计算公式为:

式中:PPa为事件(地质灾害)在因子分类数据a 里面发生的概率,在实际的研究中通常用因子分类a中的地质灾害个数(或面积)与数据分类a 的面积比值比表示;PPs为整个研究区的灾害总个数(或面积)与研究区总面积的比值。

CF代表地质灾害发生的概率,其值在[-1,1]范围内变化。若CF为正值,则意味着事件发生确定性的增长,即地质灾害发生的确定性高,说明地质环境条件易于发生地质灾害;负值则意味着事件发生的确定性降低,即地质灾害发生的确定性低,不易发生地质灾害,-1 表示不发生地质灾害。

2.2 逻辑回归模型

逻辑回归模型是一种二分类因变量常用的统计分析方法。它描述的是二元因变量(通常,0 代表地质灾害不存在,1 则代表地质灾害存在)和多个致灾因子(x1,x2···,xn)之间的关系。该模型不限定自变量是否连续,并且不要求自变量满足正态分布。逻辑回归模型公式如下:

式中:P为滑坡发生概率,范围为0~1;α为逻辑回归计算出的一个常数项;β为逻辑回归计算而得出的回归系数;i为评价因子种类数目。

将式(2)两边取自然对数,等式左边作为因变量,将影响因子xi(i=1,2,···,n)作为自变量,得:

3 数据来源和评价因子的选择及分级

3.1 数据来源

本研究所用到的样本地质灾害点数据包括滑坡149 处、崩塌9 处、泥石流14 处、不稳定斜坡225 处,共计417 个地质灾害点,地质灾害点空间分布位置如图1。除了样本数据以外,地质灾害易发性评价的基础数据有湟中县DEM 数据、地质数据和水文数据。本研究区的坡度是根据对地观测与数字地球中心(http://www.eorc.jaxa.jp/ALOS/en/aw3d30/)下载的分辨率为30 m 的DEM 数据生成。

3.2 评价因子的选择和分级

3.2.1 高程

高程是区域宏观地貌的一个表征,很多研究表明地质灾害与高程分布具有明显的区域规律(田春山等,2016)。湟中县地势大体呈东西走向,海拔由西向东降低,同时南北两侧高于中央腹地,地形条件复杂,高差大。如图3(a)所示。考虑到研究尺度和湟中县地貌实际情况,运用自然断点法7 个等级,如图2(a)所示,从图中可以看出,地质灾害点主要分布在2 285~2 745 m 之间,占总灾害点数量的85.61%。

图2 地质灾害点与各评价因子之间的关系Fig.2 Relation between geological hazards and evaluation factors

图3 地质灾害易发性评价因子分级Fig.3 Classification of susceptibility evaluation factors of geologic hazard in Huangzhong

3.2.2 坡度因子

坡度是影响地质灾害发生的一个重要因素,其大小决定了地表松散物质发生位移并且形成地质灾害的可能性,同时也在很大程度上确定了斜坡造成破坏的形式和机制(杨德宏和范文,2015;赵艳南和牛瑞卿,2010)。基于DEM 数据,利用ArcMap10.5中的Slope 命令生成坡度分布图,如图3(b)所示。根据地质灾害在每个坡度段内的分布特点,把坡度按照5°为间隔分为9 个级别,由于40°以上都地质灾害点极少,故划分为一个等级。利用ArcGIS 的空间分析功能,统计地质灾害在各个坡度段的分布规律,如图2(b)所示,从研究区坡度图来看,区内坡度陡峭,区内坡度分布在0°~73.04°之间。整个研究区内地质灾害总数为417 个,从地质灾害与坡度的分布来看,地质灾害主要发生在5°~25°之间,灾害点个数为322 个,占研究区内灾害点的77.22%。

3.2.3 坡向因子

坡向是指某一地面点处高程变化量最大的方向(汤国安等,2016)。坡向主要影响山坡面水热的大小,以及小气候作用的差异。向阳一面坡体水热条件充足,自然活动频繁,因而沟谷发育多陡坡,风化作用强烈,导致岩体裂隙发育易破裂,而阴坡土层多易于累积堆积。由图2(c)和图3(c)可知,地质灾害主要发生在东—南坡向范围内,地质灾害占总数的55.64%,由此推出该区域断层走向为东西向。

3.2.4 地形起伏度因子

地形起伏度是指某一确定区域内海拔最高点与海拔最低点的差值(程维明等,2009)。地形起伏度和坡度相互补充,两者在地质灾害评价中都发挥着独具风貌的重要作用。这两个因素均与地质灾害具有良好的相关性,特别是在高山峡谷和深切河谷地区,地质灾害容易发生。本次研究中的地形起伏度计算是借助ArcGIS 软件,对DEM 数据进行邻域分析和栅格计算器完成的。将地形起伏度按自然间断点法分为4 类,研究区内的平坦起伏(0~15 m)地区面积占总面积的30.73%,小起伏(15~30 m)地区面积占总面积的35%,中起伏(30~50 m)地区面积占总面积的24.26%,山地起伏(50~205 m)地区面积占总面积的10.01%。这些统计结果如图3(d)所示,研究区内地形集中以平坦起伏和小起伏变化呈现,同时在小范围面积内分布着山地起伏地形。研究表明,平坦起伏和小起伏地区是地质灾害发生的主要区域,占研究区灾害点的79.38%。

3.2.5 水系因子

地质灾害的发育会受到水系发育程度和分布密度的影响,因此水文条件也是影响地质灾害形成和发育的一个重要因素(李鑫,2009)。湟中县属黄河一级支流湟水流域,主要河流有湟水、康城沟、西纳川河等15 条,其中多年平均流量0.5 m3/s 以上的河流有10 条,河流众多,河网密布。本文中水系是通过DEM 数据提取得到的,利用ArcGIS 软件中欧式距离分析,以500 m 为间隔生成水系因子图,如图2(e)和图3(e)所示,地质灾害主要分布在距离河流1000 m 内,该区域共有地质灾害341 个,占总灾害数量的81.77%,距离河流越远,地质灾害发育越少。

3.2.6 断裂构造因子

地质灾害的发育一般都与断裂构造密切相关,断裂构造影响到区域的稳定性,尤其是在断层附近,地质作用较活跃,岩土体容易遭到破坏,松散的岩土体为地质灾害的形成和发育提供有力的构造条件和物质来源(郭芳芳等,2008;黄润秋等,2008)。湟中县的中部地区是新生代西宁断陷盆地,南侧为拉脊山,北侧为娘娘山背斜褶皱带,受达坂山南麓断裂和拉脊山北麓断裂控制。本文根据距离断层的距离来刻画断层对地质灾害易发的影响,把距断层距离以2 km 为间距作距离分析,共分为9 级,如图3(f)所示,从图2(f)中可以看出,研究区地质灾害主要分布在断层附近10 km 的范围内,一共发育地质灾害264 处,占区域地质灾害总数的63.31%。

3.2.7 工程地质岩组因子

工程地质岩组影响着地质灾害的发育和形成,以往研究成果表明,地层岩性是产生地质灾害的基本物质,岩性的类型不同,其具有的物理力学性质也不同,因此地质灾害发生的类型及规模也往往各不相同,而且在不同地质年代中,地层的岩性与地质灾害也高度相关(冯新科,2014)。本文根据岩石成因和性质将湟中县的岩石划分成7 个岩组大类:以元古界花岗岩、花岗闪长岩、变质岩为主的坚硬块状侵入岩岩组;以碎屑岩和变质岩为主的坚硬-较坚硬层状及块状变质岩岩组;以三叠纪砂岩为主的较坚硬块状变质岩岩组;以古近系砾岩、砂岩、泥岩等组成的坚硬层状碎屑岩岩组;由白垩系砾岩、砂砾岩等组成的较坚硬层状碎屑岩岩组;以古近纪和新近纪泥岩、石膏岩等组成的软弱层状碎屑岩岩组;由风积黄土、砾石土、崩滑堆积体等组成的松散层状冲洪积岩组。从图2(g)中可以看出,研究区地质灾害主要分布在软弱层状碎屑岩岩组和松散层状冲洪积岩岩组。

4 基于CF 和Logistic 模型的地质灾害易发性评价

本文对青海省湟中县地质灾害易发性的评价,首先基于统一的矢量范围,对所有的评价因子栅格数据进行裁剪。同时,根据像元大小设置每个因子图层的栅格大小为 30 m×30 m。采用CF 模型计算出高程、坡度、坡向、地形起伏度、距河流距离、距断层距离、工程岩组7 个影响因子各分级的权重(即CF值),随后把各评价因子的CF值视为自变量,把是否发生地质灾害视为因变量(1 代表发生地质灾害,0 代表不发生地质灾害),采用SPSS25.0 软件进行二元逻辑回归分析,把分析结果中得出的各因子的回归系数作为该因子的权重,从而计算出湟中县地质灾害的易发程度。具体计算步骤如下:

(1)确定性系数模型(式1)计算出7 个影响因子各分类级别的CF值。

根据灾害编目中的417 个地质灾害点在各因子分级中的分布,利用CF 模型可以计算出各分类级别在因子中的权重,该权重不仅可以比较同一评价因子下各分类级别的相对重要性,还可以在不同评价因子的分类级别之间进行比较,各分类级别的CF值见表1。

表1 各影响因子分类级别的 CF 值Table 1 Values of CF for the seven factors influencing geologic hazard in Huangzhong

(2)各因子之间独立性检验

为了使选择的因子更加合理,需要对各影响因子之间的独立性进行分析,剔除关联性较大的因子,各因子之间的相关矩阵见表2。表中数据显示,地形起伏度与高程、坡度和工程岩组具有较高的相关系数,其值均大于0.3,其余各因子之间的相关系数基本则不足0.3。因此,舍去地形起伏度因子,保留剩余6 个因子。

表2 影响因子间的相关系数矩阵Table 2 Correlation matrix of seven factors

(3)利用逻辑回归模型得到各因子权重

将各影响因子分级中的CF值作为自变量,是否发生地质灾害作为因变量。本文将研究区内417 个地质灾害点作为训练样本,并在距灾害点1 km 范围外随机选取417 个点作为非地质灾害样本,这样一共得到834 个具有独立属性的样本,根据灾害点与非灾害点样本进行各种因子的综合评价。回归结果见表3。

表3 逻辑回归分析结果Table 3 Results of logistic regression analysis

在本次研究过程中,B代表各因子权重的大小,由sig 值来判断自变量在方程中的重要程度,若sig 值大于0.05,则没有意义。从回归结果可以看出,地形起伏度的sig 值为0.164,大于0.05,说明该因子是无效的,所以剔除地形起伏度这一因子。

(4)地质灾害易发性的计算

基于各因子的回归系数,根据式(2)和式(3)可以得到逻辑回归方程:

其中,P表示发生地质灾害的概率;x1为高程因子中各分级的CF值;x2为坡度因子中各分级的CF值;x3为坡向因子中各分级的CF值;x4为距河流距离中各分级的CF值;x5为距断层距离中各分级的CF值;x6为工程岩组中各分级的CF值。

5 评价结果及检验

5.1 易发性评价结果分析

根据式(4)可以得到研究区地质灾害发生的概率P。而地质灾害易发性概率可以依照自然间断点法归类为五个级别:极低易发区、低易发区、中易发区、高易发区和极高易发区。通过对研究区地质灾害易发性分区的面积和灾害点数量进行统计分析,如表4 所示,研究区内地质灾害极高、高度易发区的总面积为978.046 km2,占研究区总面积的38.051%,其中极高易发区分布216 个地质灾害点,占研究区总数的51.799%,高易发区分布156 个地质灾害点,占研究区总灾害点的37.410%,而极低、低易发区面积较大但灾害点分布极少,仅占地灾点的2.158%。通过统计发现灾害点的分布密度随着易发性等级的升高而增加,两者成正相关关系,说明地质灾害的易发性分区与灾害点的拟合程度较高,表明采用CF-Logistic 回归模型进行湟中县地质灾害易发性评价能较好地反映区内地质灾害易发性的空间分布情况。

表4 地质灾害易发性分区统计表Table 4 Results of geological hazard susceptibility in different districts

研究区内极高和高易发区主要分布在湟水干流南北两岸较大支流两侧低山丘陵地区,总体呈南北向展布,如图4 所示,研究分析发现,极高和高易发区地层岩性以全新统、上、中更新统时期的冲洪积岩土为主,该土体具有大孔隙及垂直节理,其力学性质较差,在临空条件下发育大量滑坡、崩塌等地质灾害。从河流水系来看,高易发区和极高易发区河网水系密布,常年性河流和季节性河流数量较多,水资源丰富,河流对斜坡坡脚和坡面的冲刷、侵蚀作用明显,易发育不稳定斜坡和泥石流等地质灾害。北部和西南地区主要为低易发区和极低易发区,分布面积为1 105.909 km2,占研究区总面积的43.025%,海拔较高,主要为坚硬岩和较坚硬岩岩组,抗风化能力强,河流主要为支流,河网稀疏,没有发生地质灾害的条件。中易发区主要分布在高易发区两侧,地质灾害发育较少。

图4 地质灾害易发性评价图Fig.4 Assessment chart of geological hazard susceptibility

5.2 精度分析

ROC 曲线常被用来对易发性评价实验结果做定性分析,AUC 曲线常被用来度量分析模型的有效性,其大小代表曲线下方的面积,AUC 值越大,表明模型的拟合度越高(钟亩锋,2019)。本文用ROC 曲线和AUC 对该模型进行验证,ROC 曲线横轴表示易发性面积比的累积量,纵轴表示灾害点面积百分比的累积量,结果如上图5 所示。验证结果AUC 值为0.863,表明CF-Logistic 回归模型能够较为客观准确地对湟中县地质灾害易发性进行评价。

图5 逻辑回归模型的ROC 曲线Fig.5 ROC curve of Logistic Regression model

6 结论

本文以青海省湟中县为例,通过分别计算高程、坡度、坡向、地形起伏度、工程岩组等地质灾害影响因子的确定性系数,并利用Logistic 回归模型得到地质灾害发生的概率,以此为基础,对研究区进行地质灾害易发性评价,主要结论有:

(1)本文结合CF 模型和Logistic 回归模型对湟中县地质灾害易发性进行评价。确定性系数模型和逻辑回归模型的结合能够实现复杂多因子数据同区间的定量化,解决各因子之间存在的共线性问题,而且能够客观地计算出各因子的权重和各因子分类级别的权重,具有较强的客观性。

(2)通过SPSS 和ArcGIS 计算,剔除地形起伏度因子,消除了因子共线性。从剩余的6 个地质灾害影响因子的各分类级别的CF 值和各因子的逻辑回归系数可以看出,高程、距河流距离、坡向和工程岩组对湟中县地质灾害易发程度贡献相对较大。特别是在海拔2 560~2 750 m 内、坡向为东、东南方向、距河流500 m、松散层状冲洪积岩组和软弱层状碎屑岩岩组是最容易发生地质灾害的区域。

(3)从各易发程度分布状况来看,湟中县地质灾害高易发区和极高易发区主要分布在湟水河干流南北两岸及其较大支流两侧的低山丘陵地区,面积为978.046 km2,占研究区总面积的38.051%。低易发区和极低易发区主要分布在北部和西南高海拔地区,面积为1 105.909 km2,占研究区总面积的43.025%。

(4)基于CF-Logistic 回归模型的易发性评价方法可以客观准确地计算出地质灾害影响因子与地质灾害的发生之间的确定性关系。而ROC 曲线和AUC 值则说明该方法可以较为准确地对湟中县地质灾害进行易发性评价。

猜你喜欢
岩组易发滑坡
银川市地下水赋存条件及动态特征
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
滑坡推力隐式解与显式解对比分析——以河北某膨胀土滑坡为例
冬季鸡肠炎易发 科学防治有方法
浅谈公路滑坡治理
淮南潘集深部勘查区15-2孔工程地质岩组划分
白音华煤田三号露天矿区水文地质条件分析
基于Fluent的滑坡入水过程数值模拟