张 群,易靖松,张 勇,马志刚,程英建
(1.四川省国土空间生态修复与地质灾害防治研究院,四川成都 610081;2.中国地质科学院探矿工艺研究所,四川成都 611734;3.中国地质调查局地质灾害防治技术中心,四川成都 611734)
西南山区为我国西部的高山峡谷区域,区内地质灾害十分发育,具有人口、房屋多集中于斜坡坡脚分布的特点,亟需寻找一套新的易损性评价方法,针对该区域进行有效合理的风险性评价。近年来,诸多学者以地质灾害为研究对象开展了大量的风险评价研究工作,也取得了大量的显著成果。
赵海卿等[1]、倪晓娇等[2]利用层析分析法对吉山区地质灾害风险性进行分区评价;邵明[3]运用Logistic回归模型进行态水脆弱性分区;Pradhan等[4]采用Logistic回归模型进行了滑坡敏感性分析;罗路广等[5]、杨强等[6]、王峰[7]、周平华等[8]、王芳[9]、张晓东[10]采用多种数理统计模型进行区域地质灾害危险性和易发性对比分析评价;李彦宝[11]研究开发了基于GIS的地质灾害风险评估系统;袁四化等[12]采用GIS技术和遥感影像分析方法进行了地质灾害风险区划;孟凡奇等[13]运用证据权法客观地筛选出评价因子和确定危险度的权重;Yilmaz等[14]利用人工神经网络分析了滑坡敏感性;Khosravi等[15]利用决策树算法比较评估了地质灾害易发性;黄发明等[16]利用支持向量机模型对三峡库区万州区滑坡进行了易发性评价;刘坚等[17]基于优化随机森林模型开展了滑坡易发性评价;孟庆华[18]按照“地质灾害易发性—危险性—风险”的研究层次关系,探索了适用于秦岭山区的地质灾害风险评估技术方法;乔建平等[19]采用概率分析方法对区内风险防御工程治理的效益进行评价;李雪平等[20]采用贝叶斯信息标准对风险评价模型优劣程度进行了比较;赵忠国等[21]通过多元自适应回归样条法构建了滑坡敏感性指数预测模型。
地质灾害的风险性评价主要包括2大方面:一是区域的危险性评价;二是区域的易损性评价。区域的危险性评价主要采用数理统计模型和机器学习模型完成;而易损性评价主要包括人口、工业或民用建筑、道路和基础设施等方面的评价,多数学者通过按不同行政单元的人口密度、房屋密度和道路密度等数据对县域地质灾害的易损性开展评价工作;最后,再采用人口风险或财产风险的计算公式进行风险性值计算,进而评估区域内的风险。
但若采取这些评价方法对西南山区的地质灾害开展区域性风险评价,却存在诸多不合理的地方。例如,西南山区的人口、房屋等都位于斜坡的坡角,行政单元人口、房屋密度的计算方法通常将斜坡的坡脚和坡顶区域的易损性同一化,同时不同位置区域的人口、房屋等财产受到的地质灾害的威胁程度是不一样的,它们的易损值也不能简单采用密度的分布来评价。所以,目前西南山区形成的县域单元地质灾害风险评价研究成果往往难以实际用于地方风险管控。
目前,我国地质灾害调查主要还是以小比例尺、大范围为主,精度普遍偏低,且大比例尺的调查数据较少,地质灾害风险评价基础理论和技术方法尚处于探索阶段,亟需寻找开展西南山区地质灾害风险评估的科学手段与方法,来真正实现地质灾害减灾防灾。基于此现状,笔者通过在怒江流域泸水段开展大量调查工作,选取泸水市域为试点,开展县域尺度的地质灾害风险评价工作,总结了一套与实际调查数据紧密结合的西南山区县域地质灾害风险评价方法,以期形成西南山区县域单元的地质灾害风险评价示范。
泸水市位于滇西横断山区,研究区作为高山峡谷区,受大构造断裂的作用,其地形起伏悬殊,高程相差大,地层岩性复杂。受强降雨的作用,加之人类工程活动的影响,研究区地质灾害发育,并具有分布广、类型齐全、不同规模并存、形成因素交错复杂的特征。
地质灾害是由各种内、外因的耦合作用产生的,但是不同因素对地质灾害形成的贡献率不同,当进行地质灾害风险评价时,应选取这些重要控制因素作为关键指标,例如坡体结构、距断层距离、岩土体类型、距水系距离、斜坡坡度等,通过收集研究区1:5万详细调查资料,区内共发育408处地质灾害点,其中,滑坡灾害244处,崩塌灾害91处,泥石流灾害73处,并确定区域地质灾害的影响因素主要包括基础地质环境因素和诱发因素,基础地质环境因素包括高程、斜坡坡度、岩土体类型、距水系距离、距断层距离、斜坡结构、剖面形态、植被类型,诱发因素主要为降雨,基于arcgis分析功能,将各评价因子量化为20 m×20 m栅格数据。见图1~图9。
图1 地质灾害与高程关系Fig.1 The relationship between geological hazard and elevation
图2 地质灾害与坡度关系Fig.2 The relationship between geological hazard and slope
图3 地质灾害与岩土体类型关系Fig.3 The relationship between geological hazard and formation lithology
图4 地质灾害与距水系距离关系Fig.4 The relationship between geological hazard and distance from drainage
图5 地质灾害与断层距离关系Fig.5 The relationship between geological hazard and distance from fault
图6 地质灾害与年降雨量关系Fig.6 The relationship between geological hazard and rainfall
图7 地质灾害与剖面形态关系Fig.7 The relationship between geological hazard and profile shape
图8 地质灾害与斜坡结构关系Fig.8 The relationship between geological hazard and slope structure
图9 地质灾害与植被类型关系Fig.9 The relationship between geological hazard and vegetation types
目前地质灾害危险性评价常用数理统计模型和机器学习模型。机器学习算法是利用算法对训练数据学习进行建模分析,其调参复杂,算法运行时间较长,统计方法模型主要是通过统计对数据进行预处理分析。逻辑回归模型作为经典的多元统计分析方法,既能用简单的线性回归来描述致灾因子之间复杂的非线性关系,具有较强的灵活性和应用性,又能客观的反映评价中各种影响因素关系及其重要性,避免了人为主观进行权重的赋值及随意进行因子的选取,在地质灾害风险评价中应用较为广泛。因此,文中选择逻辑回归模型进行怒江流域泸水市地质灾害危险性评价。
作为目前常用的统计分析模型,Logistic回归采用多个自变量X对应1个因变量Y值进行回归分析,而因变量只有2个特定值。经过简单的推理,对变量进行分析,可以得到逻辑函数及相应的逻辑回归模型[4]:
式中:xi为自变量;α、β为系数;εi为误差项。
通过换算得到某一事件发生的条件概率Pi及事件不发生的条件概率1-Pi:
定义事件发生比(Odds)为:
通过取自然对数,得到一个发生比(Odds)连续函数[4]:
则式中:α为常数项;β1、β2……βn为回归系。
只要通过逻辑回归分析得到式(6)相应的回归系数,则可利用式(7)计算出事件发生概率P的大小。在县域单元地质灾害危险性区划中,P值便是评价某一点可能产生地质灾害的概率大小。
文中采用SPSS软件来确定逻辑回归系数,首先,在泸水市域内随机获取大量点,如果这些点为地质灾害点,那么其逻辑回归模型的因变量Y则为1,反之Y=0。本次分析通过GIS平台创建随机点功能,共创建了728个点,其中包括408个地灾点,320个非灾点。选取80%的点作为分析的训练样本数据,另外20%的点作为检验样本数据,因此选取了583个点进行回归分析,145个点进行Logistic回归模型精度检验。
通过对选取的评价指标进行逐步回归的方法进入模型,将9个评价指标进行回归,剖面形态、斜坡结构、植被类型等几个因子未能进入最终的回归模型。因此,根据回归分析结果,最终确定斜坡坡度、距水系距离、斜坡高程、灾害距断层距离、坡体岩土体类型及年降雨量6个评价指标作为研究区评价指标,其相应的回归系数见表1。
表1 Logistic回归模型系数Table 1 The model coefficients of Logistic regression
2.3.1 回归模型评价因子多元共线性诊断
Logistic回归分析对参与回归分析因素的多重共线性(Multicollinearity)很敏感。一般因子的多重共线性程度都用2个指标来评估,它们互为倒数,分别为方差膨胀因子(VIF)和容许度(TOLERANCE)。其中容许度表示为:
式中:R2
xk为Xk作为因变量时与其他自变量的确定系数,从式(8)表明,R2xk越大,容许度就越小,对应自变量的相关程度越高,即可能存在多元共线性;当R2xk=1时,则容许度为零,表明自变量完全相关,参数不能进行估计。一般来说TOLERANCE<0.2,且VIF>10时,则评价因子存在一定的多元共线性,且TOLERANCE>0.2,且VIF<10时,评价因子基本不存在多元共线性。
按照上述方法,得到文中6个评价因子的方差膨胀因子和容许度,计算结果见表2,容许度最小的评价因子为距水系距离,其值为0.323,且所有评价因子的容许度均大于0.2,方差膨胀因子均小于10,说明文中所选取的评价因子无多元共线性,选取的地质灾害易发性区划评价因子是合理的。
2.3.2 Logistic回归模型拟合度检验
逻辑回归模型的拟合度检验主要通过比较建立模型的预测结果与实际发生结果的吻合情况来判断。如果回归模型的预测结果与实际情况有很高的吻合度,则预测模型是可以接受的,反之则模型不接受。
在建立的逻辑回归模型中,R2是表明参与自变量决定因变量的比例,为决定系数。表3计算结果中逻辑回归模型的Cox & SnellR2是0.330,NagelkerkeR2是0.375,两者相差较小,说明本次模型有较高的拟合度。另外,Hosmer-Lemeshow作为模型拟合度检验值的指标,如果显著性水平sig>0.05,则应接受回归模型,并且sig值越大回归模型的拟合度越高。表3中显著性水平sig值为0.39>0.05,因此,可以认为本次模型拥有较高的拟合度。
表2 评价因子多元共线性诊断表Table 2 Multiple collinearity diagnostic table of evaluation factors
表3 Logistic回归模型拟合度检验表Table 3 The test table of Logistic regression model fitting degree
为进一步验证模型预测的准确率,文中采用混淆矩阵对模型预测的精度进行评估,利用前文研究数据,建立模型测试数据集的混淆矩阵。
表4可以看出,测试数据集正确分类样本为684个,而测试集总样本数为728个,可得到模型预测的准确率(ACC值)为0.94,表明模型预测的精度较高。
表4 测试数据集的混淆矩阵Table 4 The confusion matrix of testing dataset
表5 地质灾害危险性评价指标分级赋值表Table 5 The classification assignment table of geological hazard dangerousness assessment index
图10 地质灾害危险性评价图Fig.10 The dangerousness assessment chart of geological hazard
评价指标的分级与赋值采用定量的方法,首先对模型筛选出来的6个指标进行分级,再利用GIS平台求出各个评价指标分级后对应的灾害点个数Nij与面积Sij,两者相除便是地质灾害点点密度Xij,再将点密度进行归一化处理得到指标值Iij,将归一化的点密度作为各个评价因子的指标值(表5)。
通过上文确定好的回归系数,建立本次研究区的危险性评价模型(式9),将赋值后的斜坡坡度、灾害距水系距离、斜坡高程、灾害距断层距离、坡体岩土体类型及年降雨量6个评价指标代入模型,得到地质灾害危险值的值域,按自然间断法分为4级,再选取2~3处危险高的区域,结合现场调查的危险性程度对间断点进行修正,得到最终的泸水市地质灾害危险性评价图(图10)。
承灾体受到灾害作用时遭受到一定程度的损失。易损性一般用0~1来定量表达,1表示完全损失,0表示无损失。
县域单元尺度下,易损性的评价主要考虑承灾体的类型和承灾体受威胁的程度及可能遭受的损失。文中通过对调查区承灾体所处的不同危险性等级程度分析统计,参照《四川省地质灾害风险调查评价实施细则》,结合研究区承灾体分布特征,建立承灾体的易损性分级赋值表。
西南山区具有其独特的区域特征,承灾体多位于斜坡的坡脚区域,采用传统的人口密度、房屋密度等指标来表征承灾体的易损性就不能精确反映区域的易损性特征。因此,本次评价工作,利用的每个灾害点威胁人口数量的调查数据,以此为基础,利用核密度分析方法,以灾害点威胁最近房屋的距离为搜索半径,得到受地质灾害威胁人口的核密度栅格图层;根据承灾体易损性指标分级评价表,该表取值为参考前人取值经验[20],并结合本次调查区域承灾体的分布特征稍微修正,对受地质灾害威胁人口的密度栅格进行重分类赋值。
考虑调查区其他可能遭受地质灾害威胁的人口分布,利用房屋栅格对受地质灾害威胁人口的密度栅格进行修正(基于山区调查经验,修正系数建议采用1.2),首先,将房屋栅格进行赋值,房屋处栅格赋值为确定好的修正系数,其余没有房屋存在的栅格赋值为1,随后再将赋值好的修正系数栅格与受地质灾害威胁人口的密度栅格相乘得到调查区人口易损性评价栅格。
图11 地质灾害易损性评价图Fig.11 The vulnerability assessment chart of geological hazard
在获取调查区危险性评价图层后,利用按掩膜提取工具获得调查区内建筑设施位于的危险性等级,再根据承灾体易损性指标分级赋值表(表6),对不同建筑类型的进行易损性赋值,得到道路易损性评价栅格。同样的方法,得到道路交通、水利设施、生活设施、通信设施的易损性评价图层。
在获得人口、房屋、道路等承灾体易损性之后,采用栅格计算器进行栅格叠加,得到综合易损性评价栅格图层(图11)。
表6 承灾体类型易损性指标分级赋值表Table 6 The vulnerability index classification assignment table of disaster-bearing body
地质灾害风险性评价目前常用的主要有定性和定量2种方法。定性的方法主要基于地质灾害风险分析矩阵,定量的方法是基于风险计算公式。
图12 地质灾害风险评价成果图Fig.12 The risk assessment chart of geological hazard
考虑县域尺度单元的风险评价重在为国土空间规划提供支撑,文中评价方法采用地质灾害风险矩阵,将分级后的危险性评价、易损性评价代入矩阵计算,得到研究区栅格分辨率为20 m×20 m的风险性评价成果图(图12)。
(1)通过对泸水市域的野外地质调查发现,市域北部地质构造复杂,岩体破碎,地质灾害十分发育,有称嘎乡、鲁掌镇等大量村镇聚集地沿江分布,为地质灾害风险的重点管控区域,泸水县城位于市域南部,地质灾害零星发育,规模较小,虽有大量人口聚居,但受地质灾害直接威胁的人口较少,为地质灾害风险次重点管控区。
(2)地质灾害极高风险区和高风险区多集中泸水县城的北部,县城及周边大部分区域为中风险区和低风险区,与野外调查评价的结果基本一致,说明文中提出的风险评估方法能有效反应县域范围内地质灾害的风险现状,为西南山区县域单元的国土空间规划管控提供依据。
(3)通过逻辑回归模型,计算逻辑回归系数,确定各影响因子权重的技术方法,能有效反映地质灾害主控因子在评价过程的主控作用,摆脱了靠专家经验法来确定各影响因子权重的主观性。