基于BP神经网络的地质灾害易发性分区方法研究
——以蕲春县为例

2022-01-06 11:27朱文慧何明明王纪云
资源环境与工程 2021年6期
关键词:蕲春县信息量易发

朱文慧, 邹 浩, 何明明, 王纪云

(1.湖北省地质局 第三地质大队,湖北 黄冈 438000; 2.中国地质大学(武汉),湖北 武汉 430074)

自2018年湖北省实施地质灾害综合防治体系建设以来,全省各县均开展了1∶5万地质灾害风险调查评价工作。地质灾害风险评价方法很多,包括定性分析和定量评价两种,但后者是国内外发展的主流方向。目前各县在进行地质灾害风险评价时,大多采用定性分析与定量评价相结合的方法,即层次分析法和信息量法来划分地质灾害易发性分区、危险性分区和易损性分区。层次分析法的基础工作之一就是通过专家打分对评价因子进行重要性对比而形成判断矩阵,然而专家打分不具备客观性和唯一性,而且一致性检验只能判断逻辑上的合理性,不能客观全面地反映各评价因子权重的准确性与相关度,因此专家打分对评价分区结果的准确性造成直接影响。为解决这一问题,Khamehchiyan等[1]、Christos等[2]运用BP(Back Propagation)神经网络和逻辑回归法对滑坡敏感性进行研究,该方法预测滑坡的平均准确度达到84%;郭子正等[3]以三峡库区万州区作为研究对象,基于BP神经网络模型评价区域滑坡易发性,证实BP神经网络法是一种有效的滑坡空间预测手段。

BP神经网络能够从数据样本中自动学习和训练,不需要反复地查询和表述过程,并且能够自动地逼近与样本数据规律拟合最优的函数。对于影响因素越复杂、非线性程度越高的情况,BP神经网络的优势越明显[4]。通过MATLAB软件建立BP神经网络,进行反复的网络训练和调整,得到最优拟合权重取值,能有效解决层次分析法因过多人工主观干预打分而造成定量评价不充分的问题,进一步提高地质灾害易发性分区的精度和准确性。本文以蕲春县为例,实证研究基于BP神经网络的地质灾害易发性分区评价方法,得到精细、准确的地质灾害风险分区成果,对防灾减灾工作具有重要意义。

1 BP神经网络原理及应用方法

1.1 BP神经网络原理

BP神经网络由Rumelhart D等[5]科学家于1986年提出,是一种按误差逆向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一,由信息的正向传播和误差的反向传播两个过程组成[6]。在众多神经网络算法中,BP算法是一种高效计算数据传输途径上梯度的技术[7]。BP神经网络的单个样本有m个输入和n个输出,在输入层和输出层之间通常还有若干个隐含层[8](图1)。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可设计为单隐层或多隐层结构;最后一个隐层传递到输出层各神经元的信息经进一步处理后,由输出层向外界输出信息处理结果,即完成一次学习的正向传播处理过程。当实际输出与期望输出不符时,进入误差的反向传播阶段,误差通过输出层按误差梯度下降的方式修正各层权值,向隐含层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以被接受的程度或者预先设定的学习次数为止[9]。

图1 BP神经网络映射原理Fig.1 Mapping principle of BP neural network

1.2 BP神经网络应用方法

BP神经网络大规模并行处理信息时具有分布式储存、连续时间非线性动力学、全局集体作用、高度容错性、自组织、自学习和实时处理等特征[10]。随着大数据技术的发展,机器学习为研究非线性变量关系提供了解决办法[11],可以有效地避免主观因素对分析结果的影响。

采用BP神经网络进行地质灾害易发性分区评价时,通过MATLAB软件建立BP神经网络,输入样本进行训练,反复进行信息正向传播和误差反向传播,通过修改每个神经元的参数和神经元之间的连接权值,使误差值最小、相关度最高,由此来确定地质灾害风险易发性分区各评价因子的权重。整个应用过程大致可以概括为建立ArcGIS空间分析平台、提取训练样本、网络训练、网络测试、提取权重5个步骤(图2)。

2 应用实例

蕲春县位于湖北省东部,处于大别山南麓、长江中游北岸,全境以丘陵平原为主,北部为山区,中部为丘陵地带,南部为平原地区,地势东北高西南低。区内地形地质条件复杂,地质灾害易发,尤其是雨季地质灾害频发。近年来人类工程活动愈加频繁,使得区内原本脆弱的地质环境条件发生重大改变,加剧了地质灾害的发生。据2020年蕲春县地质灾害风险调查[12],全县共发现滑坡、崩塌、泥石流等各类地质灾害(隐患)点279处(截至2020年9月)(表1)。

图2 BP神经网络应用流程图Fig.2 Application flow chart of BP neural network

表1 蕲春县地质灾害发育情况统计表Table 1 Statistical table of geological disasters in Qichun County

2.1 易发性评价因子选取

地质灾害易发性分区是地质灾害调查评价的重要内容,也是地质灾害风险分区的基础。地质灾害易发性分区是根据地质灾害形成发育的背景和现状,以定性分析与定量评价相结合的方法予以确定。以地形地貌条件来统计,蕲春县地质灾害主要分布于高程<200 m、坡度25°~40°、坡面形态为凸形和阶梯形的区域。由此可见,坡高决定了坡体势能及滑动能量的大小,对斜坡稳定性具有控制性作用;坡度影响岩土体沿斜坡面的自重应力分量,对斜坡稳定性起关键作用;坡型可用地表的曲率进行描述和量化,其影响坡体内应力状态,进而影响坡体的稳定状态。以工程地质条件来统计,工程地质岩组和地质构造对斜坡变形影响较大,顺向坡和横向坡发育滑坡数量最多。由此可见,工程地质岩组、地质构造、斜坡结构是影响斜坡变形的主要因素。

通过综合整理野外实地调查成果及收集的资料,分析蕲春县地质灾害影响因素,本文最终选取坡度、坡高、地质构造、工程地质岩组、曲率、斜坡结构等6个因子作为评价指标。

2.2 信息量法赋值

蕲春县地质构造和工程地质特征较复杂,基于现状地质灾害分布的袭扰系数法,容易漏判一些地质灾害隐患区段。为此,本次研究选用了信息量法进行地质灾害易发性分区评价。滑坡地质灾害受多种因素影响,信息量法评价模型所考虑的是一定地质环境下的最佳因素组合,包括基本因素的数量和基本状态。建立信息量法评价模型的步骤如下:

(1) 计算单个影响因子对地质灾害事件(D)提供的信息量值I(xi,D)。

(1)

式中:S为研究区面积;Si为研究区含有影响因子xi的面积;N为研究区发生地质灾害的总个数;Ni为研究区分布在影响因子xi内的地质灾害的个数。

(2) 通常情况下,各个评价单元具有的信息量值都是由多项影响因子共同作用的结果,各种影响因子又以不同状态存在,因此需计算评价单元内各影响因子组合条件下的总信息量Ii。

(2)

式中:I(xi,D)为单个影响因子的信息量值;n为影响因子总数。

所得的总信息量Ii可作为研究区地质灾害易发性评价指标,评价单元内发生地质灾害的概率随着Ii值的增大而增大。通过对Ii值的值域进行划分,可对研究区进行易发性分区评价。当Ii>0时,信息量越大,滑坡可能发生的概率越大;当Ii<0时,表明该条件不利于滑坡发生;当Ii=0时,表明该条件不提供有关滑坡发生与否的任何关系,即该条件可以被排除,不能作为预测因子。据此得到研究区6个评价因子的信息量计算结果并赋值(表2)。

表2 评价因子信息量与赋值统计表Table 2 Statistics table of evaluation factors information quantity and assignment

2.3 BP神经网络应用

基于ArcGIS平台空间分析功能,对研究区6个评价因子的评价等级按表2进行栅格图层赋值,将已发生的279处地质灾害点所对应的6个评价因子栅格赋值作为机器学习的正样本(图3-a)。通过ArcGIS采样工具,在研究区非地质灾害点区域(避开水域)创建279个随机点,其对应的6个评价因子栅格赋值作为机器学习的负样本(图3-b)。选取负样本点的规则为:样本在研究区范围内必须随机,样本点均匀不连续且样本数据足够典型,每个滑坡点都有样本,即正负样本都应包含滑坡敏感性影响因子重分类后所有的情况[13]。

按照前文图2所示的BP神经网络应用流程图,在MATLAB设置好参数,将正负样本组成的训练样本输入输入层,通过BP神经网络学习,反复进行信息正向传播和误差反向传播;输出层则具有发生与未发生地质灾害两种情况,发生则输出为1,未发生则输出为0。

图3 研究区正样本(a)与负样本(b)分布图Fig.3 Distribution map of positive samples (a) and negative samples (b) in study area

湖北省调查区不同土地利用类型土壤质量综合等级面积相关性曲线,相关性指数为0.85。

2.4 结果分析

通过BP神经网络得到6个评价因子的权重,导入ArcGIS空间分析平台进行叠加分析,加权总和后得到了地质灾害易发性分区结果(表3,图4)。通过与运用层次分析法多次专家打分选取最优权重值后得到的分析结果(表3,图5)进行对比,发现两种方法得到的4类分区面积相差不大,极高—中易发区的地质灾害点密度大致相同,可见基于BP神经网络法的易发性分区结果是可靠的。在基于BP神经网络法的易发性分区结果中,极高—中易发区分布地质灾害点261个,低易发区分布地质灾害点18个;基于层次分析法得出极高—中易发区分布地质灾害点253个,低易发区分布地质灾害点26个,相比较而言,前者精度优于后者。

总的来说,基于BP神经网络的地质灾害易发性分区结果可靠且准确度更高。

表3 地质灾害易发性分区结果Table 3 Geological disasters susceptibility division results

图4 基于BP神经网络法的易发性分区图Fig.4 Susceptibility division map based on BP neural network method

3 结论

(1) 以蕲春县为研究区,选取坡度、坡高、地质构造、工程地质岩组、曲率、斜坡结构6个因子作为地质灾害易发性分区的评价指标。

(2) 通过MATLAB软件建立BP神经网络,使用机器学习算法得到6个评价因子最优拟合权重值后,导入ArcGIS空间分析平台进行叠加分析,得到蕲春县地质灾害易发性分区结果。对比基于层次分析法的地质灾害易发性分区结果,认为基于BP神经网络的地质灾害易发性分区结果可靠且准确度更高。

图5 基于层次分析法的易发性分区图Fig.5 Susceptibility division map based on analytic hierarchy process

(3) BP神经网络法采用机器学习算法得到最优拟合权重值,避免了人工主观干预打分造成定量评价不充分的问题,具有应用便捷、结果可靠、准确度高等特点,使用该方法进行地质灾害风险评价具有很好的应用前景。

猜你喜欢
蕲春县信息量易发
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
冬季鸡肠炎易发 科学防治有方法
基于GIS和信息量法的四川峨眉山市地质灾害易发性定量评价
基于信息理论的交通信息量度量
蕲春县踏红亭
蕲春县再生稻产业发展现状及对策
蕲春县优质稻生产现状及发展对策
如何增加地方电视台时政新闻的信息量