基于神经网络模型的斜坡地质灾害易发性评价:以吉林永吉为例

2019-02-10 10:02刘飞秦胜伍乔双双窦强扈秀宇
世界地质 2019年4期
关键词:永吉县易发斜坡

刘飞,秦胜伍,乔双双,窦强,扈秀宇

吉林大学建设工程学院,长春130026

0 引言

斜坡地质灾害[1]是指在降雨、人工爆破、坡脚开挖和地下开采等外界因素下,受到重力的影响,坡体物质沿坡体向下滑动,并造成人员伤亡、财产损失等地质灾害。永吉县是吉林省吉林市的一个市辖县,其东部地貌以山区为主,地势起伏较大,雨季降雨量大,加之人类工程活动,存在大量的斜坡类地质灾害隐患。为减少斜坡地质灾害的危害性,对研究区的斜坡地质灾害进行了易发性分析,从而为永吉县斜坡地质灾害的预测和治理提供了依据。

目前,对于地质灾害易发性的制图方法,已经从开始的定性分析发展到定性--定量分析,再到定量分析。定量分析的评价结果客观,不受人为主观干扰,主要包括传统的统计分析法和新兴的机器学习法。统计分析法包括:频率比[2]、信息量[3]和确定系数[4]等。斜坡地质灾害作为一种非线性系统,一般的线性统计方法难以准确的进行模拟。而机器学习法能够较好地处理非线性问题。常用的机器学习法主要有:人工神经网络[5]、支持向量机[6]和逻辑回归[7]等。这些方法都有着各自的优缺点:支持向量机模型的数学函数比较复杂,不能较好地解决多分类问题;逻辑回归模型在建模过程中的主观干扰比较大;而神经网络模型具有强大的学习能力,可以较好地处理区域内灾害易发性与影响因子的非线性关系。D. P.Kanungo等人研究表明,相比其他方法,神经网络模型对于评价因子权重的计算更为准确[8]。因此笔者选取神经网络模型对永吉县区域的斜坡地质灾害进行易发性评价,同时为更直观地体现神经网络模型的评价效果,构建频率比、支持向量机模型和神经网络模型进行对比验证。

1 研究区概况

永吉县位于吉林省吉林市,地理坐标分别为:125°47′43″~126°39′40″E,43°18′36″~43°53′12″N,面积为2 625 km2。区内春夏秋冬四季明显,冬季、夏季温度差别较大,年平均降水量677.4 mm。东南部是山区,西北部是台地,地势从南到北、从东到西逐渐降低,最高海拔1 387 m,最低点的高程为182 m。区内北东向、北西向断层发育,岩体主要有第四系土体、坚硬的块状岩和层状岩组、较软和较坚硬的碎屑岩岩组[9]。由于较差的地质环境质量,研究区分布大量的斜坡地质灾害,对农田、人员、道路和房屋等造成极大的威胁。

经调查,研究区共发现了131处斜坡类地质灾害点,包括111个不稳定斜坡和20个崩塌,主要分布于永吉县中部低山区域、东南部中山和河谷区域,灾害点分布情况见图1,本文按照70%:30%的比例将灾害点随机分为2组,训练点92个,验证点39个,用于模型的建立和验证。

2 研究方法

2.1 评价因子选取

根据研究区实际情况以及对影响斜坡地质灾害发生的地形因素、环境因素以及地质因素进行分析最终选取:高程、坡度、坡向、剖面曲率、平面曲率、距断层距离、岩性、距河流距离、年均降雨量、地形湿度指数(TWI)和植被覆盖指数(NDVI)等11个影响因子,利用ArcGIS软件进行重分类(图2),因子分级情况见表1。分类方法主要是常用的自然间断法。自然间断法是对分类间隔加以识别,对相似值进行最恰当地分组,并使各个类之间的差异最大化。

数字高程模型(DEM)反映了地表高低情况,斜坡地质灾害的发生与高程值密切相关。本文选用的DEM栅格单元大小为8 m×8 m,高程值分布在181~1 387 m之间,基于ArcGIS软件利用自然间断法将高程值划分为:181~248 m、248~328 m、328~413 m、413~512 m、512~649 m、649~848 m、848~1 387 m等7个等级,根据分区结果,高程在181~413 m范围最有利于斜坡灾害的发生。

图2 评价因子图Fig.2 Diagrams of evaluation factors

表1 斜坡地质灾害易发性评价表

Table 1 Table of slope geological hazards susceptibility evaluation

评价因子分类子类所占比例 /%灾害点所占比例 /%神经网络频率比支持向量机高程/m181~24828.0%22.8%0.073 4 0.815 6 0.106 0 248~32826.8%53.3%0.179 1 1.990 4 0.258 7 328~41323.2%18.5%0.071 8 0.797 9 0.103 7 413~51212.3%3.3%0.023 8 0.264 2 0.034 3 512~6496.5%0.0%0.000 0 0.000 0 0.000 0 649~8482.4%0.0%0.000 0 0.000 0 0.000 0 848~1 3870.9%2.2%0.221 8 2.464 0 0.320 3 距断层距离/m<1001.7%0.0%0.000 0 0.000 0 0.000 0 100~2001.8%0.0%0.000 0 0.000 00.000 0 200~4003.8%7.6%0.341 9 2.011 3 0.020 1 400~8008.0%10.9%0.230 9 1.358 3 0.013 6 800~1 60015.5%13.0%0.142 8 0.839 9 0.008 4 >1 60069.2%68.5%0.1682 0.989 2 0.009 9 岩性坚硬的层状岩2.0%1.1%0.026 9 0.537 1 0.016 1 坚硬的块状岩28.6%23.9%0.041 8 0.835 2 0.025 1 较坚硬的碎屑岩11.0%2.2%0.009 9 0.198 0 0.005 9 较软碎屑岩21.1%5.4%0.012 9 0.257 1 0.007 7 土体37.2%67.4%0.090 5 1.810 2 0.054 3 坡度0°~3.48°43.9%8.7%0.027 7 0.197 9 0.017 8 3.48°~8.02°20.2%26.1%0.180 8 1.291 1 0.116 2 8.02°~12.86°16.8%38.0%0.316 8 2.262 8 0.203 7 12.86°~18.46°13.3%20.7%0.218 0 1.557 4 0.140 2 18.46°~38.90°5.8%6.5%0.158 1 1.129 6 0.101 7 >38.90°0.0%0.0%0.000 0 0.000 0 0.000 0 坡向Flat10.1%1.1%0.009 6 0.107 1 0.017 1 N10.0%4.3%0.039 0 0.432 8 0.069 2 NE11.7%6.5%0.050 1 0.556 8 0.089 1 E10.1%14.1%0.125 6 1.395 9 0.223 3 SE9.7%28.3%0.262 3 2.914 3 0.466 3 S10.2%17.4%0.153 5 1.7051 0.272 8 SW13.0%19.6%0.135 3 1.503 1 0.240 5 W13.1%6.5%0.044 6 0.496 1 0.079 4 NW11.9%2.2%0.016 4 0.182 5 0.029 2 距河流距离/m<10013.7%35.9%0.131 1 2.621 0 0.078 6 100~20012.0%18.5%0.077 3 1.545 3 0.046 4 200~40019.6%20.7%0.052 6 1.051 3 0.031 5 400~80027.2%12.0%0.022 0 0.440 3 0.013 2 800~1 60023.1%10.9%0.023 6 0.471 4 0.014 1 >1 6004.5%2.2%0.024 2 0.483 4 0.014 5 年均降雨量/mm60050.8%40.2%0.039 5 0.790 9 0.039 5 70049.2%59.8%0.060 8 1.216 3 0.060 8

续表1

评价因子分类子类所占比例 /%灾害点所占比例 /%神经网络频率比支持向量机剖面曲率-6.8~0.0125.5%19.6%0.023 00.766 60.015 3-0.01~0.0142.7%29.3%0.020 60.686 60.013 70.01~9.231.7%51.1%0.048 31.609 80.032 2平面曲率-5.6~0.0127.4%32.6%0.035 81.191 70.083 4-0.01~0.0144.8%28.3%0.018 90.631 30.044 20.01~5.527.9%39.1%0.042 11.404 20.098 3TWI<8.5119.8%22.8%0.046 11.152 80.046 18.51~10.5329.1%33.7%0.046 31.158 70.046 310.53~12.5526.7%32.6%0.048 81.221 00.048 812.55~16.0913.4%2.2%0.006 50.161 80.006 516.09~27.201.9%0.0%0.000 00.000 00.000 0>27.209.1%8.7%0.038 20.954 70.038 2NDVI-0.990~0.0951.2%0.0%0.000 00.000 00.000 0-0.095~0.1378.3%16.3%0.313 11.956 90.489 20.137~0.3428.8%27.2%0.495 93.099 30.774 80.342~0.49711.6%30.4%0.419 12.619 60.654 90.497~0.61325.5%17.4%0.10930.683 00.170 70.613~1.00044.6%8.7%0.031 20.194 80.048 7

坡度和坡向是利用ArcGIS软件中的提取工具,从基础数据DEM中获得。坡度的大小影响着斜坡的稳定性[10]。永吉县坡度分布在0°~38.90°之间,按照自然间断法共分为6个等级,分别为0°~3.48°、3.48°~8.02°、8.02°~12.86°、12.86°~18.46°、18.46°~38.90°,斜坡灾害在0°~18.46°分布最多;斜坡坡向由于受到的光照不同,所以土的力学特性差异较大[11]。按照45°一个等级,将坡向分为平面、北、东北、东、东南、西、西南、西和西北9个等级,西南、南和东南方向的斜坡地质灾害发育较多。

剖面曲率和平面曲率反映着地面的凹凸情况,影响着斜坡地质灾害的发育。按照自然间断法:剖面曲率分为-6.8~0.01、-0.01~0.01、0.01~9.2,平面曲率分为-5.6~0.01、-0.01~0.01、0.01~5.5,其中正值代表地形向上凸,负值代表地形向下凹;灾害点分布在凸起的地形中。

断层的发育影响着岩体的质量,从而影响斜坡灾害的发育,利用ArcGIS软件对断层进行缓冲区划分,分为<200 m、200~400 m、400~800 m、800~1 600 m、>1 600 m等5个等级,结果显示,断层附近100~400 m的斜坡地质灾害更为发育。

岩性是斜坡地质灾害发育的基础,在不同的岩性地区,灾害发育情况差别明显。永吉县的岩性按照硬度和结构特性进行划分,主要为坚硬的层状岩、坚硬的块状岩、较坚硬的碎屑岩、较软碎屑岩和第四系土体5类,根据灾害点的分布情况,第四系土体中斜坡地质灾害发育最多。

河流也是导致斜坡地质灾害产生的重要因素,距河流越近的地区越容易受到河流的冲蚀以及软化,利用ArcGIS软件对河流进行缓冲区划分,分为<100 m、100~200 m、200~400 m、400~800 m、800~1 600 m、>1 600 m共6个等级;距河流400 m之内的斜坡受到的影响最大、分布最多。

降雨不仅会冲蚀坡体表面,还会浸透到岩体内部,造成岩体软化,促使斜坡地质灾害形成。永吉县年均降雨量分别是600 mm和700 m,其中700 mm降雨量的区域斜坡地质灾害发育较多。

地形湿度指数TWI是以DEM为基础数据,利用GIS软件的水分分析模块获得,表示土壤水分情况。将获取的TWI分为<8.509、8.509~10.530、10.530~12.550、12.550~16.086、16.086~27.199、>27.199共6个等级,斜坡地质灾害主要分布于0~16.086之间。

植被覆盖指数NDVI主要体现了研究区域内的植被覆盖情况,其公式为:

NDVI=(NIR-R)/(NIR+R)

(1)

式中:NIR和R表示近红外波段和红光波段的反射值;本文通过地理空间数据云获得近红外波段和红光波段的反射值,利用GIS软件根据上述公式进行栅格计算,得到植被覆盖度,结果按自然间断法分为:-0.99~0.095、-0.095~0.137、0.137~0.342、0.342~0.497、0.497~0.613、0.63~1共6个等级,其中斜坡地质灾害在0.497~1之间发育最多(表2)。

表2 评价因子的数据来源

2.2 神经网络模型

神经网络是由一系列小型处理节点组成的网络系统,现已广泛用于易发性测绘,可以用来处理非线性问题。三层BP神经网络模型近年来被应用于各个方面。

设输入层A=(A1,A2,A3…Ai…AI),隐藏层B=(B1,B2,B3…Bj…BJ),输出层C=(C1,C2,C3…Ck…CK)和期望输出层为:D=(D1,D2,D3…Dk…DK),神经元Bj和Ck的关系方程如下:

(2)

(3)

式中:j=(1,2,3…J),k=(1,2,3…K);wij和aj分别为输入层和隐藏层之间的权重和阈值;wjk和bk分别为隐藏层和输出层之间的权重和阈值;f1,f2是激活函数[12];

BP模型的输出误差公式为:

(4)

模型通过选取合适的激活函数,不断调整阈值和权重,使得MSE的值最小。

2.3 频率比模型

频率比是一种传统的概率统计方法,其定义是对于给定属性灾害发生的可能性与不发生的可能性之比。其比值与影响因子的重要程度相关,比值>1表示重要,反之说明较低。计算公式为:

(5)

式中:A1代表该影响因子的特定级别内出现的灾害点的网格数目;A2代表研究区所有灾害点的网格数目;B1代表该因子特定级别的总网格数目;B2代表研究区网格的总数目。

2.4 支持向量机模型

支持向量机(SVM)是通过寻找一个超平面将数据进行分割的二分类模型,目的是为了把问题转化为一个凸二次规划问题。其原理是将原始空间里的训练数据根据确定的函数映射到更高空间,从而使得样本在这个空间中线性可分[13]。选取RBF核函数,利用线性回归函数f(x)=ax+b,对数据点(Xi,Yi)进行拟合,其中i=1,2,3…n;设拟合的精度为c,则有:

Yi-f1(Xi)≤c+ξi

(6)

f1(Xi)-Yi≤c+ξi′

(7)

式中:i=1,2,3…n,ξi,ξi′为松弛因子且≥0,没有误差时取0。目标函数变为:

(8)

式中:C是惩罚参数,且C>0。对公式(6)、(7)和(8)进行求解,变为凸二次规划问题,使用拉格朗日函数:

(9)

式中:α,α′,γ,γ′为拉格朗日乘数,ai′≥0,γi′≥0,i=1,2,3…n。求函数L对a,b,ξi,ξi′的最小化以及对α,α′,γ,γ′的最大化,带入式(9),得到对偶形式和它的最大化函数。最后求得:

(10)

3 结果及讨论

3.1 模型结果

神经网络(ANN)模型通过SPSS软件构建,将11个影响因子作为输入层,进行神经网络模型的训练,再利用GIS软件得到斜坡地质灾害易发性分区图(图4)。根据自然间断法将结果分为:极高易发区、高易发区、中易发区、低易发区、极低易发区,面积分别为9.2%、18.1%、23.5%、30.7%、18.6%,各分区对应的灾害点分别为61个、24个、6 个、0个、1个,位于高易发区的灾害点个数占总灾害点个数的92.4%,结果合理。

神经网络模型构建的易发性分区情况为:高和极高易发区主要分布于永吉县东南部的北大湖镇、西阳镇、双河镇一带的中低山区以及永吉县中部的口前镇、金家乡、黄榆乡一带的丘陵地区,该区由于村民建房、修路削坡等形成了大量不稳定斜坡,区内出露岩层主要为花岗岩,岩体中的原生节理和构造裂隙发育,风化程度高,第四纪土层覆盖较多,降雨充沛,容易形成斜坡类灾害;而中易发区主要分布于永吉经济开发区洋草沟村、乃子街村,北大湖镇小山村、南沟村、朝阳村,一拉溪镇碾子沟村、松花村、索屯村,口前镇繁荣村、达屯村、春登村,岔路河镇岔路河村和马家村等,分布区域广泛,岩性主要由较软碎屑岩和花岗岩构成,节理较发育,人类工程较频繁,在降雨作用下较易形成斜坡灾害;低和极低易发区主要分布于北部的岔路河镇、一拉溪镇、万昌镇一带的台地区域,以及中部的西阳镇、黄榆乡、金家乡区域,该区地势较为平缓,地貌以台地和河谷为主,人类活动弱,植被覆盖较好,不易形成斜坡类地质灾害。

利用神经网络计算得到因子的重要性见图3。结果显示高程、坡向、NDVI、TWI是影响斜坡灾害发育最重要的3个因子,占据全部因子重要性的54.00%;其次岩性、距断层距离、距河流距离也对斜坡灾害的发育影响较大;而剖面曲率、平面曲率、降雨和坡度对斜坡灾害的发育影响较小,重要性仅占18.82%。

图3 ANN计算因子重要性图Fig.3 ANN calculates factors importance graph

频率比模型按照公式(4)先计算11个评价因子图层的权重,再通过Arcgis软件进行叠加,得到易发性图(图5),将结果分为极高易发区、高易发区、中易发区、低易发区和极低易发区5类,对应分区面积分别为8.0%、20.4%、29.0%、28.0%、14.6%;对应的灾害点个数分别为69个、15个、7个、0个、1个。

支持向量机模型通过SPSS软件构建,核函数选用径向基函数,系数选取0.1,惩罚系数选取1。利用自然间断法对得到的斜坡灾害易发性图进行分类(图6),分成5种类型:极高易发区、高易发区、中易发区、低易发区和极低易发区;相对应的面积分别为9.6%、18.0%、22.2%、29.6%、20.6%,分区情况见图6;对应分布的灾害点个数分别是55个、28个、7个、1个、1个(表3)。

表3 模型分区面积占比情况

图4 神经网络模型评价结果图Fig.4 Neural network model evaluation results

图5 频率比模型评价结果图Fig.5 Frequency ratio model evaluation results

图6 支持向量机模型评价结果图Fig.6 Support vector machine model evaluation results

3.2 模型结果验证

验证是易发性制图中必不可少的组成部分,直接决定了制图的质量。为评估选用模型的精度,使用受试者工作特征曲线(ROC曲线)来进行验证。受试者工作特征曲线是将特异性和敏感度分别作为横、纵坐标绘制得到的曲线[14]。曲线下的面积大小说明了模型的好坏,面积值与1越接近则说明模型的判别效果越好。

笔者将斜坡地质灾害点按70%∶30%的比例进行了划分[15],分别作为训练点和验证点,基于SPSS软件建立了成功率和预测率曲线(图7、8)。成功率法采用训练点作为模型建立的数据,不适合评价模型的预测能力,然而可以确定易发性图对现有区域的分级情况,而预测率曲线可以表示模型的预测能力(表4)。

表4 模型准确率及预测率表

根据表中数据,可以看出在训练效果和预测能力这两方面,神经网络表现最好,支持向量机模型次之,频率比模型最差;成功率和预测率之间的差值可以表示模型的稳定程度,神经网络、频率比模型、支持向量机的成功率与预测率差值分别是0.040、0.050、0.046,在稳定性方面同样是神经网络最好;从以上3方面可以看出,神经网络模型的性能最优,最适合永吉县的斜坡地质灾害易发性评价,且机器学习模型优于传统的概率统计模型。

图7 成功率ROC曲线Fig.7 ROC curvesof success rate

图8 预测率ROC曲线Fig.8 ROC curvesof prediction rate

4 结论

(1)神经网络模型的构建使用SPSS Modeler软件即可实现,相比于传统的频率比模型,实现方式简便,运行结果精度更高。

(2)将神经网络模型评价结果分为极低、低、中、高和极高易发区,面积分别为18.6%、30.7%、23.5%、18.1%、9.2%,灾害点占比为:1.10%、0%、6.5%、26.1%、66.3%,斜坡地质灾害分布情况符合易发性等级。

(3)通过ROC曲线对3种模型评价结果的精度进行检验,结果显示神经网络模型的训练效果、预测能力和稳定性均最高,评价效果最好,最适用于永吉县区域的斜坡灾害易发性评价。

(4)由神经网络模型构建的斜坡灾害易发区分布情况为:高和极高易发区主要分布于永吉县东南部的北大湖镇、西阳镇、双河镇一带的中低山区以及永吉县中部的口前镇、金家乡、黄榆乡一带的丘陵地区;中易发区主要分布于永吉县永吉经济开发区、洋草沟村、乃子街村,北大湖镇小山村、南沟村、朝阳村,一拉溪镇碾子沟村,松花村、索屯村,口前镇繁荣村、达屯村、春登村,岔路河镇岔路河村和马家村等;而低和极低易发区主要分布于北部的岔路河镇、一拉溪镇、万昌镇一带的台地区以及中部的西阳镇、黄榆乡和金家乡区域。

猜你喜欢
永吉县易发斜坡
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
冬季鸡肠炎易发 科学防治有方法
永吉县农业农村局挂牌成立
信仰的“斜坡”
梦是长长的斜坡(外一首)
永吉县芹菜沟水泥用灰岩矿床地质特征
无轨斜坡道在大红山铁矿中的应用
怪轮DIY,轻松爬斜坡