边坡变形预测研究现状与发展趋势

2020-03-03 10:34金云鹏何习平吴定邦秦浩靖牛景太
江西科学 2020年1期
关键词:监测数据数据挖掘边坡

金云鹏,何习平*,吴定邦,秦浩靖,牛景太

(1.南昌工程学院水利与生态工程学院,330099,南昌;2.江西省水利规划设计研究院,330029,南昌)

0 引言

地质环境是人类生活的载体,但如今我国地质环境状况不容乐观,各类地质灾害频发。国家统计局所给数据表明:本世纪初我国因地质灾害所带来的损失较大,仅2000年的伤亡人数就高达27 697,经过重点防治后,在2013年,由滑坡、崩塌、泥石流以及地面塌陷带来的直接经济损失依然多达104亿元,2013-2017年累计255亿元,5年累计伤亡3 104人,伤亡人数仅次于地震与洪水灾害[1]。并且,地质灾害对环境破坏及其次生灾害所造成的损失更是无法计量。

西部大开发与可持续发展等国家战略的实施使得我国基础设施建设行业迎来了飞速发展,在迅速提升我国国内生产总值(Gross domestic product,GDP)的同时,各类特大型工程施工所形成的边坡也成为了失事隐患。如滑坡、泥石流等地质灾害的发生,严重危害了国民生命财产与环境安全。因此,地质灾害防治受到了国家有关部门的重视,自2010年起,地质灾害防治项目数与投资数都处于高位。作为边坡变形监测研究工作的目标,边坡变形预测对滑坡类地质灾害防治具有重要意义。本文拟对边坡变形预测的研究现状与发展趋势进行探讨。

1 变形监测数据预处理

由于环境、仪器故障等影响以及测点数目增加、观测数据量增加和人为操作失误等问题的存在,监测数据粗差不可避免。粗差的出现会影响平差结果,导致数据失真,在此基础上,导入变形预测模型进行分析就会发生错误。因此,粗差定位与剔除是数据处理较为关键的一步。

粗差定位方法在Baarda理论的基础上发展而来,主要分为假设检验、抗差推估等[2],欧吉坤[3]等人的最小二乘抗差估计是国内较为系统化的理论体系。假设检验法即假设粗差确实存在于监测数据中,将粗差纳入函数模型来逐个计算统计量与估值,抗粗差干扰性差与最小二乘法所带来的均摊效应是其主要缺点。抗差推估则是通过控制估值与监测数据的偏差来对数据进行导向控制,该法通过残差拟合得到的抗差权函数往往难以获取精确估值,故权函数的选取是其关键步骤,降权临界值的选取也是其拓展的重点。

从不同角度出发进行改进或结合不同方法组合分析是对上述方法较为典型的改进策略,如柴双武[4]对传统的多维粗差探测法向后-向前选择法进行了优化,使得估值结果可靠,粗差定位转移现象得到改善。王伟[5]提出了利用水准网环闭合差分析和Baarda探测法进行组合粗差探测的分析方法。卢楠[6]改进了常规四分点(IQR)法,通过对露天矿山边坡变形监测数据序列中的粗差探测,探测敏感度进一步提升。同时,国内新的定位理论也有一定的收获,如王建民[7]提出的相邻方差比检验法,王奉伟[8]提出的局部均值分解粗差探测方法以及陶园[9]提出的基于人工免疫模式的多层粗差检验法等。

粗差定位工作完成后还需将其剔除,粗差剔除通常运用的是数理统计方法,主要有拉依达(3σ)准则、格拉布斯(Grubbs)准则和狄克逊(Dixon)准则和四分点(IQR)准则等。不同的样本特征对应着不同的判别准则:Grubbs法更为适用于剔除小样本中的单个异常值,3σ准则更为适合较大样本,Dixon准则是非参数判别,将极差作为统计量对粗差进行判别,可以较迅速地判别含有粗大误差的观测值。仅依据单一准则使用拟合值残差或极值等指标进行评判,可能出现对数据利用程度不足的情况,产生误判和漏判的风险,面对上述准则存在的问题,国内也有一些创新的方法,如花胜强[10]根据层次分析法(Analytic Hierarchy Process,AHP)得到4个主要粗差剔除准则的权重系数,并设定好粗差判定阈值进行综合评判。毛亚纯[11]提出了基于拉依达法则(3σ法则)的数据跳跃法,连增增[12]等采用Baarda粗差剔除法对变形监测数据进行过滤。

由于边坡变形机理的研究尚未深入,且外界环境因素的复杂程度很高,较为普适性的粗差定位理论难以实现。因此,目前在边坡监测数据领域的粗差定位与剔除修复的研究工作更多是在数据针对性理论上,未能取得较系统的研究成果。

2 边坡变形监测数据挖掘

数据挖掘是从大量看似无规则的数据中通过算法找到其中隐藏信息和模式的过程,主要包括监督的分类、预测和无监督的聚类、相关性分组等方法。在边坡数据信息领域中,数据挖掘主要体现在空间预测和危险性评价等方面,数据种类大都为水文与地质等空间数据。蕴含边坡大量运行状态信息的多元变形监测数据存储于结构化数据库中,通过对数据库直接采用机器学习的数据挖掘技术,发现监测数据的潜在规律与有用信息。当前较主流的数据挖掘方法有支持向量机(Support Vector Machine,SVM)、决策树算法、朴素贝叶斯、K-means、Logistic回归、主成分分析(Principal Component Analysis,PCA)和Apriori算法等[13],涵盖了关联、聚类、统计与回归等多个方面。

在滑坡敏感性评价模型中,由于数据挖掘技术在实现工具方面较为稀缺,数据挖掘技术在其领域推广受限,Palamakumbure[14]等结合See5.0决策树方法和GIS技术下的ArcGISv.10软件联合开发了一款全自动化工具插件,为更多科研人员带来便利,获得了国际上的广泛认可。Venkatesan等[15]基于改进的贝叶斯分类技术,与支持向量机做比较,证明了前者在数据挖掘层面更适用于滑坡敏感性预警模型。

国内学者对于边坡监测数据挖掘最主要的目的在于探求影响边坡稳定性的影响因素,周科平等[16]运用基于粗糙集理论的数据挖掘技术进行了分析,将边坡稳定性程度进行量化表达,很好地说明了粗糙集理论不单单局限于分类问题,也可以用于特征归约和相关分析。赵建华[17]利用决策树算法对滑坡数据进行挖掘,分析了多种影响因素并得到一组判定坡体稳定性的规则,建立了划分评价滑坡危险区域的模型。牛岩[18]等基于灰色关联分析法对边坡进行敏感性分析,得到各影响因素与安全系数的关联程度大小的关系,利用敏感性分析结果,可对边坡加固策略提供参考,从而更为高效地提高边坡的稳定性。

目前我国国内相关的监测数据传播共享途径较少,且边坡监测技术在动态多元化多方位方面的发展尚未成熟,更多还是针对传统数据类型的研究,对于动态多方位滑坡监测数据的数据挖掘研究较少,在数据挖掘深度及其研究成果利用程度上也没有进一步深入[19]。

3 边坡变形预测模型研究现状

边坡变形监测研究中,变形预报的精准度对于防灾减灾、模型反演都具有十分重要的参考意义,所以在近几十年的过程中,对于探求坡体变形机理、边坡变形预报的理论研究,国内外学者做了大量工作,但由于坡体结构、组成材质的物理力学性质、外力作用的复杂性,涉及诸如测量学、数理统计学、工程力学等众多学科,所建立的模型往往特点鲜明,各有利弊[20]。按照基本原理,模型主要可归纳为以下几类:确定性模型、统计型模型与非线性模型。

3.1 确定性模型

确定性模型是基于蠕变理论等物理力学知识所构建的预测模型,具有明确的数学关系表达,能够反映边坡的物理实质,多适用于边坡单体预测。其主要包括基于斋藤迪孝边坡三阶段蠕变理论的经验模型及其扩展模型,如HOEK法与Hayashi模型等,Fukuzono与Voight通过破坏演变速度与加速度实验得到的位移速率倒数模型及其扩展模型等。诸如有限元法、有限差分法及离散元法等数值模拟方法是其主要的实现手段,常与反演分析联合使用。虽然确定性预测模型具有明确物理意义,有一定普适性,但由于边坡的高复杂性,确定性模型需要较多关于地质条件与岩土体材料等综合数据[21],所以其预测精度相对较低。

3.2 统计模型

相较于确定性模型,统计位移预测模型注重的是监测数据的统计意义。通过引入概率论、灰色系统理论、模糊数学等数学统计理论,统计模型利用现有变形数据拟合边坡的时程破坏曲线进行预报。由于无法考虑边坡随外界因素变化的影响,统计模型的外延性较差。虽然其预报精度较高,但通常仅对单个边坡变形适用,普适性较差。灰色预测模型是较具代表性的统计模型,自灰色系统理论问世以来,由于边坡的贫信息与模糊属性与其理论特点较为契合,引发了较多专家学者对灰色预测模型的关注与研究,其中GM(1,1)模型被广泛运用,各类改进模型、融合模型以及对应不同序列类型的预测模型也应运而生[22-27]。还有一种较为经典的方法是时间序列法,其最为典型的就是ARIMA(p,d,q)模型,即自回归积分滑动平均模型,该模型具有优秀的线性能力,在短期预报方面应用广泛:胡波[28]等对边坡变形监测数据进行时间序列分析,利用ARIMA模型取得较为理想的成果,可为防灾减灾和工程施工提供技术参考。胡添翼[29]等在运用传统ARIMA预测模型的基础上,引入Pearson相关性检验,定量分析了空间上不同测点位移之间的相关性,判断了被监测区域在空间上是否有整体位移或者局部位移的趋势,以便能对被监测区域空间整体的位移性态进行更全面地掌握。此外,边坡位移预测统计模型还有马尔科夫链、指数平滑法、卡尔曼滤波法、黄金分割法等多种方法。

3.3 非线性模型

非线性模型是指通过导入边坡监测数据,综合考虑边坡位移影响因子,引入机器学习或AI(人工智能)等非线性手段来拟合边坡位移的预测模型。运用较广泛的计算方法和高效优化算法,包括人工神经网络(Artificial Neural Network,ANN)、支持向量机、遗传算法(Genetic Algorithm,GA)、粒子群算法(Particle Swarm Optimization,PSO)、人工鱼群算法(Artificial Fish-Swarm Algorithm,AFSA)等。由于出色的非线性映射能力以及对边坡位移影响因子的充分考虑,目前主流预测方法采用的是智能算法相结合或统计模型与智能算法结合的预测模型,如Cao[30]等在分析位于三峡地区的白家包边坡变形与地下水位、库水位和降雨量关系基础上,提出了利用极限学习机(ELM)来建立与变形控制因素相关的边坡位移预测模型,认为边坡的阶梯式变形特征与影响因素的周期性变化紧密相关。Lian[31]等利用Kmeans与加权后的ELM构建分类预测模型,改善了位移突变点时间延迟情况,晏红波[32]等通过基于EEMD的改进BP神经网络取得了较好预测效果;王述红[33]等通过修正人工鱼群算法的步长,利用改进后人工鱼群算法优秀的寻优能力,优化了Elman神经网络的初始阈值和权值,建立了改进的AFSA-Elman边坡位移预测网络,一定程度对Elman网络的预测精度和收敛速度进行了提升。特别地,近几年国内学者对于改进的支持向量机及其拓展模型展开了较为深入的探讨与研究,刘小生[34-41]等在参数寻优、核函数选取以及组合模型方面的探索和改进都提升了模型的预报精度。

4 边坡变形预测的发展趋势

20世纪90年代开始,交叉学科领域所产生的研究方法如雨后春笋般出现,经历了从简单的定性现象预报到如今结合计算机与智能算法的动态定量预报的过程,边坡变形预测随着时代的发展一同进步,目前已进入了实时跟踪监测仪器并反馈信息,进行动态预测,与数值计算手段有机结合的系统化研究阶段,其历经数十载,取得了实质性的进展,但边坡本身的不确定性仍是制约边坡位移预测模型精度提升的主要因素,且目前的非线性手段也存在着一些理论上的不确定性。诸如人工神经网络隐含层神经元数的确定、粒子群算法算法越界、遗传算法初始参数的选取等问题,仍需专家学者进一步探讨与研究。预计未来边坡变形预测的研究将主要分布于以下4个方面。

4.1 非线性模型主导

边坡自身所具有的众多影响因素和复杂动态非线性特征往往使得传统的线性预测手段和单一预测模型预报精度不够理想。而随着应用数学与计算机技术的发展,在机器学习与人工智能领域运用广泛的非线性手段陆续被工程变形预报与分析引入,时至今日,多模型耦合共同预测已颇有成效,基于不同改进方向的混合智能算法预测模型也日益精进。能够较好地刻画边坡位移发展变化的同时,非线性混合智能算法模型还具有更优的预测精度,因此为其奠定了边坡变形预测模型的主导地位。

4.2 特殊地域针对性模型

我国地大物博、幅员辽阔,不同区域的地质条件与岩土体各项参数可能存在较大差异,针对不同地域、地形地貌的边坡变形预测或稳定性预测模型研究也逐渐受到人们的重视。由于矿区边坡与山区公路边坡失事对于国民人身财产安全影响较大,与人们的生活息息相关,故成为目前研究的侧重点。随着更深入的研究,通过对已有的经典模型进行迁移学习,各类特殊地域针对性预测模型也将具有广阔的应用前景。

4.3 结合大数据技术

作为当下研究的热门领域,大数据系统技术发展十分迅猛,计算机集群高速存储与计算优势可以在诸如Hadoop等主流平台的开源特性上得到较好体现,也因此大数据系统技术在众多学科得以应用并取得良好表现。将集成后的多源异构型边坡监测数据(历史滑坡数据、共享的地质环境信息数据、现场监测仪器获取的数据)进行数据清洗和转换,进行统一建模,可以存储于大数据平台的储存框架中(支持跨平台交互和共享)。在数据挖掘与统计分析后进行稳定性预测,结合信息管理和可视化动态展示,通过地理信息系统(Geographic Information System,GIS)呈现,可以为决策管理层或客户较为直观地展示评价状况[42]。结合大数据技术综合预测也是边坡预警系统的发展趋势。

4.4 深度学习

深度学习是人工智能领域极具发展前景的一个分支,它在人工神经网络的基础上发展而来,是一种机器学习方法,也是一种表示学习方法,最主要的模型是各种深度神经网络(Deep Neural Network)。其主要原理是通过构建一个多层的表示学习结构,使用一系列非线性变换操作把从原始数据中提取的简单初始特征进行组合,从而得到更高层、更抽象的表示[43]。在图像识别、语音识别、自然语言处理方面,深度学习取得了巨大成功,这也引起了各个学科对这一新兴学习方法的关注[44-47]。在工程应用领域方面也都有着积极的尝试[48-50]。以传统的单隐藏层神经网络为例,从理论出发,足够多的神经元能够形成一个很“宽”的网络,可以拟合任意函数,而深层网络结构更“深”:相同神经元数量情况下具有更大容量,分层组合带来的指数级表达空间,能够组合成更多不同类型的子结构,使学习和表示各种特征更为简易高效,对于多影响因子的边坡预测问题而言,深度学习将会是一个强大的解决手段。

5 结束语

边坡的失稳破坏,都有一个从渐变到突变的发展过程,在各类自然因素或人为因素的共同作用下,坡体内部所发生的应力集中和应力重分布效应使坡体内部应力超过其自身强度,从而导致边坡变形破坏。边坡变形预测能够在边坡失事破坏前反馈预警信息,对防灾减灾有着重大意义。面对复杂的边坡预测问题,改进方式是多个层面的:当前发展如火如荼的大数据平台能对以往监测数据传播共享困难这一难题作出较好的应对;对于边坡监测技术而言,随着科技的进步与硬件设备的更新迭代,该技术正朝着全方位多元化实时监测发展;基于非线性动力学理论的智能算法预测模型对边坡复杂影响因子的进一步刻画,预报精度将有所提升;且随着深层次数据挖掘与深度学习的工程应用推广,边坡变形预报技术将日臻完善。

猜你喜欢
监测数据数据挖掘边坡
陡帮强化开采边坡立体式在线监测技术研究
边坡控制爆破施工
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
二维极限平衡法在高边坡工程中的应用研究
GSM-R接口监测数据精确地理化方法及应用
水利水电工程高边坡的治理与加固探讨
环评中引用大气现状监测数据的研究
一种基于Hadoop的大数据挖掘云服务及应用
GPS异常监测数据的关联负选择分步识别算法