蔡伶波 ,杨宁
(1.四川煤田一四一建设投资有限公司;2.西南科技大学)
【关键字】 大数据; 地理信息科学; 地质灾害防治;边坡监测
我国是世界上地质灾害最为严重的国家之一,灾害种类多、分布地域广、发生频率高、造成损失大。近年来,变化莫测的局地强降雨和强热带风暴导致的暴雨,使地质灾害的突发性越来越强,监测预警的难度越来越大。传统的周期性监测手段已不能满足地灾防治需要[1]。
随着测绘设备与技术、GIS技术的快速发展及不断完善,大数据在测绘领域的应用越来越广泛。大数据在地质灾害实践及应用中,通过获取相关地质灾害数据信息,并将这些数据信息通过空间分析等技术进行研究分析,从而转化成地质灾害形成因素的一种解释,使这些数据在某种特定情况下,更具针对性、准确性以及高效性,只有这样才能对地质灾害形成的规律以及地质灾害预测的更全面、更精确[2]。目前GIS地灾监测预警联动系统已开始推广和普及,可以进行全天候连续动态监测,然而其数据分析还是基于传统模式,先对较单一来源数据进行分析,发现问题才结合其他数据进行分析,远远不能达到智能分析的效果,极易出现分析错误。本文以GIS边坡监测预警平台为例,将GIS地灾监测系统采集的多源数据结合时间维要素,融合测绘、地信、地质、环境、土建等专业数据,从数据自身特性出发,研究正常数据与异常数据的相关性,结合大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),采用多源信息的大数据挖掘算法,从另一个角度提取出数据中的隐含信息,帮助工程人员制定防治策略,从而达到智能防治边坡地质灾害发生的目的[3]。
边坡地质灾害防治的目的:
1)对边坡进行稳定性监测,实施动态设计、动态施工,确保安全、快速的施工。
2)评价边坡施工及其使用过程中边坡的稳定性,并作出有关预测预报,为业主、施工单位及监理提供预报数据,跟踪和控制施工过程,合理采用和调整有关施工工艺和步骤,取得最佳经济效益。
3)为防止滑坡及可能的滑动和蠕变提供及时支持,预测和预报滑坡的边界条件、规模滑动方向、发生时间及危害程度,并及时采取措施,以尽量避免和减轻灾害损失。
4)为滑坡理论和边坡设计方法的研究提供参考依据。
5)为边坡支护工程的维护提供依据。
6)通过专业设备来预测边坡体发展变化趋势,对边坡体进行监测预警,及时为政府及有关部门提供已经和可能发生的边坡动态信息,为政府防灾、减灾决策和实施方案及时提供科学依据和技术支撑。
针对以上6点,本文提出了新的边坡地灾防治监测数据分析技术(见图1):
该系统的数据采集仍然使用当前推广的地灾自动监测系统进行采集,系统的核心为多源信息大数据分析算法。现今大数据分析算法层出不穷,其中Adaboost算法计算效率较高,算法简洁易于实现,特别适合灾害实时监测需求。Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。
图1 边坡地质灾害防治的技术
弗罗因德提出adaboost算法,其主要框架可以描述为:
假设样本:(x1,y1)……(xm,ym)其中xi∈X,yi∈Y={-1,1}
初始Dj(i)=1/m
For t=1,…,T :
{
通过D分布寻找当前分布下的最优弱分类器;
得到弱分类器ht:X→{-1,1}的误差满足εt=Pri~Dt[ht(xi)≠yi];
其中Zt为归一化因子。
}
聚合多次训练的弱分类器,得到最终的决策结果:
多源数据构建了边坡稳定性评价的核心体系。大数据分析流程为:
1)从现场监测项目的多监控数据入手,获取地表变形监测点沉降观测数据(a1…am)、地表变形监测点水平位移观测数据(b1…bm)、抗滑桩变形监测点沉降观测(c1…cm)、抗滑桩变形监测点水平位移观测(d1…dm)、雨量监测点观测数据(e1…em)、地表裂缝观测数据(f1…fm)等建立各数据的变化曲线(其中m为监测总天数)(下面图2为丹景山雷打石边坡监测部分监测数据,仅作为解释数据分析方法所用)。
图2 丹景山雷打石边坡监测部分监测数据
2)对不同类型的监测数据进行归一化处理,然后根据时间相关性建立初 始 样 本 模 型 集 (a1,b1,c1,d1,e1,f1…)…(am,bm,cm,dm,em,fm…);
①初始化训练数据的权值分布,设计第k个弱学习器的输出权重为,
此处为天数m的倒数;
②计算加权误差,不断修正权重系数D(k);
③不断重复(2),(3)步,直到误差满足需求,结束循环。
3)聚合多次训练的弱分类器,得到最终的决策结果:
图3 最终分析结果示意图
图3为分类结果示意图(图中线段长度不均匀,为其误差值曲线表征)。图中数据分布较为均匀,没有出现异常样本数据,表明地表裂缝观测点、地表变形监测点及抗滑桩变形监测点均处于相对稳定状态。由于样本中地表变形监测值出现小范围异常数据,根据数据相关性原理图中样本自动分为四个区间,这说明在某期之后发生相对于其他时间段更大的位移量,需要得到监测团队的重视并做进一步分析。
本文利用了大数据技术与GIS方法各自的优势,互补了单一方法在技术上的不足之处,采用多源数据大数据分析技术,对整个观测数据进行综合分析,研究时间序列上的相关性,其结果保证了监测结果的科学性,为灾害防治决策提供了科学可信的依据。
大数据技术是一种新型的数据分析手段,目前在边坡地质灾害防治方面的应用较少,由于其算法应用难度,实际生产应用背景的缺乏,需要加强大数据在测绘、地理信息科学、地质灾害防治等方面研究工作。本文将大数据分析技术引入到地质灾害防治监测中,这是一种理论结合实际新的尝试,是对这方面研究工作的一种探讨。有了这一步理论的成功实现,后面的研究可集中于更加宽泛的数据样本集合设计与快速算法分析,从多学科数据中提取出更有价值的有效信息,结合深度学习技术满足自动采集、处理、决策的需求。