唐 宁
(广东省地质灾害应急抢险技术中心,广东广州 510080)
地质灾害是地球自然过程中产生的重大不利事件,如崩塌、滑坡、泥石流、地面塌陷、地面沉降等,造成重大生命损失和财产破坏。中国山地面积占国土总面积的65%左右,地质条件复杂活跃,是世界上山地灾害最严重的国家之一。最受威胁的弱势群体遭受着最严重的地质灾害。2018 年,全国发生地质灾害约3000起,直接经济损失达14.7 亿元。地质灾害区大多集中在在中国西部[1]。
易受地震断裂带、活火山、斜坡等影响的地区,在强降雨的情况下,可确定为滑坡风险地区。目前,国家有关部门建立了疑似山体滑坡数据库,已确定的高风险地质灾害区域超过30 万处,未来[2]发生的可能性很大。根据Brabb[3]的研究,如果能在滑坡事件发生前识别出问题,至少90%的滑坡损失可以避免。国务院办公厅强调,需要充分利用遥感数据支持地质灾害,包括灾害预防的各个阶段和方面[1]。显然,滑坡早期数据库对于重大危机下的滑坡定位、灾害预防和对特定区域的高度关注具有重要意义。然而,由于《自然[4]》中高度隐蔽、突然性和破坏性的特征,一些潜在的滑坡尚未被确定。换句话说,与未知的滑坡趋势相比,识别出的潜在滑坡数据库只占非常有限的一部分。一般来说,我们对已知数据库进行的研究既不彻底也不完整。地质灾害防治仍然是一项艰巨的任务。
一般来说,主流的地质灾害检测方法可分为两类,一类是基于专家知识的传统方法,另一类是基于遥感技术的方法。
大部分的研究都是建立在通过空间或统计数据分析,找出滑坡的制约因素和滑坡的发生。Pardeshi概述了传统方法,如基于库存的制图、启发式方法、概率评估、确定性方法、统计分析和多准则决策方法,包括降雨阈值模型和其他基于物理的滑坡易感性模型[5-6]。与滑坡发生相关的滑坡制约因素的选择方法很多。然而,这些方法严重依赖专家知识,这往往是主观的,耗时和费力的。而提取的特征往往局限于浅层信息,无法表达人们经常理解的语义信息。
遥感技术也被用于地质灾害的测绘、监测和探测[7-10]。卫星干涉合成孔径雷达(InSAR)可以提供从处理大量雷达卫星图像中获得的地面位移估计。应用小基线亚群InSAR 技术计算了金坪子滑坡[7]的时间序列变形。他应用InSAR技术和地面专业监测方法识别地质灾害[8]。遥感光学图像也可以看作是一种有用的工具。在文献[9]中提出了一种基于多数投票和多尺度分割相结合的滑坡清单制图框架。InSAR 和光学EO 数据被用于在应急管理的所有阶段(缓解、准备、危机和恢复[10])的滑坡绘图和监测。
近年来,随着大数据和人工智能技术的快速发展,神经网络方法应运而生并成功应用于滑坡易感性评价领域,而将其应用于地质灾害检测与预测的研究较少。
与之前的工作不同的是,考虑到目前防灾的现状,我们在本研究中试图回答以下两个关键问题:一是我们如何利用人工智能来探索和研究已确定的疑似滑坡数据库?二是如何利用已知数据样本的知识,广泛有效地预测和探测潜在的滑坡隐蔽点?为了找出这些问题的答案,在本文中,我们的贡献主要包括以下三点:
首先提出了一种基于InSAR和高分辨率光学遥感影像综合遥感技术的山体滑坡人工智能探测新框架。将这两种机制结合起来,通过实验发现可以有效提高地质灾害检测的效率。该框架应用现有数据库知识,扩展了简化的滑坡预测方法,并在中国金沙江白格滑坡预测中得到了成功的应用和验证。
其次详细讨论了如何通过对具有一定数据特征的样本子数据库进行分类,逐步构建包含异构数据融合的样本数据库。
最后提出了一种确定地质灾害隐患类型、空间位置、活动规律,形成地质灾害隐患分布图的综合识别模型。
利用InSAR 和高分辨率光学遥感图像,提出了一种综合遥感技术的人工智能山体滑坡探测新框架。高分辨率遥感主要用于地表条件,包括地形、覆盖和地面类型等基本信息的获取。然而,InSAR 通过测量表面位移来表征表面变形。两者结合深度学习方法的应用,分别从形态和变形的角度判断是否是滑坡。所提出的方法有以下五个主要步骤,如图1所示。
图1 拟议架构概述
随着基于深度学习和大量样本的智能地质灾害识别方法的探索和研究,综合利用遥感光学影像大数据、InSAR 产品等地理地质相关服务数据,可以对专家知识进行总结和提取。同时,高性能计算使大规模预测成为可能,提高了识别效率。同时,基于人工智能的识别地质灾害可以研究和探索通过广域空间的变化范围大的时间跨度下,结合地质灾害样本数据记录的专家、地形数据和居民区、道路、桥梁、城镇供水系统等。基本地理数据,如土地利用、土地和空间规划和其他数据、智能矿山地质灾害的特点是相对一致,并进一步自学来分析边坡可能的运动方向,形式和影响地质灾害的范围可以提高早期滑坡识别的可靠性和准确性。
具体来说,更多的研究基于以下领域的框架不需要进一步开展:
首先是影响因素与地质灾害的相关模型。专业知识的指导下,我们能够设计一个密集的深度学习模型,专家知识作为先验信息嵌入深度学习网络,或融合异构信息设计不同类型的网络中提取一个真理的特征,然后通过多层感知集成它们。该模型加速了算法的收敛速度,减少了训练样本的数量,最终提高了算法的性能。异构信息包括关于地形、地貌、地质、气候、水文、人类活动和其他因素的信息。
其次是地质灾害风险评估模型及关键因素的评估与监测。在各种典型地质条件下,不同因素对地质灾害的影响不同。基于特征反演技术,研究了地质灾害影响程度评价模型,确定了各种典型地质条件下关键因素的阈值。
传统的地质灾害识别方法高度依赖主观专家知识,需要耗费大量的人力和时间来逐一识别危险区可能发生的地质灾害。与传统的框架相比,本文提出的基于人工智能的框架具有以下三个方面的优势:
一是专家知识的总结和突出。在专家知识的指导下,通过对历史地质灾害样本的研究,可以获得地质灾区发现和风险评估的模型。当样本很少或没有样本时,建立一个基于语义信息的模型来实现专家知识的外显语法表示。
二是专家知识的推广和应用。该框架采用了专家知识的综合集成和一般规则与特殊场景的综合考虑,提高了模型的适用性;此外,模型的客观性和大数据处理能力的优越性提高了框架的应用价值。
三是发现新知识,更新专家知识。机器学习/深度学习建立了影响因素与输出结果的相关模型。通过与专家因果分析模型的比较,可以发现专家尚未掌握的新规则。经过专家评估/实地调查,新知识将进一步丰富具有原始认知的专家知识库,并以另一种方式反馈优化的机器学习/深度学习模型。
异构样本数据库的构建主要包括两个方面。一是地质灾害相关要素数据库,二是地质灾害相关要素数据库算法数据库的构建。元素数据库是算法数据库的基础和前提,算法数据库是元素数据库的价值体现。
这两个数据库需要逐步积累和完善,通过积累、有针对性的模型增强、专家知识的普适性、新知识的发现来增加基本要素的数量和类型。元素数据库的内容包括以下类型:
地形要素:山、坡、脊、河、湖等。地被要素:雪、植被(森林、牧场)、云等。人类活动要素:道路、桥梁、房屋等。
算法数据库的设计是为了实现遥感大数据的各种任务的目标。以地质灾害识别为例,算法库的建设主要包括:
基于InSAR地质变形数据的地面沉降聚类区识别模型;
基于高分辨率遥感影像的地面要素识别模型,包括边缘分割和目标识别模型;
基于元素分割与识别,高分辨率图像校正模型实现了由于视角、光照、季节、地表覆盖等因素的不同而导致的图像不一致;
地貌要素的时变识别模型;
基于多源数据融合的地质灾害识别模型;
地质灾害风险评估模型和关键因素预警模型。
具体来说,示例数据库的内容包括以下四个方面类别:
一是生成地质遥感元素库。输入素材库分为两类:一类是遥感影像公共服务数据集,如GF-1、GF-2、ZY-3等。这种类型的数据库包含各种类型的地质元素但需要算法如边缘分割、对象识别、自动贴标实现识别、地质元素的标签,以及标准化预处理过程,如数字化和编码的特征描述,最后,形成一个元件库。第二类是单元素数据库,但它可能不是遥感图像。它需要通过尺度等各种图像处理进行数字化和编码变换和透视变换,最后构成一个元素库(图2)。
图2 地质遥感要素数据库
二是基于InSAR 数据的地质灾害识别样本库建设。地质灾害的典型特征是明显的地面沉降变形,这与边坡、地层等地质特征密切相关,历史样本的地质特征和变形特征为隐患提供了参考价值。因此,设计相应的算法模型,最终得到各种典型地质条件下基于In-SAR地表变形聚类的地质灾害典型样本(图3)。
图3 基于InSAR数据的地质灾害识别样本库建设
三是基于遥感影像的地质灾害识别样本数据库的构建。基于时段遥测遥感图像,图像配准后,通过边缘分割、目标识别相同的目标和时间变化对表面覆盖,结合梯度计算,和斜率识别的数字高程模型(DEM)数据,积极的和消极的样本构造地质灾害。负样本包括道路、房屋等人工开挖山体造成的土方堆积变化以及山体体积的时间变化如四季。我们可以借助地质数据和历史样本识别和标记地质灾害级别(图4)。
图4 基于遥感影像的地质灾害识别样本数据库
四是多源异构信息融合的地质灾害识别样本库建设。在更多类型数据的基础上,通过数据融合技术,不仅构建了地质灾害类型、等级及其影响因素的典型样本,而且构建了各种典型地质条件下地质灾害触发的关键影响因素和阈值。数值样本为识别和关键要素的关键监测提供了基础(图5)。
图5 多源异构信息融合的地质灾害识别样本数据库
一是数据采集、标签、标准化、存储管理。首先,采集经遥感处理的地质、地形、地面覆盖物(道路、桥梁、房屋、积雪等)的各类图像(遥感类型)需要对图像进行传感,并通过视角、照度、变形等对其进行归一化处理。然后通过边缘检测、目标识别、分类/聚类、自动标注等,实现基本元素样本的生成。最后,通过统一编码、抽象生成等存储和检索处理,构建样本元素数据集的文件存储。
二是专家知识的正规化。在样本库建立的初期,专家知识具有极其重要的指导价值,有必要将专家知识转化为可以被机器学习利用的规则。具体来说,它包括如下的设计:
首先确定影响因素。当样本数据集较小时,很难定量地分析影响因素与结果之间的相关性。同时,机器学习/深度学习模型的收敛性难以保证。因此,有必要利用专家知识选择影响因素,并进行适当的预处理和数字化,使模型具有快速迭代的适用性。
性能指标设计和标签准确性审查。机器学习/深度学习的模型性能很大程度上取决于成本函数的设计,性能的衡量取决于需求的应用程序。这样,将专家知识对结果的判断和分级转化为成本函数的设计。随着样本的增加,成本函数、性能指标等也会相应调整。
专家知识的整合与修正。针对不同的数据集,设计相应的模型和训练算法,构建算法库。例如,在InSAR 数据集上,利用二维滤波模型识别地表变形群;结合DEM 高程数据、地层/地质数据、历史样本数据,设计并训练贝叶斯分类器,实现地质灾害风险等级的评估。在遥感影像数据集上,通过边缘分割、目标识别、时间变化规律识别、地质灾害识别等模型,建立了地质灾害正、负样本算法库和样本库。基础上掌握更多类型的异构数据,如InSAR 图像数据集,时段遥测遥感图像数据集,地质/地层数据集,和DEM 数据集,我们需要设计集成学习和多源异构融合的深度学习模型实现一个样本库构建,包括关键因素和算法模型。
本文提出了一种基于综合遥感的地质灾害探测人工智能框架。该方法通过高分辨率遥感图像变化检测,对滑坡形态、地表覆盖变化进行研究,研究灾害的形成、发展,揭示潜在的灾害情况。利用InSAR监测获取灾体地表变形,表征边坡的运动变形状态,确定滑坡的大小、活动阶段和发展趋势;嵌入式深度学习算法从灾害情况、当前变形情况和潜在灾害情况进行全面判断;自动、高效地实现了灾害发生前的早期识别。框架中的主要程序,如样本数据库的建立,面向对象的表面覆盖变化检测,智能综合识别方法也在我们的研究中得到充分的研究。该框架将很快应用于贵州省、西藏省、四川省的隐性灾害检测项目。