融合SBAS-InSAR技术与TSO-LSTM模型的矿区地表沉降预测方法

2023-02-23 07:52肖海平夏益强刘小生陈兰兰
金属矿山 2023年1期
关键词:金枪鱼时序矿区

肖海平 夏益强 刘小生 陈兰兰

(1.江西理工大学土木与测绘工程学院,江西 赣州 341000;2.赣南科技学院资源与建筑工程学院,江西,赣州 341000)

由于矿区重工业器械的使用以及采矿时的爆破作业等活动,矿产资源开采过程中容易累积移动和沉降,这不仅会对矿区工人和附近居民的生命财产安全造成严重威胁[1],更是地面坍塌、山体滑坡、泥石流等地质灾害的直接诱因[2]。如何科学有效地对矿区沉降情况做出监测,及时准确地对沉降结果进行风险评估和灾害预警成为当前亟待解决的问题。

目前,矿区监测手段日益成熟,以精密水准测量、GPS测量[3]、分布式光纤感测技术[4]为代表的传统监测手段因其监测成本高、易受环境影响且无法获取大面积监测点等弊端渐渐淡出人们的视野,以无人机低空遥感[5]、三维激光扫描技术[6]为代表的新型测绘技术也因监测成本高、易受环境影响、设备专业性强等不足而难以大范围推广,而时序InSAR技术因其数据采集安全、监测范围大、精度高、能获取大面积的监测信息等优势逐渐在矿山地表沉降监测领域占据主导地位。近20 a来,时序InSAR技术在矿山监测领域成功应用的案例不胜枚举,大量案例表明:采用该技术进行矿山地表沉降监测具有其他手段无法比拟的优势。

然而,如何使用时序InSAR生成的大面积沉降监测时间序列(以下简称“沉降时序”)进行预测,进而助力矿区开展灾害预警工作,却鲜有研究。目前,大多数沉降时序预测研究工作[7-9]停留在针对少数监测点的沉降时序预测,这类预测手段虽能在一定程度上反应矿区未来形变趋势,但对揭示宏观的地表形变格局、分异性及其整体演化规律作用甚微[10]。现阶段,对于沉降预测的研究思路主要有数值模拟法、数理统计法、各种组合预测算法和深度学习算法[11]。数值模拟法主要针对经过地下开采导致的沉陷,这种方法通过获取矿区的各种物理参数,借助数值模拟软件来模拟矿区沉降演变过程,但由于矿区各种物理参数获取困难以及各种人为因素的干扰,导致该方法建模困难、预测结果的鲁棒性和普适性不高。数理统计方法通过分析历史沉降数据的内部联系和发展规律来实现对未来的沉降时序预测,以灰色模型(Grey Model,GM)和差分自回归移动平均(Autoregressive Integrated Moving Average,ARIMA)为代表的数理统计模型对历史沉降数据质量要求高,并且不适用于多种因素影响下的沉降时序预测。各种组合预测算法包括沉降时序分解算法+数理统计算法[12]、组合定权算法+两种数理统计算法[13]等。这类算法通常以增大沉降时序维度或增加预测算法种类为代价来获取更高精度的预测值,但其求解难度较大,无法在大面积的沉降时序预测中推广使用。深度学习算法受大脑神经元运行机制的启发,通过分析沉降相关因素之间的复杂关系[14]和挖掘沉降时序的变化规律来实现对地表沉降的预测[15]。目前,分析沉降相关因素之间的复杂关系的神经网络研究主要存在多源数据难以获取、网络模型超参数难以确定等问题,而挖掘沉降时序变化规律的神经网络虽然数据获取简单,但是同样存在网络模型超参数难以确定的问题。目前,学者们常用网格搜索(Grid Search,GS)算法[16]来获取网络模型超参数的局部最优解,但是该方法不仅难以获取网络模型超参数的全局最优解,而且算法收敛速度慢、空间复杂度高。

针对上述分析,本研究提出了一种基于金枪鱼群优化(TSO)算法优化LSTM网络模型超参数的预测方法,并使用该方法分别对2019年1月—2022年4月德兴铜矿3个主要沉降区的SBAS-InSAR沉降时序进行预测分析,确保矿山安全生产,实现防灾、减灾、救灾,为推进绿色矿山建设提供技术支持。

1 基本原理与方法

1.1 金枪鱼群优化(TSO)算法原理

TSO算法[17]是2021年提出的一种新型元启发式种群优化算法,通过模仿金枪鱼群的捕食(螺旋型、抛物线型)行为来获取搜索空间内的全局最优解。整个过程可以大致分为种群初始化、螺旋形觅食、抛物线型缩小捕食包围圈3个步骤。

种群初始化是启动TSO算法的第1步,初始化内容包括金枪鱼群数量(NP)、寻优最大迭代次数(tmax)、搜索空间上下界(上界ub和下界lb)、决定捕食策略的随机数(randz取值为0~1)以及金枪鱼i在搜索空间中的初始位置等。一般地,可按式(1)进行金枪鱼群优化算法的初始化。

式中,rand为(0,1)区间内的随机数;为第i条金枪鱼在搜索空间内的初始位置。

当金枪鱼群发现食物时,会以螺旋型觅食方式将食物围捕至浅水区(最优解的有限邻域),整个过程可以表示为

式中,t为当前迭代次数;i为金枪鱼个体在种群中的编号;为第t次迭代时金枪鱼i在搜索空间中的位置;为搜索空间内生成的随机参考点;为t时刻当前最优个体所处的位置;α1、α2为决定金枪鱼个体移动趋势的权重系数;β是与最优个体或随机个体相关的开发参量。螺旋型觅食赋予了金枪鱼种群对食物(全局最优解)邻域较好的开发能力,当最优个体无法找到食物时,在搜索空间内随机产生一个参考坐标有利于算法进行更广泛的全局寻优。

当种群发现食物时,金枪鱼群会以抛物线形态进行捕食或向周围搜索,这种情况下,金枪鱼个体的位置更新可表示为

式中,TF为1或-1的随机数,决定了金枪鱼个体的开发方向;p是随着迭代次数t自适应变化的关键参数,决定了个体的开发幅度。金枪鱼群通过以上两种捕食形式进行合作觅食,从而获取食物(全局最优解)。

1.2 长短期时间记忆(LSTM)网络模型

LSTM(Long Short-Term Memory)网络是为了解决循环神经网络(Recurrent Neural Network,RNN)由于开发深度增加而产生梯度消失或梯度爆炸的问题提出的,门的结构使得LSTM细胞单元可以保存和获取长时间周期的上下文信息,一般地,LSTM隐藏层单元结构[18]如图1所示。

图1 LSTM单元结构Fig.1 Unite structure of LSTM

图1中共有3个LSTM细胞单元,各个LSTM细胞单元通过输入门、输出门、遗忘门来逐步更新细胞状态。首先,遗忘门决定是否继续保存前一层的细胞状态ct-1;输入门决定是否将当前状态输入到长期细胞状态ct中;输出门决定是否将长期状态c作为当前时刻输出。t时刻LSTM细胞状态更新可表示为

式中,xt为t时刻的样本序列值;W和b分别代表对应的权值矩阵和偏置矩阵;σ和tanh分别为sigmoid激活函数和双曲正切激活函数;i,f,o分别为输入门、遗忘门、输出门;c和h分别为细胞状态和隐含状态。训练LSTM时,输入层的数据向输出层进行正向传播获取实际输出量,并且利用实际输出量和理论输出量之间的误差反向传播求出各级梯度,再利用优化器更新权值矩阵W。

2 基于SBAS-InSAR的矿区地表沉降监测

2.1 研究区概况和数据介绍

2.1.1 研究区概况

德兴铜矿位于江西省德兴市泗州镇,研究区面积约256 km2,经度为117°37.5′~117°51.7′,纬度为28°53.9′~29°5.6′,具体位置如图2(a)所示。德兴铜矿作为亚洲最大的露天开采铜矿,其生产规模、智能化、机械化水平已居世界先进水平,每年产铜量超过10万t。目前,矿区内主要存在铜厂和富家坞两个采场,如图2(b)所示。矿区属于江南丘陵地貌,属亚热带季风气候区,年平均温度17 ℃,最低气温-9 ℃,最高达42 ℃,1 a内降雨充沛。

图2 研究区具体位置及概况Fig.2 Specific location and general situation of the study area

2.1.2 数据介绍

本研究收集了覆盖研究区的50景IW成像模式的Sentinel-1A升轨SAR影像,极化方式为VV极化,影像波段为C波段,入射角约39.09°。影像时间跨度为2019年01月22日—2022年5月6日,监测周期约为24 d(影像库中缺少2019-2-15的影像,因此使用2019-2-3的影像代替)。同时收集了与影像相对应的精密轨道文件,并准备分辨率为的STRM1 DEM数据去除平地和地形相位。使用SARscape软件进行影像处理,试验过程中软件自主选择2020-09-13的影像为超级主影像,具体影像编号、成像时间及与超级主影像间的时空基线长度参数取值见表1。

表1 影像参数Table 1 Image parameters

2.2 监测结果

本研究利用SARscape软件处理覆盖研究区的50景Sentinel-1A升轨数据,并使用对应的GACOS影像数据进行大气校正,基于SBAS-InSAR技术进行一系列的影像处理工作后,最终得到矿区累计沉降时间序列。

经统计,最终共在研究区提取得到高相干性点191 613个,研究区内年平均沉降速率集中在-15~10 mm/a,最大年平均沉降速率为-372.75 mm/a。存在3处明显的沉降区域,分别位于铜厂西南部、都阳湖与铜厂之间和富家坞采场的西南部,分别将其命名为沉降区A、B、C。

为避免噪声数据的干扰,科学地对矿区的3个主要沉降区域开展沉降时序预测,本研究提取了沉降区A、B、C内的所有高相干性点,如图3所示。3个主要沉降区共提取出高相干性点25 465个,沉降区域总面积为7.63 km2。各沉降区域内高相干性点的个数、沉降区域面积、最大年平均沉降速率、年平均沉降速率均值、监测周期内最大累积沉降量数据如表2所示。

图3 沉降区内沉降速率空间分布Fig.3 Spatial distribution of subsidence rate in subsidence areas

表2 3个沉降区相关信息Table 2 Related information in three subsidence areas

3 TSO-LSTM模型预测及分析

3.1 LSTM网络构建

3.1.1 网络结构

基于LSTM网络预测原理,顾及单个监测点的单变量、短时序的特点,本研究构建了一个单特征、多对多的LSTM神经网络预测模型。以单个监测点为例,其网络模型结构如图4所示。该模型主要包括输入层、隐藏层(LSTM层和Dropout层)、网络训练、输出层等4个模块,网络结构中,将LSTM层、Dropout层设计为成对出现的隐藏层,各个模块中的具体参数取值见表3。其中,输入层将完成原始数据的预处理工作,包括对样本的划分和标准化处理,以满足LSTM层的数据要求;隐藏层通过LSTM单元细胞学习沉降时序间的非线性关联,并利用Dropout层使得一定比例的神经元随机失活,从而减少各个神经元之间的相互联系,防止预测模型出现过拟合现象;网络训练模块使用ADAM优化器实现网络权重优化;输出层包括输出训练后的网络及其预测值。

图4 LSTM神经网络预测模型结构Fig.4 Structure of LSTM neural network prediction model

表3 各个模块中的具体参数Table 3 Specific parameters in each module

为完成本研究构建的LSTM网络训练和预测,基于Window10(64位)系统,使用Matlab 2019b进行程序代码编写和运行。

3.1.2 数据预处理和样本划分

通过查阅相关文献得知,LSTM预测模型的精度与网络模型的超参数有关,其中输入样本长度L、隐藏层深度K、LSTM层的神经元个数S以及初始学习率R对模型精度影响最大[19-20]。为确定最优的序列长度,本研究将2019年1月—2021年12月共45期的沉降序列视为历史数据(已知)作为样本输入,2022年的5期沉降值视为样本标签。记原始沉降时序为D={d1,d2,…,d45},从中取出长度为L的沉降序列进行网络训练Dtrain={d45-L+1,d45-L+2,…,d44,d45},此处样本长度满足2≤L<45。

同时,考虑到样本的数量级可能会对模型的预测精度造成影响,本研究选择Z-Score(标准差法)进行标准化处理,按照式(5)将原始数据集转化成均值为0、标准差为1且服从正态分布的无量纲数据集。

式中,Dmean为原始沉降序列数据集均值;σD为原始沉降序列数据集方差。

3.2 TSO算法优化LSTM模型超参数

3.2.1 优化模型和评价指标

为实现输入样本长度L、隐藏层深度K、LSTM层的神经元个数S以及初始学习率R等参数最优化取值,本研究使用TSO优化算法进行超参数寻优。为衡量网络模型的预测精度,选择均方根误差(RMSE)、平均绝对误差(MAE)和平均预测精度(μ)[10]为精度评价指标,相关计算公式分别为

寻优过程中,以单步预测值的均方根误差和平均绝对误差加权最小为目标,目标函数可表示为

依据文献[10,16,19],结合已有数据得出超参数应满足的约束条件为

上述优化模型可以归纳为一个混合约束条件的非线性优化问题,待优化的超参数共同构成一个离散的四维求解空间,求解过程中采取逐步向最优解靠近的金枪鱼群优化(TSO)策略来求取最优值。整个超参数寻优流程如图5所示。

图5 LSTM网络超参数寻优流程Fig.5 Optimization flow of hyperparameter of LSTM model

使用金枪鱼群算法寻优时,设置金枪鱼种群内个体数量NP为30,最大迭代次数tmax为500,其余参数按照文献[19]设置为:a=0.7,z=0.05,循环迭代寻找全局最优解。迭代过程中目标函数值的变化如图6所示,对应的超参数变化取值见表4。

图6 迭代过程示意Fig.6 Schematic of iterative process

表4 TSO算法寻优时超参数变化Table 4 Variation of hyperparameter by TSO algorithm optimization

由图6及表4可知:目标函数值收敛于2.21 mm,此时对应的LSTM网络模型超参数为L=20,K=2,S=48,R=0.023 317,记当前超参数设置下的网络模型为。

3.2.2 最优LSTM网络预测

图7 沉降区单步预测绝对误差空间分布Fig.7 Spatial distribution of absolute error of single-step prediction in subsidence areas

表5 绝对误差具体分类及其占比Table 5 Specific classification and its proportion of absolute error

表6 沉降区整体预测精度指标Table 6 Overall prediction accuracy indexes of subsidence areas

由图7、表5及表6可知:基于TSO算法优化超参数的LSTM网络预测模型能较好的对矿区大面积沉降时序进行短期预测,即使是在大梯度形变区,其整体预测值的均方根误差不超过2 mm,整体预测值的平均绝对误差不超过3 mm;沉降区A、B、C中仅有不到3%的高相干性点的预测绝对误差高于10 mm,超过75%的高相干性点的预测绝对误差低于4 mm;与文献[10]所提供的超参数相比,经TSO算法优化后的LSTM网络在大梯度形变区表现出更加优良的预测效果。相比较而言,在大梯度形变区域模型的均方根误差至少降低了20%,平均绝对值误差至少降低了35%,沉降区域整体预测精度满足矿区形变预测的基本要求。

4 结 论

(1)本研究提出了一种融合SBAS-InSAR技术与TSO-LSTM模型的预测方法。该方法以SBAS-InSAR技术得到多个高相干性点的沉降时序数据为基础进行沉降预测,预测结果不仅能够反映矿区未来形变趋势,而且能揭示其地表整体演化规律。

(2)根据SBAS-InSAR沉降监测结果分析得到3处明显的沉降区域,研究表明:TSO-LSTM模型不仅可以较快地获取LSTM模型的最优超参数,而且具有较高的预测精度,优化后的预测模型各项精度指标均有所提高。TSO-LSTM模型解决了网络模型超参数难以确定的问题,为实现矿区高精度、大面积的沉降时序预测提供了技术支持。

(3)融合SBAS-InSAR技术与TSO-LSTM模型的预测方法能较好地实现矿区地表大面积沉降预测,但该模型仍存在局部预测精度不高、大梯度形变区得到的高相干点过少等不足。为进一步提高预测精度,今后将通过使用更高分辨率的SAR数据、改进高相干性点生成算法、减少寻优时间等思路进行模型优化。

致 谢

本研究使用了欧洲航天局(ESA)提供的Sentinel-1A卫星影像、纽卡斯尔大学提供的GACOS大气校正数据,谨致谢忱!

猜你喜欢
金枪鱼时序矿区
金枪鱼淹死事件
清明
可以加速的金枪鱼机器人
金枪鱼与海豚
加纳Amanforom矿区Ⅲ号隐伏金矿带的发现与评价
加纳Amanforom矿区Ⅲ号隐伏金矿带的发现与评价
湖北省保康县堰边上矿区发现超大型磷矿
广东省蕉岭县作壁坑矿区探明超大型铷矿
基于不同建设时序的地铁互联互通方案分析
国内新型远洋金枪鱼围网渔船首航