基于灰色长短时记忆网络融合模型的隧道沉降预测

2021-12-23 08:06张振威黄晓彬陈何峰
关键词:短时记忆测点灰色

张振威, 黄晓彬, 陈何峰, 赵 程*

(1.同济大学 岩土与地下工程教育部重点实验室, 上海 200092;2.同济大学 地下建筑与工程系, 上海 200092; 3.同济大学 建筑设计研究院, 上海 200092)

随着我国经济高速发展,地下隧道越来越多地出现在城市交通中,但由于城市复杂的地表地下环境,隧道的变形受到许多因素影响,把握隧道整体沉降值的变化趋势可以确保隧道施工安全及正常运营,因此工程中对隧道沉降进行预测具有重要意义[1]。

沉降预测模型总体上可以分为三大类:静态预测模型、动态预测模型及组合预测模型。静态预测模型有双曲线函数模型、修正双曲线法、Logistic模型、Weibull模型等[2-3]。动态预测模型如灰色模型、神经网络算法等,其最大优点在于可以根据沉降观测数据的变化趋势不断调整。使用动态模型可以使预测更加合理化,如刘勇健[4]使用人工神经网络预测公路地基沉降;王鑫等[5-7]使用加入记忆单元的LSTM神经网络在不同领域进行工程应用,用以解决时间序列的梯度爆炸问题。为进一步发挥各预测模型的长处,提高预测精度,同时弥补单一模型短板,可以构建组合预测模型,以达到更精确的预测效果,如傅湘萍使用粒子群算法优化BP网络预测地铁结构变形[8],赵楠结合LSTM与SVM对隧道围岩位移进行预测[9],舒涛将灰色模型与LSTM组合对旋转机械轴承寿命进行预测[10]。目前对隧道沉降的预测以静态预测为主,精度存在较大提升空间。本文将结合灰色模型GM(2,1)与长短时记忆神经网络(Long Short-Term Memory,简称LSTM),依据某隧道工程长期监测数据对隧道沉降进行预测。

1 模型原理

1.1 LSTM神经网络

LSTM即长短时记忆神经网络,是一种时间递归神经网络(Recurnent Neural Network简称RNN),能有效解决长序列训练过程中的梯度消失和梯度爆炸问题,特别适用于长时间序列的学习,在解决长序依赖问题时具有较高效率与普适性,为问题解决带来更多可能性[11-12]。区别于常规RNN算法,LSTM在算法中加入了记忆单元(cell)用于判断信息有用与否。模型训练中,可通过模型的训练损失和测试损失大小判断模型的拟合情况。

1.2 GM(2,1)灰色预测模型

灰色预测原理是遵循系统既定发展规律,建立一般性的灰色微分方程,通过数据拟合的方法确定方程系数,最终得到完整的灰色模型方程用于系统长期发展的预测。灰色模型适用于短序列的数据拟合,可以通过简单的信息得到长期的动态特性[13]。当目标沉降具有单调递增性、有界性并呈现S形曲线时,可认为符合饱和的S形曲线,宜采用GM(2,1)预测模型[14]。

1.3 快速非支配多目标遗传算法原理

模型融合常见的定权准则是基于预测误差平方和最小的组合模型权系数确定准则,计算简便,运用广泛,但其缺点在于当均方根误差最小与其他条件不能同时满足时,无法得到多种精度要求下的最优方案。因此需要使用多目标的优化方法去确定组合模型最佳的权值分配情况[15]。

NSGA-Ⅱ算法,即带有精英保留策略的快速非支配多目标遗传算法,也叫做基于Pareto最优解的非劣分层遗传算法,相比基础NSGA算法采用了更好的记帐策略,减少了算法运行的整体时间[16]。算法采用密度估计算子与拥挤度评判每个个体的非劣级别,从而快速进行非劣排序,保持种群多样性,使其计算复杂度有所降低。算法还引入精英策略用于避免最佳个体的丢失,提高了算法的运算速度和鲁棒性[17-19]。

1.4 模型评价指标

单一精度标准存在局限性,因此模型精度的评价项选取平均绝对误差MAE,平均相对误差MRE,均方根误差RMSE共三个指标进行精度评价;为体现沉降预测的整体性,加入后验差比值C,小误差概率p表征单个数据与整体数据的关联度,灰色模型增加灰色关联度ε0用来检验精度,其计算方法如下:

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

式中:式(1)—式(3)可以衡量预测值与真实值之间的偏差;式(4)—式(8)用于检验灰色模型精度(表1)。

表1 灰色模型精度评定标准

2 模型建立

2.1 单预测模型建立

LSTM模型在处理沉降数据时,需要将长期的沉降数据处理为时间序列作为学习样本,本文取该时刻前三个时间点沉降值作为特征值,每四个时间节点的数据作为一组特征值与输出值,以整个数据源前70%的沉降值作为训练集,预测后30%的沉降数据,并与实测沉降进行比较。对于灰色模型,采取同样的划分规则,拟合时只使用训练集部分的数据。对于同一组数据,分别建立长短时记忆神经网络模型与灰色预测模型,对未来一段时间的沉降值作出预测。其中,长短时记忆神经网络模型采用Python语言,基于TensorFlow的Keras库中的LSTM模块,以及Scikit-Learn中的预处理模块进行建模;灰色预测模型使用MATLAB计算。

2.1.1 数据预处理

LSTM神经网络需要使用时间间隔一致的时间序列数据,因此需要预先对数据做插值处理。时间序列中,取最后30%作为测试集,剩余数据作为训练集。对于灰色模型,同样只取上述训练集数据用于拟合,得到拟合结果后带入计算得到后续预测值。在进行训练前,需要先将时间序列数据进行归一化与正则化处理,消除数据噪声,避免模型过拟合,同时增加模型的敏感性。

2.1.2 模型验证及参数调优

LSTM模型中通过定义time steps参数对时间序列进行处理,即使用目标序列之前若干项序列值作为其特征值。LSTM模型总共有7个参数,其中输入特征维数与time steps有关,初始time steps设置为3,即认为某个预测是与之前三个历史数据有关。输入层数与输出层数均为1。激活函数使用sigmoid函数。模型迭代次数为100次,隐藏层数为1,拥有16个隐藏节点。Batch size设为1,即随机训练。设置损失函数为均方误差即平方损失,对偏离实测值更多的预测结果做出更严重的惩罚。通过分析模型每个运算周期损失的历史数据可以判断模型是否存在欠拟合或过拟合现象,对相关参数进行修改调整。灰色预测使用常规方法进行求解。

2.2 利用快速非支配多目标遗传算法进行权值分配

为结合长短时记忆神经网络与灰色模型的优势,需要构建神经网络与灰色模型的组合模型,并基于快速非支配遗传算法确定组合模型中各项权重系数。

使用1.3中遗传算法计算组合模型权值,定义两个适应度函数分别为:

(9)

(10)

f1、f2分别代表预测前最后一个训练阶段预测沉降值的均方根误差与后验差比值,优化目标为得到使组合模型预测值的均方根误差与后验差比值最小的权值分配方案。在本算法中,使用竞标赛法进行种群选择,使用实数编码的交叉操作模拟二进制种群交叉,使用多项式变异法实现种群变异。

3 工程实例

本文使用上述模型对某工程中一堆山下穿隧道的长期沉降数据进行预测。该工程规划有围绕山体的外环、中环、内环3条环路。中环路和内环路穿越山体部分采用隧道设计。该人工山需要在地面进行大量堆土堆石,从而在地面形成极大的大面积堆载,对其下隧道的长期沉降可能有较大影响。因此采用科学的方法预测隧道及周围场地的将来沉降,对预防重大安全事故发生具有重要的工程意义。

分别在内环隧道、中环隧道、外环路、堆山场地四处选择四个测点,提取测点连续两年的沉降监测数据作为模型的训练样本,形成时间序列数据。针对这四组时间数据分别建立长短时记忆神经网络模型、灰色预测模型以及组合模型,对未来一段时间的沉降值作出预测。

3.1 单预测模型预测结果分析

使用两种方法得到预测结果后,使用1.4中的精度评价准则进行模型效果预测评价,并与传统静态预测方法进行对比,结果见表2—表5。

表2 内环测点沉降预测精度评价

表3 中环测点沉降预测精度评价

表4 外环测点沉降预测精度评价

表5 堆山场地测点沉降预测精度评价

两种动态模型预测值与沉降实测值之间的差距如图1所示,并与传统静态模型预测结果进行对比。

图1 各模型沉降预测曲线比较Fig.1 Comparison of settlement prediction curves of various models

误差方面,两种动态预测方法均表现出较高的精度,四个测点的RMSE保持在2.7以下,明显小于其他静态算法,但存在较大的C值,整体性表现稍差,在中环09测点表现尤为明显。对走势的预测方面,在内环01测点,LSTM模型与灰色模型都呈现出较好的预测效果;在中环09测点与场地01测点,LSTM预测结果出现了滞后,导致其误差较大;灰色模型误差相对较小,但其沉降走势与实际情况不符;在外环06测点,沉降发生了较为剧烈的波动,可能是测量中复杂因素的影响下导致实测值噪声较大,因此灰色模型面对短时间内复杂变化的数据预测效果较差,而LSTM模型则比较好地模拟了沉降的波动情况。

两种动态模型较静态预测模型均有更高精度。以均方根误差为例,LSTM模型在四个测点上的预测精度相比双曲线模型提高了56.5%、64.9%、75.2%、48.1%;相比logistics模型分别提高了74.3%、77.0%、54.9%、74.1%;相比weibull模型分别提高了70.7%、0.02%、55.8%、23.0%。GM(2,1)灰色模型的在四个测点上的预测精度相比双曲线模型分别提高了58.0%、68.8%、60.0%、47.8%;相比logistics模型分别提高了75.2%、79.5%、27.1%、74.0%;相比weibull模型分别提高了71.6%、11.2%、28.6%、23.7%。

结果表明,对于复杂的沉降数据,长短时记忆神经网络模型与灰色模型两种动态预测模型在精度与稳定方面均优于传统静态预测模型,具有较好的预测效果。但两种动态模型在面对不同测点数据时则各有优劣。灰色模型整体性更强,拟合图线规律明显,在面对趋势较为单一的数据时表现更好;而对于波动明显、走势更多变的数据,LSTM模型表现更优。

3.2 组合模型预测结果分析

对组合模型进行参数调优,最终将种群数量设为300,进化代数设为100代,交叉概率设为0.9,变异概率设为0.5,模拟二进制交叉参数设为2,变异参数设为5,竞标赛算法中候选者数量设为2。将预测沉降分为两组,一组用于权重计算,另一组用于预测。

通过2.2中遗传算法的计算,得到四组数据的权重系数如表6所示:

表6 各监测点数据组合模型权重值

w1,w2进行加权后可计算出组合模型的预测值。使用组合模型在四个测点进行预测,结果大部分数据点的误差小于3%,部分数据点误差小于1%,可见组合模型在面对不同形式的沉降时均能发挥较好的预测效果,具有较高的预测精度。

对比单一模型预测结果,组合模型在保证精度的同时,能较好模拟沉降走势。图2为组合模型与两种独立模型预测效果的对比。

图2 组合模型与单一模型沉降预测曲线比较Fig.2 Comparison of settlement prediction curves between combined model and single model

图7对比了组合模型与单一模型的预测精度在内环01测点,与LSTM模型与灰色模型相比,组合模型达到了更高的精度,在走势上与单预测模型保持一致。在中环09测点与场地01测点,组合模型在保持预测精度的情况下,较好地模拟了沉降的发展趋势,相比于灰色预测模型更加贴近实测值;在外环06测点,面对较大噪声的数据,组合模型表现不如单独的LSTM模型。

表7 组合模型各测点沉降预测精度

4 结论

本文依据某隧道工程的沉降监测数据,以长短时记忆神经网络为主,辅以灰色模型对其沉降发展进行了预测,并基于快速非支配多目标优化遗传算法搭建了两者的组合模型,取得了较好的预测效果,得到以下结论:

1)长短时记忆神经网络模型在进行沉降预测时,可保证较高的预测精度,较好地模拟沉降发展趋势。相比于静态沉降预测模型,LSTM预测精度可提高20%~70%不等;面对长周期的预测时, LSTM以节点前最近序列为特征值进行训练,对沉降细微变化较为敏感,同时由于该算法较好地解决了梯度消失与爆炸问题,能够在长期内保持较好的鲁棒性。灰色模型能得到同样预测精度,优势在于能够依据少量数据提炼整体走势,但其对信息的利用率较低,在预测波动数据时表现比LSTM稍差。

2)使用快速非支配多目标优化遗传算法进行组合模型的权值分配可以较快地得到两种精度标准下的最优定权方案,结合两种模型的优势,得到较精确的预测效果。面对平缓沉降数据,组合模型能够很好地贴近实测值,并保证比单一模型更高的精度。但面对噪声较大数据时,组合模型破坏了同种预测方法中数据的一致性,导致其预测结果的后验差比值远大于独立模型,整体性表现较差。

猜你喜欢
短时记忆测点灰色
基于长短时记忆神经网络的动力电池剩余容量预测方法
徐州市云龙公园小气候实测与分析
基于CATIA的汽车测点批量开发的研究与应用
水下单层圆柱壳振动声辐射预报的测点布置改进方法
浅灰色的小猪
室外风环境实测及PHOENICS 模拟对比分析研究*
——以徐州高层小区为例
吉林大学考古与艺术博物馆观众短时记忆调查报告
灰色时代
她、它的灰色时髦观
英语听力理解与短时记忆