基于EEMD-SE-LSTM的混凝土坝变形监测模型

2022-01-16 06:40:52侯回位郑东健刘永涛黄寒冰

水利水电科技进展 2022年1期

侯回位，郑东健，刘永涛，黄寒冰

(河海大学水利水电学院，江苏南京 210098)

变形是坝体结构受到多种环境荷载的作用以及自身材料性能的影响而不可避免发生的物理偏移，能够最直接可靠地反映混凝土坝的工作性态，是衡量坝体结构安全的重要指标[1-3]。因此，有必要根据混凝土坝变形监测资料建立精准、高效的预测模型，及时有效地掌握坝体结构的变形状态，预测未来的变形趋势，为工程长期预报和安全决策提供依据[4]。

常用于混凝土坝变形监控的模型有统计模型、确定性模型和混合模型[5]等，其中统计模型[6]因其函数表达式简单，模型结构易识别的特点被广泛地应用于混凝土坝安全监控领域中。然而，传统的统计模型对复杂的非线性关系考虑不足，对多重共线性问题不敏感[7]，其预测精度较差且缺乏相应的外延预报能力。近年来，随着人工智能算法的迅速发展，神经网络、支持向量机[8]等机器学习算法也被运用到混凝土坝的变形预报工作中。贾强强等[9]利用基于小生境技术改进的思维进化算法来加快BP神经网络的最优权值和阈值的搜索，以避免陷入局部最优；钱秋培等[10]将支持向量机和粒子群算法相结合，建立的预测模型能很好地考虑多种环境因素的非线性相关，具有不错的预测精度。这些机器学习算法虽然在提升模型预测精度上有所提高，但由于混凝土坝变形的时间序列非平稳、非线性特点，也存在着不足，首先BP、SVM模型均属于静态的前馈非循环模型，对随时间动态变化的混凝土坝变形监测序列预测的能力有所欠缺，未能考虑时序信息在时间维度上的关联性，而长短期记忆网络(long short-term memory,LSTM)[11-13]是一种深度神经网络模型，能够平衡数据的时序性与非线性关系，考虑时序信息重要程度的变化，适合对动态非线性的时间序列进行拟合预测；其次混凝土坝变形序列的非平稳性对于模型的构建及其泛化能力的强弱有着较大影响，上述模型均未把变形序列的非平稳性纳入考虑，而EEMD作为一种非平稳数据处理方法[14]，能够根据其本身的特性，将其分解成多个平稳的数据序列。

基于此，本文利用EEMD来把非平稳的混凝土坝变形序列分解为多个平稳的子序列，同时考虑到各子序列之间的相关性，采用样本熵理论[15-17]对各子序列进行重构处理，并选用基于记忆架构的LSTM来保证模型的预测能力，构建一种EEMD-SE-LSTM组合模型应用于混凝土坝的变形预报中，并以某混凝土拱坝实测数据进行算例分析。

1 基本理论

1.1 集成经验模态分解

经验模态分解(EMD)是一种自适应信号时频处理方法，特别适合非平稳信号的分析处理。EMD可以将原始信号分解成一系列本征模态分量IMF，但得到的IMF分量通常会出现尺度混合现象，这会造成IMF分量的不精确，而集成经验模态分解(EEMD)通过往原始信号加入白噪声很好地避开了EMD分解时的尺度混合问题[18]，由于零均值噪声的特性，噪声经过多次的平均计算后会相互抵消，这样集成均值的计算结果就可以直接视作最终结果，其基本原理如下。

a.将N个等长白噪声信号wi(t)加入原始信号X(t)，即

Xi(t)=X(t)+wi(t)

(1)

b.对新信号Xi(t)进行EMD分解，得到各阶IMF分量：

(2)

c.利用白噪声频谱均值为零的特点，将上述各分量求均值得到最终的分解结果如下：

(3)

(4)

式中：Xi(t)为第i次加入白噪声后的信号；wi(t)为第i次加入的白噪声；Cij(t)为第i次加入白噪声后分解出的第j个IMF分量；Ri(t)为第i次加入白噪声后分解得到的残余分量；m为每次分解得到的IMF分量个数；Cj(t)为集成平均后的第j个IMF分量；R(t)为最终残余分量。

1.2 样本熵

将原始变形序列经EEMD分解成若干个IMF分量后，为了能减小模型的计算量，考虑各IMF分量间的相关性，挖掘出同类序列的特征，引入样本熵的概念，对这些IMF分量采用样本熵估值后重构。样本熵作为一种时间序列复杂性的度量方法，其目的是检测时间序列中新的子序列产生概率。现假设一长度为L的时间序列x={x1,x2,…,xL}，按序号组成一组维数为m的向量序列{Xm,1,Xm,2,…,Xm，L-m+1}，其中Xm，i={xi,xi+1,…,xi+m-1}，这些向量表示从第i点开始的m个连续的x的值；定义向量Xm，i与Xm,j之间的距离d[Xm，i,Xm，j]为两者对应元素中最大差值的绝对值；对于给定的Xm，i，统计Xm,i与Xm，j之间距离小于或等于容限r的j(1≤j≤L-m,j≠i)的数目，并记作Bi。对于1≤i≤L-m，定义

(5)

(6)

再把维数增加到m+1，重复上面的步骤得到：

(7)

式中Ai为向量Xi与Xj在m+1维时满足容限要求的总个数。

同理，定义两序列在匹配m+1个点的概率Am(r)的计算式：

(8)

因此，样本熵定义如下：

(9)

当L为有限值时，用下式来估计：

(10)

式中：m为维数，常取值为1或2；r表示相似度阈值，通常取原始序列的10%～25%的标准差。本文选取的维数是m=2，以原始序列标准差的20%作为容限r的取值。

1.3 LSTM模型

对经样本熵重构后的分量建立LSTM模型，充分考虑历史有效信息的影响，以提高变形预测的精度。

LSTM模型是一种特殊的递归循环神经网络模型，通过引入“门”的机制，采用记忆单元来代替传统神经网络隐含层的神经单元，用于解决梯度消失或爆炸问题，从而使得网络可以学习长期依赖信息。其记忆单元结构如图1所示，核心思想是引入细胞状态的连接，然后使用遗忘门、输入门和输出门等结构来控制细胞状态，实现信息的添加或删除。

图1 LSTM记忆单元结构

遗忘门的作用是控制细胞状态中信息的取舍：

ft=σ(Wfxt+Ufht-1+bf)

(11)

输入门的作用是更新细胞状态中的信息：

it=σ(Wixt+Uiht-1+bi)

(12)

(13)

输出门控制着哪些信息需要输出：

ot=σ(Woxt+Uoht-1+bo)

(14)

(15)

ht=ottanhCt

(16)

式中：ft、it、ot分别为遗忘门、输入门与输出门；Wf、Uf为遗忘门的权重系数;Wi、Wc、Ui、Uc为输入门的权重系数;Wo、Uo为输出门的权重系数；bf为遗忘门的偏置系数;bi、bc为输入门的偏置系数;bo为输出门的偏置系数；Ct、ht分别为t时刻细胞状态和隐藏单元状态，σ为sigmoid激活函数，取值范围为[0,1];tanh为双曲正切激活函数，取值范围为[-1,1]。

2 EEMD-SE-LSTM组合预测模型

结合各方法的优势，构建EEMD-SE-LSTM混凝土坝变形预测模型，从更加全面的角度来提高混凝土坝的变形预测精度，其流程如下：

步骤1利用EEMD把混凝土坝的原始变形序列X(t)分解为多个平稳的子序列。

X(t)=X1(t)+X2(t)+…+Xk(t)+R(t)

(17)

式中k为分解出的子序列个数。

步骤2计算各子序列、余量R以及原始序列X(t)的样本熵，当分量样本熵大于原始序列样本熵时，对其不作处理，当分量小于原始序列样本熵时，对其进行合并，得到重构后的分量。

X(t)=C1(t)+C2(t)+…+Cp(t)

(18)

步骤3确定各重构分量的时间阶数，即用当前时刻前多少期的历史数据来作为网络模型的输入来进行训练与预测。

(19)

式中p为重构后的子序列个数。

选取均方根误差(RMSE)和平均绝对误差(MAE)作为模型预测效果的评判标准。

3 实例分析

3.1 数据处理

以某混凝土拱坝为例，由于该坝岸坡坝段基础周围的地质条件比较差，有必要对该处测点进行监控以分析对坝体变形的影响，故选取岸坡坝段某正垂测点的坝体变形监测资料作为样本来进行建模分析，分析时段取为2013年5月1日至2019年4月30日。原始数据采样的间距为1 d，但由于实际观测过程中会存在一些数据的缺失，无法形成连续的逐日序列，现将取样的时间分辨率调整为5 d。对每个5 d的数据取平均值，第一个5 d为2013年5月1—6日，依次往下，构成序列。

3.2 EEMD分解与SE重构

针对原始数据的非平稳特性，用EEMD对数据进行特征分解，分解时加入白噪声组数为300组，噪声误差为0.2，分解结果如图2所示。可以看出，原始序列被分解成了7个本征模态分量和1个残余分量，各个尺度的特征被很好地从原始序列中分解出来。

图2 EEMD分解出的分量

计算各分量以及原始序列的样本熵值，依照样本熵值对各分量进行重构，各序列样本熵值得到X1～X7样本熵值分别为1.790、0.976、0.566、0.304、0.065、0.035和0.031，原始序列样本熵值为0.268。前4个分量的熵值均大于原始序列的熵值，所以不对其进行合并；后4个分量的熵值小于原始序列熵值且复杂度差异也很小，对其进行重构合并，重构后的分量见图3。

图3 样本熵重构后的分量

3.3 时间阶数的确定

时间阶数的选择会直接影响到模型的预测结果，当其过大时，会增加计算量，过小又会导致信息重合。基于此，利用相关研究成果[19-23]，分析各分量序列的相关性，计算其自相关系数，当相关系数大于0.8时，认为具有较强的关联，再根据具有强相关性时的滞后期数来确定时间阶数。经计算，时间阶数确定为2。

3.4 LSTM模型预测

对每个重构分量建立LSTM预测模型，由于时间阶数确定为2，因此以第1、2组的历史变形量作为输入，来预测第3组的变形，然后以第2、3组的变形来预测第4组的变形，依次对后续变形值进行预测。

3.5 预测结果分析

为验证EEMD-SE-LSTM模型在混凝土坝变形预测中的有效性和优越性，将其预测效果与EMD-LSTM、LSTM、SVM等模型进行对比。

a.通过改变训练集的长度来分析各模型对时间序列的整体感知力，模型的预测结果见表1。随着训练集长度的增加，EEMD-SE-LSTM与LSTM模型的预测精度越来越高，这说明模型具有良好的时间序列感知力，能够从较长的训练集中提取更多的有效信息以提高预测精度，但LSTM模型有滞后效应，导致预测误差都比较大。而EMD-LSTM与SVM模型的预测精度在训练集长度占比小于80%时都有一定程度的提高，但在长度占比达90%时，精度却有所下降，说明两模型的时间序列感知力存在局限性。在同一训练集长度下，EEMD-SE-LSTM模型的预测精度最高，验证了其在混凝土坝变形预测中的优越性。

b.为更直观体现模型的预测效果，以训练集长度占比为70%的情况为例进行分析。从图4看出，SVM模型的预测效果较差，可能是SVM模型不能很好地挖掘时序在时间维度上的关联性；LSTM模型的预测出现滞后现象，虽然拟合曲线贴近实测曲线，但可信度较低；EMD使得LSTM的滞后效应减弱，但其分解时尺度混合的影响降低了模型的预测精度；EEMD作为EMD的改进，降低了尺度混合对分解的影响，提高了模型的预测精度。

图4 各模型预测结果

图5是各模型预测残差对比，可以看出EEMD-SE-LSTM模型的预测残差相较于其他模型基本在±0.5 mm范围波动，这表明EEMD-SE-LSTM模型预测的精确性和平稳性都更高。由表2可知，EEMD-SE-LSTM模型的RMSE与MAE相较于其他模型都有显著地减小，其中RMSE分别降低了15.87%、44.79%与55.08%，MAE分别降低了11.32%、40.51%与54.81%，这表明EEMD-SE-LSTM模型很

图5 各模型预测残差对比

模型RMSE/mmMAE/mmEEMD-SE-LSTM0.530.47EMD-LSTM0.630.53LSTM0.960.79SVM1.181.04

好地提高了变形预测的精度。

4 结论

a.通过横向比较，EEMD-SE-LSTM模型能够更好地拟合混凝土坝变形监测序列，充分考虑变形序列在时间上的关联性，预测精度高，鲁棒性强。

b.通过纵向比较，EEMD-SE-LSTM模型有效地减弱了LSTM模型的滞后效应，这使得模型的预测具有更高的可信度及可靠性，同时EMD分解时的尺度混合问题也得到了解决，明显地提高了预测精度，从而在大坝管理上的应用及可操作性更强。

c.通过不同训练集长度下模型预测效果的比较，EEMD-SE-LSTM模型能从更长的训练集中提取更多的有效信息以达到更好的预测效果，具备不错的时序感知能力。

d.由于变形受多种因素共同作用，单一考虑历史效应量的影响有所欠缺，在后续研究中，还需考虑水位、温度等其他环境量的影响。