李其峰, 杨 杰, 程 琳, 仝 飞
(1.西安理工大学 省部共建西北旱区生态水利国家重点实验室, 陕西 西安710048;2.西安理工大学 水利水电学院, 陕西 西安 710048)
大坝变形能够系统地反映工程安全性态,通过分析大坝变形实测资料,建立高精度的安全监控模型是保证工程安全的重要手段[1]。国内外大坝安全监控模型主要有单一的常规模型、组合预测模型和各种机器学习方法。如:传统的数学统计模型[2]、机器学习方法中的极限学习机、相关向量机、人工神经网络等[3-5]以及蚁群和粒子群等优化算法与机器学习组合模型[6-7]。上述几种监控模型在大坝变形预测方面取得了较好的分析效果。但是,单一模型具有精度、鲁棒性和外延性较差的缺点[8],不同模型优化组合虽然在拟合和预测精度方面有较大提高,但是由于机器学习存在参数过多、收敛速度慢、极易陷入局部最优等问题,不能有效地处理高度非线性问题,因此不利于分析大坝的变形性态。
近年来,由于人工智能的快速发展,深度学习在图像分类、语音识别、医学和大气污染预测等方面得到了广泛应用[9-12]。深度学习是由更多的非线性映射隐含层组成的一种神经网络,能较好地挖掘数据之间的非线性[13]。但深度学习在大坝变形预测方面研究较少。张进等[14]采用改进的k均值聚类算法分析关键测点的空间聚集状态,并结合长短期记忆网络模型对大坝沉降变形进行预测。杨恒等[15]采用最佳优化算法Adam对深度全连接神经网络进行优化,提高了模型的精度和非线性学习能力。郭张军等[16]通过TensorFlow将深度学习应用于混凝土坝变形预测中,提高了模型的泛化性和外延性。
本文将具有全局优化能力的贝叶斯算法与门控制循环单元引入到混凝土坝变形分析中,可以解决监控模型收敛速度慢和过拟合的问题,并可提高模型的精度和稳定性,最终使大坝预警更加准确。
门控制循环单元(gated recurrent unit, GRU)由更新门和重置门两部分组成,具有较少的参数,其结构单元如图1所示。
图1 GRU结构单元示意图
GRU的工作原理及计算公式如下:
(1)更新门:决定上一隐藏层状态中信息传递到当前隐藏状态中。
Zj=σ([Wzx]j+[Uzh
(1)
式中:Wz、Uz为线性关系的系数;Z为更新门;σ为Sigmoid函数;h为隐藏层状态; [·]j为向量的第j个元素;t-1为时刻。
(2)重置门:决定上一时刻隐藏状态的信息需要被遗忘。
rj=σ([Wrx]j+[Urh
(2)
式中:Wr、Ur为线性关系的系数;r为重置门;σ为Sigmoid函数;h为隐藏层状态; [·]j为向量的第j个元素;t-1为时刻。
(3)确定当前记忆内容:GRU记录到的所有重要信息,通过下列运算操作,确定当前时刻t的记忆内容。
(3)
式中:W、U为线性关系的系数;r为重置门;h为隐藏层状态;[·]j为向量的第j个元素;t和t-1为时刻; ⊙为Hadamard积。
(4)确定当前时刻隐藏层保留的信息:该步实现了更新门能够决定分别需要在当前时刻t的记忆内容和上一时刻t-1隐藏层的信息收集。
(4)
式中:Z为更新门;h为隐藏层状态;t和t-1为时刻; [·]j为向量的第j个元素。
为提高模型预测精度,需要确定超参数最优组合。而贝叶斯优化(Bayesian optimization, BO)是一种全局优化算法,能够有效地对GRU模型中的参数进行寻优处理[17],从而实现具有非线性的监测数据预测。通过采集函数选取有潜力的评估点xt,然后评估目标函数值yt,不断地更新概率代理模型以寻求参数最优解。贝叶斯优化算法能够经过少数次评估目标函数得到近似解,适合解决多峰、未知的复杂优化问题[18-19]。
贝叶斯优化算法是建立在贝叶斯定理的基础上实现超参数优化,该定理公式为:
(5)
式中:f为模型的参数;D1∶t为已评估参数集合;p(D1∶t|f)为y的似然分布,由于观测值存在误差,也称为“噪声”;p(f)为f的先验概率各布,即对参数的假设;p(D1∶t)为f的边际似然分布,一般难以求得准确的解析式,主要用于超参数优化;p(f|D1∶t)为f的后验概率分布。
概率代理模型和采集函数是贝叶斯优化的核心。常用的概率代理模型包括高斯过程、随机森林、树状结构Parzen估计方法等。其中相比于其他概率代理模型,树状结构Parzen估计方法在高维空间表现优异,收敛速度有显著提升。常用的采集函数生成策略包括基于提升的策略、置信边界策略、基于信息的策略等。基于提升策略的采集函数如下:
(6)
式中:φ(·)为标准正态分布概率密度函数;μt(x)和σt(x)分别为均值和标准差;ν*为当前最优函数值;ξ为平衡参数。
本文基于贝叶斯算法对GRU模型的batch_size、epochs、learning_rate、units共4个超参数进行优化,参数范围如表1所示。概率代理模型选用树状结构Parzen估计方法,采集函数为基于提升策略。自变量x为不同超参数组合,优化目标函数为均方误差(MSE)。
表1 GRU模型4个超参数的范围
本文采用基于贝叶斯优化算法(BO)的门控制循环单元(GRU)变形预测模型实现混凝土坝变形预测分析。模型流程图如图2所示,具体步骤如下:
(1)数据预处理。由于数据中有不同量纲的特征值,需要对数据进行归一化处理,采用MinMaxScaler方法将数据缩放到[0,1]。计算公式为:
(7)
式中:Xstd为归一化后的数据;Xmin为列中最小值;Xmax为列中最大值。
(2)采用贝叶斯优化算法对GRU模型超参数进行优化。为提高模型的计算精准率,对模型中batch_size,epochs,learning_rate,units共4个超参数采用贝叶斯优化算法。编程语言为Python,基于Keras深度学习框架建立GRU模型。
(3)模型预测。将最佳超参数组合和测试集数据输入到GRU模型中,获得对应的变形预测结果。
对预测结果进行反归一化处理,由此得到最终的预测结果。计算公式为:
Xscaled=Xstd·(Xmax-Xmin)+Xmin
(8)
(4)模型性能评价。为检验模型的准确性和适用性,将预测结果与极限学习机(extreme learning machine, ELM)、相关向量机(relevance vector machine, RVM)和基于遗传算法优化的支持向量机(genetic algorithm-support vector machine, GA-SVM)变形预测模型结果进行对比分析。
某碾压混凝凝土重力坝工程位于福建省牟阳河上,水库总库容为4 700×104m3。该工程重力坝坝顶长206.00 m,最大坝高72.40 m,建基面高程为562.00 m。大坝设置了变形、渗流、应力应变、环境量等较为全面的监测项目,其中变形监测包括正垂线、倒垂线、引张线和视准线等,坝顶水平位移采用引张线法进行监测。坝顶引张线测点布置和水位、气温等环境量监测过程线分别如图3和4所示。
图4 实例工程水位和气温监测过程线
混凝土重力坝在服役期内受环境和荷载等多因素协同作用下引起老化,尤其是在水压力、温度(水温、气温、坝体内部温度)、时效等因素作用下造成变形。根据理论公式[20],大坝的水平位移δ为:
δ=δH+δT+δθ
(9)
其中:
(10)
(11)
δθ=c1θ+c2ln (1+θ)
(12)
本文选取该工程坝顶引张线EX2和EX6两个测点的水平位移监测数据作为模型因变量样本,对2016年8月5日至2017年7月21日共350组实测数据进行分析,EX2和EX6测点水平位移实测过程线如图5所示。对原始样本进行数据预处理后,选取2016年8月5日至2017年6月1日共301组数据作为训练样本,测试样本为2017年6月2日至2017年7月21日共49组数据,并以此进行基于贝叶斯优化算法的GRU混凝土坝变形预测模型的应用研究。
图5 EX2和EX6测点水平位移实测过程线
(1)模型参数设置。贝叶斯优化算法对GRU模型参数的寻优结果为batch_size=30,epochs=400,lerning_rate=0.01,units=300,采用两层的隐含层结构。RVM模型采用高斯核函数,核函数参数为16.3;GA-SVM核为径向基函数,采用GA算法对SVM模型优化,得到最优惩戒因子系数为256,核函数参数为0.5;ELM采用默认传递函数Sigmoid,隐藏神经元数为15。本次模型的输入变量数为9,输出变量数为1。
(2)模型评价指标。为验证本文预测模型的性能,选取平均绝对误差(MAE)和均方根误差(RMSE)两个参数作为评价指标来分析模型的预测精度。其计算公式如下:
(13)
(14)
(3)预测结果分析。各模型在EX2和EX6测点的水平位移预测结果与实际变形数据序列的对比如图6所示,预测性能评价指标见表2。
图6 EX2和EX6测点处水平位移预测结果与实际变形数据比较(2017年)
表2 EX2和EX6测点处的水平位移预测性能指标对比
通过对比图6中各模型预测值与实测值曲线可知,RVM和ELM模型的预测结果在预测期前半段的预测误差较大;相比于RVM与ELM模型,GA-SVM模型对测试集的后半段预测值与实际值接近,但对前半段位移的预测效果不佳。ELM模型的拟合曲线具有较好的拟合效果,但模型的预测准确度较低,难以进行实际应用。而基于BO-GRU模型的位移预测结果在两个测点整体表现较好。虽然在部分拐点的预测值与实际值有所差别,但预测误差较小,总体结果与变形实测值基本一致。
由表2可知,采用BO-GRU模型进行预测时,评价指标均明显优于其他模型,反映了该模型能够较好地预测非线性变形序列的优势。与RVM、GA-SVM、ELM模型相比,BO-GRU模型在EX6测点处的RMSE、MAE值分别为0.235、0.190 mm,两者均处于较低的区间,就MAE值而言,BO-GRU模型与其他3种模型相比,误差分别减小了71.81%、59.49%和68.28%,说明其预测误差较小,具有较高的拟合精度。另外,BO-GRU模型的运行时间更短。因此,基于BO-GRU的混凝土变形模型能够充分发挥深度学习在非线性时间序列预测方面的优势,从而实现更加准确地预测。
本文将贝叶斯优化算法和深度学习结合并引入到混凝土坝变形监测中,构建了基于BO-GRU模型的混凝土坝变形预测方法。通过工程实例验证得出以下主要结论:
(1)通过利用贝叶斯算法优化GRU模型中的batch_size、epochs、learning_rate、units参数,有效改善了模型易陷入局部最优的问题,从而提高了模型的精度和运行速度。
(2)通过与其他模型对比,BO-GRU模型预测结果的平均绝对误差和均方根误差分别降低了59.49%、58.77%,说明BO-GRU模型非线性拟合能力强,可用于大坝安全预警预报。
(3)GRU模型能够很好地处理具有非线性的大坝变形数据,但是仍然存在梯度消失、记忆力不足的缺点,如何解决这些缺点,还需要做更深入地研究。