王岩博,顾冲时,石 立,顾 昊,张建中,陆 希,吴 艳,朱明远
(1.河海大学水灾害防御全国重点实验室,江苏 南京 210098; 2.河海大学水利水电学院,江苏 南京 210098; 3.中国电建集团西北勘测设计研究院有限公司,陕西 西安 710065;4.新疆水利水电科学研究院,新疆 乌鲁木齐 830049)
混凝土坝是重要的国民基础设施,然而大型混凝土坝一旦失事,会给下游人民的生命财产带来巨大损失,并对周边城市、村庄和生态环境造成毁灭性的灾难[1],因此,确保混凝土坝健康长效服役至关重要。混凝土坝在设计施工中存在的不合理因素和在服役期间受到的动静循环荷载与恶劣环境侵蚀,会导致混凝土性能和大坝结构整体安全性降低,严重影响大坝的安全运行[2],需要大坝安全监控系统实时掌握混凝土坝真实的工作性态,及时发现混凝土坝运行过程中的缺陷和隐患,并对病险坝进行除险加固[3-5]。
在获取混凝土坝安全监测原始数据时,经常会因为读数错误、计算错误、检测仪器故障等产生一定的粗差。粗差的存在严重影响了大坝监测数据序列的准确性,只有采取有效措施予以剔除,才能取得真实可靠的大坝安全预测效果。目前应用广泛的粗差去除方法有过程线法、统计检验法和数学模型法[6-7],这些传统方法存在粗差识别率低,经常出现误判、漏判等问题,因此,Zhang等[8]基于集成学习算法提出了用实时数据更新的异常指标矩阵来识别大坝监测数据异常值的方法;Song等[9]基于多变量面板数据和K均值聚类算法建立了大坝异常值监测的理论方法;Shao等[10]利用图像处理技术和布谷鸟搜索算法处理大坝监测数据中的异常值。同时,也有众多学者将稳健估计理论引入粗差识别模型中,从而增强模型的鲁棒性和泛化能力。赵泽鹏等[11]提出了一种基于最小协方差行列式估计的拉依达准则改进算法来识别大坝监测数据中的残差异常值;Li等[12]提出了结合稳健统计量和置信区间的早期预警模型来识别监测异常值;李兴等[13]提出了基于M估计的改进Pauta准则去除粗差算法,有效地解决了异常值误判的问题;胡德秀等[14]结合稳健估计抵抗粗差能力强和极限学习机(extreme learning machine,ELM)能够处理非线性问题的优势,建立了基于M-ELM的大坝安全监控模型。与传统方法相比,这些方法能够较好地解决大坝变形数据中的异常值问题,但当存在连续偏离正常值或低偏差度的监测序列时,仍存在误判漏判现象,导致可利用信息在稳健估计中不能得到充分利用。这一现象需要进一步研究,以提高对异常数据的识别能力。
目前传统的大坝安全监控模型有数理统计模型、确定性模型和混合模型。葡萄牙、意大利等国家早在20世纪50年代就开始采用统计回归法建立大坝变形监控模型[15-16]。我国大坝安全监控模型起步相对较晚,20世纪80年代中期吴中如[17]采用逐步回归、加权回归等数理统计方法,建立了实测数据与效应量之间的统计模型,并成功地应用于实际工程中。近年来,随着计算机、大数据和人工智能的发展,随机森林算法、神经网络、粒子群算法等智能算法相继被引入大坝安全监控领域。Huang等[18]首次将核偏最小二乘法引入超高坝的安全监测中;Xu[19]构建了基于径向基函数神经网络的大坝变形监测模型;Gu等[20]基于优化随机森林方法建立了混凝土坝监测因子挖掘模型;Chen等[21]基于狄利克雷过程-高斯混合模型聚类算法提出了一种考虑时空分异的大坝综合位移预测模型。这些智能算法能够更好地解决监控模型中复杂的非线性问题和众多的不确定因素,提高大坝安全监控模型的鲁棒性和泛化能力,进而提高大坝安全监控的预测精度。
选权迭代法中的IGGⅢ法是稳健估计中最常用的方法,其初值的选取一般采用最小二乘法。然而,IGGⅢ权函数的一阶导数存在不光滑的“尖点”,导致其附近范围内的信息不能被充分准确地利用,对于小偏差异常值易造成数据误判漏判的现象。因此,本文结合IGGⅢ与ELM方法进行混凝土坝变形监测数据的粗差识别与回归分析,采用包含两个调和系数的四段权函数对IGGⅢ-ELM进行改进(以下简称“改进IGGⅢ-ELM法”),并结合工程案例讨论该方法在粗差识别和回归预测中的效果,以期更好地解决监测模型中复杂的非线性问题和众多的不确定因素,提高大坝安全监测模型的鲁棒性和泛化能力,进而提高大坝安全监测的预测精度。
ELM是一种简单高效的单隐含层前馈神经网络算法,相比于传统的神经网络算法具有学习速度快、泛化能力强、预测精度高等优点[22-23]。神经网络隐含层节点输出权重[14]为
(1)
式中:H为隐含层输出矩阵;B为隐含层的随机偏置矩阵,B=(b1,b2,…,bl)T;T为混凝土坝的变形实测值矩阵。
(2)
稳健估计中的选权迭代法是根据残差大小确定权因子,其中最有效的方案是利用IGGⅢ法逐步降低异常值的权重,达到准确识别粗差的目的。具体公式为
(3)
表1 IGGⅢ法权重处理方法
稳健估计是一个保留有效数据信息、削弱可用数据信息、剔除干扰数据信息的反复迭代过程。IGGⅢ权函数的一阶导数在k1处存在不光滑的“尖点”,使得k1附近的数据信息不能得到充分利用,易出现误判漏判的情况。因此,本文采用包含两个调和系数的四段权函数一阶导数来替代式(3):
(4)
改进IGGⅢ的权函数如图1所示。
图1 IGGⅢ及改进方案的权函数
在ELM中,隐含层节点数是影响网络泛化能力的一个重要参数,本文采取增量ELM法确定隐含层的节点个数。该方法的原理是初始化一个较小的ELM网络结构,逐渐增加隐含层的节点个数,使其结果达到期望精度为止。具体步骤如下:
由于(HTsHs)-1是对称的,因此有
(5)
因此有
(6)
解得:
(7)
因此可得:
(8)
令Ds=(M,N)T,把式(7)代入式(8)可以计算M和N,即可算得βs。
对于给定的数据拟合段N,初始隐含层节点个数为s,最大隐含层节点数为smax,期望精度为ε。
步骤1在ELM网络结构中随机生成输入大坝环境量因子的权重矩阵ω和偏置矩阵B(i=1,2,…,s)。
步骤2令s=1,计算隐含层输出矩阵H0和混凝土坝拟合效应量因子权重β0,并计算网络学习精度es=e0。
步骤3当s
步骤7输出混凝土坝在连续时间序列上的监测变形权重Pi,Pi为0的样本序列判定为粗差,予以剔除。
改进IGGⅢ-ELM法粗差识别流程如图2所示。
图2 改进IGGⅢ-ELM法粗差识别流程
某水电站是雅砻江干流梯级滚动开发的龙头水库电站,水库正常蓄水位1880m,主要任务是发电,兼有防洪、拦沙作用。该水电站的主要建筑物为混凝土双曲拱坝,坝顶高程1885m,最大坝高305m。本文选取电站运行期2016年9月1日至2018年5月19日的位移监测数据,分析并验证所用方法的准确性和适用性。图3为该水电站双曲拱坝的三维模型。
图3 双曲拱坝的三维模型
在混凝土坝运行过程中,大坝会受到水压力、扬压力、泥沙压力和温度等荷载的共同作用,选取水压分量δH、温度分量δT、时效分量δθ为自变量,大坝变形的位移δ为因变量,利用ELM建立自变量与因变量间的非线性映射,能够较好地构建大坝变形位移的预测模型,其表达式为
δ=δH+δT+δθ
(9)
拱冠梁的监测数据是馈控大坝变形安全的关键性数据,因此选取13号坝段坝中监测点PL13-3作为研究对象,将其径向位移监测数据划分为拟合段(用于模型拟合的数据样本)和验证段(用于验证模型泛化能力的数据样本),拟合段为2016年9月1日至2018年3月22日(共计522个数据样本),验证段为2018年3月23日至2018年5月19日(共计58个数据样本)。
为了检验改进IGGⅢ-ELM法识别粗差的效果,将震荡、台坎、突跳、台阶4种类型及偏差量较小的粗差引入到测点PL13-3中(粗差类型分别计为①、②、③、④、⑤),测点的位移过程线见图4。
图4 PL13-3测点加入粗差的位移过程
首先在ELM网络结构中随机产生权重ωi和bi,将隐含层节点数初始值取为1,将拟合段数据按式(5)处理后输入该网络结构。其次不断增加隐含层节点数s,当s=42时,满足所需的学习精度,因此选定隐含层节点数为42个。取δ=0.001,利用改进IGGⅢ-ELM法进行选权迭代,计算每个拟合段数据的权重。图4中所插入粗差的初次迭代权重如表2所示,最终迭代权重均降为0,根据最终迭代权重可识别出拟合段所有的异常值数据。
表2 粗差初次迭代权重
采用IGGⅢ-ELM法、DBSCAN聚类算法、罗曼诺夫斯基准则、拉依达准则与改进IGGⅢ-ELM法进行对比,分析不同方法去除粗差的效果。表3为不同方法的粗差识别情况对比。由表3可知,传统的拉依达准则和罗曼诺夫斯基准则粗差识别能力较差,识别率分别为7.14%和10.71%;DBSCAN聚类算法能识别出16个粗差,识别率为57.14%;IGGⅢ-ELM法能识别出①、②、③、④类型的粗差,但没有识别出粗差⑤,表明该方法对于小偏差量的异常值没有抵抗能力;改进IGGⅢ-ELM法能识别出28个粗差,识别率为100%。通过对比可知,改进IGGⅢ-ELM法不仅具有更好的稳健能力,而且能够充分利用k1附近的数据信息,精准地识别出大坝位移监测数据中偏差量较小的异常值。
表3 粗差插入位置和不同方法的粗差识别情况
根据表3数据,使用改进IGGⅢ-ELM法对5种方法剔除异常值后的数据集建立大坝安全监测模型,并根据2018年5月21日至2018年12月30日的水压、温度、时效分量对大坝径向位移进行预测,从而评估模型最终的泛化能力,如图5所示。由图5可知,利用改进IGGⅢ-ELM法剔除异常值后,模型拟合段的拟合值与实测值基本重合,拟合效果很好;从预测段的散点排列中可以看出,预测段的大坝径向位移变化趋势符合拟合段的大坝径向位移变化规律,表明该方法具有准确的预测精度和良好的泛化能力。
图5 5种方法剔除粗差后的大坝监测模型泛化能力
选取平均绝对误差(MAE)、均方根误差(RMSE)、决定系数(R2)作为评判指标进行对比,结果如表4所示。从表4可知,在剔除异常值后的大坝径向位移验证中,5种方法的R2均在0.85以上,验证段的MAE、RMSE均在1以内,表明利用改进IGGⅢ-ELM法进行大坝安全监测建模是合理和准确的。其中利用改进IGGⅢ-ELM法剔除粗差后拟合段和验证数据是5种方法中误差最小、相关性最强的一组数据。综上可知,利用改进IGGⅢ-ELM法去除粗差的比例最高,对后续大坝径向位移的监测效果最好。
表4 评判指标对比
针对复杂因素影响下大坝安全监测数据中的粗差问题,结合增量ELM法寻找最优网络结构速度快、改进IGGⅢ选权迭代法对异常值的抗差能力强、ELM对数据序列的预测效率高和处理非线性问题能力强等方面的优势,提出了基于改进IGGⅢ-ELM法的混凝土坝变形监测数据粗差识别方法。改进IGGⅢ-ELM法能够很好地解决连续时间序列数据中的粗差识别问题。工程案例表明,在人为添加28个粗差的大坝监测数据序列中,粗差识别率为100%。相比于其他4种粗差识别方法,该模型剔除粗差效果更好、识别精度更高、泛化能力更强,验证了模型的准确性与可靠性。通过5种方法剔除粗差后,利用改进IGGⅢ-ELM法对大坝安全进行监测,结果表明所用方法在剔除粗差后具有更好的拟合效果和更高的预测精度。