万祥 魏博文 徐富刚 张升
摘要:
针对传统统计模型并不能完全涵盖位移影响分量信息以及真实影响分量信息易受到噪声干扰等问题,提出了一种融合小波阈值理论与多维自回归的混凝土坝位移时序预报模型。该方法主要是将小波阈值理论与时间序列算法结合起来创建混凝土坝位移时序预报模型,模型通过不同小波分解层数、小波基、阈值选取准则、阈值函数集成出一个MATLAB编码平台进行数据平滑处理,能高效挖掘大坝位移数据的影响分量信息,并选择自回归(autoregressive model,AR)时间序列模型作为预报模型。实例应用表明,新的融合模型预测性能较好,能有效监测大坝运行状态,且其分析结果对于其他数字工程的数据预测也具参考价值。
关 键 词:
小波阈值; 多维自回归模型; 混凝土重力坝; 位移预报
中图法分类号: TV32
文献标志码: A
DOI:10.16232/j.cnki.1001-4179.2023.07.029
0 引 言
大坝作为一种关乎到人民生命财产安全的长久性建筑物,其运行期间受到水位、温度、地震、材料老化等多种内外环境因素共同影响[1-2],大坝位移偏移量并不像传统统计模型一样,只受到水压分量、温度分量、时效分量的影响,其影响因素具有一定的多维复杂关联性[3]。而大坝建成后所处自然环境大体不变,其大坝位移偏移量所受到的环境因素影响具有周期性以及规律性[4],使得学者可借助时间序列算法建立相关数学模型,并根据已有的大坝位移观测数据去预测大坝未来的位移偏移量成为可能。
伴随着神经网络[5-7]、支持向量机[8-9]、随机森林[10-11]、时间序列分析[12-13]等人工智能算法的蓬勃发展,研究人员已经能够做到对大坝位移的深入研究与预测,但是预测精度除了受算法本身影响外,还会受到数据中随机变量的干扰,而模型训练了无效位移信号,将对模型预测精度产生影响。为了让数学模型训练数据真实性更高,进行数据预处理很重要,相关学者在这一方面进行了深入的研究。李双平等[14]首次将小波分析和谱分析引入到变形监测分析和预报中,使得模型预报精度在传统回归模型基础上有所提高;陈俊风等[15]将小波变换理论与差分变异头脑算法优化BP神经网络结合起来应用于大坝变形预测,运用小波分析將数据序列分成许多子系列进行预测,提高了模型预测精度。但是以上方法运用的小波分析不具有全面性、系统性,且预测模型处理数据过程过于繁琐,不具普适性。
本文先通过MATLAB编程将不同小波基、分解层数、阈值选取准则、阈值函数集成进小波阈值数据平滑处理系统,在剔除掉一些不确定因素对预报精度干扰的前提下,通过对比得到降噪最佳的小波阈值处理结果;再结合贝叶斯准则AR模型与赤池信息量准则AR模型在预测方面的充分探讨(这两个准则的选取其实是一种正则化的模式),挑选出众多模型中预测效果最好的模型,得到融合小波阈值与多维自回归的混凝土坝位移时序预报模型,以期在预测精度较高的前提下保证高效性。
3 融合小波阈值与多维自回归的混凝土坝位移时序预报模型构建
通过以上理论可知,小波阈值处理位移监测数据减少了随机变量对预测精度的干扰,提高了模型泛化能力,再结合AIC与BIC准则定阶下的AR时间序列算法对比研究,构建了针对大坝监测数据的大坝变形组合预报模型框架。充分运用上述理论,通过试验比较得出最佳预测模型,最后进行小波阈值与多维自回归的混凝土坝位移时序预报模型框架构建,构建流程如图1所示。
(1) 将分解层、小波基、阈值准则、阈值函数编码于MATLAB平台上,通过调整分解层、小波基、阈值准则、阈值函数对大坝位移监测数据进行试算,对比得到预处理最佳的小波阈值预处理组合方式。
(2) 对小波阈值预处理后的数据进行ACF,PACF相关性检验,确定时间序列模型。
(3) 在间序列模型下进行AIC准则、BIC准则定阶,最后通过预测结果精度对比得到最佳预测模型。
4 工程实例
4.1 工程基本资料
位于中国福建省的棉花滩水电站,总库容20.35亿m3,年发电量15.2亿kW·h,主坝全长308.5 m,坝顶高程179 m,坝高113.0 m,坝顶宽度7.0 m。该坝从左至右共6个坝段,其中1号、2号、5号、6号坝段为左右两岸非溢流坝,3号、4号坝段为溢流坝,选取2号坝段2018年1月1日至2020年7月31日正垂线PL5水平位移自动化监测序列进行分析,得到944组数据的位移实测序列,选取周期间隔1 d作为模型训练样本。同时选取2020年8月1日至2020年8月30日的29组数据进行预报来检验模型的可靠性。监测时段内PL5实测位移与上游水位的变化过程如图2所示。
4.2 小波阈值数据预处理
将PL5测点的水平位移数据作为原数据信号进行小波变换阈值数据预处理,选取dbN、symN、coifN 3种小波基进行数据处理,并对大坝位移数据信号进行2~5层分解试算,根据信噪比比较,得知静水压力下的大坝位移数据信号在3层分解的情况下得到充分挖掘。由于文中主要是比较小波基、阈值准则、阈值的选取问题对大坝位移数据平滑处理效果的影响情况,分解层数的处理效果将不在文中展示。大坝位移数据在分解层数为3的情况下,不同小波基、阈值准则、阈值的降噪效果可由其降噪后的信噪比进行比较,如图3所示。
选取了db3~db8、sym3~sym8、coif1~coif5等多种具有典型代表的小波基;4种阈值选取准则分别为无偏似然估计准则、启发式阈值准则、极大极小阈值准则、固定阈值准则;阈值函数为软阈值、硬阈值函数。从图3可以总结出以下结论:① 3种小波基的降噪效果虽有一定的差距,但都很均衡;② 无偏似然估计准则数据预处理效果比另外3种阈值选取准则更佳,信噪比波动也较大;③ 位移数据信号在硬阈值函数的情况下预处理效果普遍好于软阈值函数。
将图3全部降噪效果进行对比,得知该组数据信号在小波基db5、无偏似然估计准则、硬阈值函数时降噪效果最佳,信噪比为43.083 9 db,随后将这一组预处理效果最好的大坝位移数据输入到预报模型中进行性能探究。当然该MATLAB数据预处理平台只是一个处理过程,对于不同测点、不同坝段的数据信号特点都具有差异性,得到的预处理效果最佳方式是不同的。
4.3 模型确定与效果对比
模型的选择直接影响到该模型的预测效果,AR模型、MA模型、ARMA模型、ARIMA模型如何选择,依据输入大坝位移数据得到的自相关系数与偏自相关系数随阶数p的变化趋势确定。预处理后的大坝位移监测数据输入时序模型其相关系数如图4所示。
图4(a)中,自相关系数随着阶数p的增加而呈现指数衰减情况,属于拖尾现象;图4(b)中,偏自相关系数在阶数p为2时突然衰减,随后在零附近波动,属于2阶截尾现象,根据拖尾、截尾状况确定预测模型为AR模型。
模型确定之后,选取AIC准则和BIC准则分别对AR模型进行定阶比较,其AIC值与BIC值随阶数p的变化如图5所示。
从图5可以看出:AIC准则下模型的AIC值在延迟阶数p为8后,变化相对平稳,到了延迟阶数p为22时,达到了最小值56.099 8;而BIC准则下模型的BIC值在延迟阶数为4时就达到了最小值102.500 8,随后BIC值伴随延迟阶数p呈现上升趋势。可见BIC准则下的AR模型能够实现快速定阶,达到预报模型最佳状态,而延迟阶数越大、信息准则值越小,其预报性能越好。
混凝土重力坝当年所处环境如何,对大坝位移监
测数据具有一定的影响,为了检验大坝所处环境的一
致性对位移量的影响,以多年测点水平位移进行pearson相关性分析,测点多年水平位移相关性分析如图6所示。
根据图6可知,PL5测点多年水平位移相关性较高(都高于0.7),PL2测点水平位移相关性较低,但都大于0.3,仍表明位移数据具有一定相关性。位移数据相关性的强弱对模型预测精度具有一定影响,测点数据相似性越高,其时间序列模型预测精度自然提高。
随后将PL5测点的逐步回归模型、小波变换阈值处理后的多维自回归模型(AIC准则下)拟合与预报结果以及残差序列图绘制于图7。
为了进一步验证整套预报流程的准确性,将正垂线PL2大坝位移数据作为数据样本建立模型进行校验。同时,为了更加全面地比较以上几种模型的预报精度,分别量化计算了PL5和PL2这两个测点的统计指标,结果见表2,可以得出以下结论:
(1) 单从模型的角度比较,AR模型的拟合部分决定系数R2虽略高于逐步回归模型,但在预测部分逐步回归模型的决定系数远远小于AR模型,说明AR模型在大坝位移预测方面不仅存在很大的优势,而且模型建立过程简便。
(2) 至于AR模型中所运用到的信息准则函数,AIC准则下的AR模型无论是在大坝位移数据的拟合部分还是预测部分精度都要略高于BIC准则下,究其原因是AR时间序列模型本身不存在维度或参数过多的原因使得模型过于复杂化,所以BIC准则下的AR模型只能保证快速找到其相应准则下预测最佳的模型,而AIC准则下的AR模型拥有最佳的预测效果。
(3) 单从两个测点的拟合与预报精度来看,结合了小波变换阈值降噪的AR模型相比于单纯的AR模型,无论是拟合精度还是预报精度都得到了一定程度的提升。
(4) PL5测点的模型预测精度明显高于PL2测点的预测精度,证实了测点数据相关性越高(大坝所处环境相似性越高),其监测模型的预测精度越高;若是大坝所处环境变化太大,大坝位移量偏差太大,可通过小波阈值预处理方式对前期数据进行适当修正。
5 结 论
(1) 本文提出了融合小波阈值与多维自回归的混凝土坝位移时序预报模型。研究了小波阈值预处理技术:采用不同小波基、分解层数、阈值函数准则、阈值函数进行系统性整合,这是降噪效果甚好的小波阈值降噪方法,它能较好地滤除大坝位移数据中蕴含的不确定信息带来的影响分量,使得建立的模型预报精度不受干扰。
(2) 文中所用到的AR模型能从数据的角度将所有影响分量信息考虑在内,用过去的位移数据预测未来的位移偏移量,能有效解决传统统计模型建立需处理多自变量与应变量之间关系带来的冗杂问题,同时还能在保证模型预测精度的前提下提高模型位移预报效率。
(3) 本文所建模型还能够充分挖掘出混凝土坝位移数据的影响分量信息,在大坝位移数据预测方面具有精密性、快捷性,并且適用于相近工程大坝位移监测数据预测,对于其他数字工程的数据预测也具有一定的借鉴价值。
参考文献:
[1] 顾冲时,苏怀智.混凝土坝工程长效服役与风险评定研究述评[J].水利水电科技进展,2015,35(5):1-12.
[2] 周元春,甘孝清,李端有.大坝安全监测数据粗差识别技术研究[J].长江科学院院报,2011,28(2):16-20.
[3] 李明超,任秋兵,孔锐,等.多维复杂关联因素下的大坝变形动态建模与预测分析[J].水利学报,2019,50(6):687-698.
[4] 李广春,戴吾蛟,杨国祥,等.时空自回归模型在大坝变形分析中的应用[J].武汉大学学报(信息科学版),2015,40(7):877-881.
[5] 冯非凡,武雪玲,牛瑞卿,等.一种V/S和LSTM结合的滑坡变形分析方法[J].武汉大学学报(信息科学版),2019,44(5):784-790.
[6] STOJANOVIC B,MILIVOJEVIC M,MILIVOJEVIC N,et al.A self-tuning system for dam behavior modeling based on evolving artificial neural networks[J].Advances in Engineering Software,2016,97:85-95.
[7] CHEN H Q,ZENG Z G.Deformation prediction of landslide based on improved back-propagation neural network[J].Cognitive Computation,2013,5(1):56-62.
[8] 林玲,陈福集,谢加良,等.基于改进灰狼优化支持向量回归的网络舆情预测[J].系统工程理论与实践,2022,42(2):487-498.
[9] 杜传阳,郑东健,张毅,等.基于改进PSO-SVM-MC模型的大坝變形监测模型[J].水电能源科学,2015,33(2):74-77.
[10] 林威伟,钟登华,胡炜,等.基于随机森林算法的土石坝压实质量动态评价研究[J].水利学报,2018,49(8):945-955.
[11] DAI B,GU C S,ZHAO E F,et al.Statistical model optimized random forest regression model for concrete dam deformation monitoring[J].Structural Control and Health Monitoring,2018,25(6):90-104.
[12] 胡安玉,包腾飞,杨晨蕾,等.基于LSTM-Arima的大坝变形组合预测模型及其应用[J].长江科学院院报,2020,37(10):64-68.
[13] SONJA G,MARIA J H,MICHAEL O,et al.Analysis of periodicities in long-term displacement time series in concrete dams[J].Structural Control and Health Monitoring,2020,27(3):46-59.
[14] 李双平,张斌.基于小波与谱分析的大坝变形预报模型[J].岩土工程学报,2015,37(2):374-378.
[15] 陈俊风,王玉浩,张学武,等.基于小波变换与差分变异BSO-BP算法的大坝变形预测[J].控制与决策,2021,36(7):1611-1618.
[16] 周涛涛,朱显明,彭伟才,等.基于CEEMD和排列熵的故障数据小波阈值降噪方法[J].振动与冲击,2015,34(23):207-211.
(编辑:胡旭东)
Time series forecasting model by fusion of wavelet threshold theory and multi-dimensional autoregressive
WAN Xiang,WEI Bowen,XU Fugang,ZHANG Sheng
(School of Infrastructure Engineering,Nanchang University,Nanchang 330031,China)
Abstract:
Aiming at the problems that the traditional statistical model can not fully cover the displacement influence component information and the real influence component information is susceptible to noise interference,a time series model for concrete dam displacement prediction based on wavelet threshold theory and multi-dimensional autoregressive was proposed.The core of this method was to integrate a MATLAB coding platform for data smoothing through different wavelet decomposition layers,wavelet bases,threshold selection criteria,and threshold functions,so as to fully and efficiently mine the influence component information of dam displacement data,and selected the auto-regressive time series model as the prediction model.The engineering application showed that the new fusion model had better prediction performance,which ensured the safe operation of the dam comprehensively and efficiently,and its analysis results had a certain reference value for the data prediction of other digital projects.
Key words:
wavelet threshold theory;multi-dimensional autoregressive model;concrete gravity dam;displacement prediction