王伟力, 张乃斌, 谢海波, 潘 童, 张 飞
(1.杭州都市高速公路有限公司,杭州 310024; 2.河海大学岩土力学与堤坝工程教育部重点实验室,南京 210098;3.江苏省岩土工程技术研究中心,南京 210098)
边坡变形监测可以有效抓捕滑坡发育过程中表现出的各种特征和现象,然而仅仅获得监测数据是不够的,还需要对时间序列的监测结果进行深入的分析,从而形成有效的预警. 通过对先前发生的变形进行分析,一方面可以剖析其发生的原因,另一方面可以进而推测在未来一段时间(几天甚至几周内)边坡各监测点可能发生的变形趋势. 对于时间序列的边坡变形预测,需要采用一定的算法并建立合理的数学模型,从而实现边坡变形的预测.
由于高边坡变形时间序列在岩土体工程地质条件、工程施工、环境变化(如降雨、地震)等诸多内外影响因素的综合作用下呈现高度的复杂性和非线性,因此需要采用非线性变形预测分析方法. 目前根据所采用的监测方法获得数据规模可以分为:小样本预测和大样本预测,其中小样本预测主要基于传统的人工监测技术,大样本预测则基于先进的自动化监测技术. 小样本预测方法由于时间序列的数据量较少,主要体现在小样本数据潜在信息的挖掘,通过增加样本数据的相关信息量进行预测. 这方面预测方法主要有:灰色系统理论[1-2]、支持向量机方法[3-5]、回归分析法[6-8]. 大样本预测方法由于采用了自动化监测技术,数据丰富且具有大数据特点,因而可以选用的预测方法很多,主要以人工神经网络方法[9-12]为主. 随着物联网技术的快速发展,边坡变形的实时动态监测技术发展迅速,以全球定位系统的GNSS变形监测技术为主. 本文结合某公路路堑高边坡工程,采用了北斗GNSS边坡变形监测技术对高边坡变形进行长期监测,基于大数据深度学习方法对变形监测结果进行分析,建立相应的模型开展时间序列的变形预测,从而指导边坡预警.
极限学习机[13](Extreme Learning Machine,ELM)是一种基于单隐层的前馈神经网络算法,可以实现在隐层参数随机设置的情况下,网络中的所有参数不必进行迭代调整,就可以通过最小二乘法求取最小化误差二范数来确定隐层的偏置和输入权值. ELM 方法结构简单、运算速度快、泛化性能好,已经被广泛应用于诸多人工智能领域[14-18].
基于单隐层的神经网络算法,输入层和输出层通过隐层进行连接,建立输入数据和输出数据的映射关系,其基本网络结构如图1所示.
对具有N 个隐层节点的SLFN 网络模型样本(Xi,Yi),其中输入数据为Xi=(xi1,…,xin)T∈Rn,期望输出数据为Yi=(yi1,…,yim)T∈Rm,对于输入样本,经过隐层及输出层得到的输出结果表示为:
图1 网络结构图Fig.1 Network structure diagram
式中:f 为激活函数,wi=(wi1,…,win)T为输入层节点到隐含层第i 个节点的连接权重,bi为隐含层第i 个节点的阀值,βi为第i个隐含层节点到输出节点的权重,在求解βi之后即可实现预测过程.
ELM 算法的训练集在训练过程中总是固定的,但是实际情况下数据不可能一次性添加到训练集中,而新旧数据一起训练时会消耗大量时间. 为了解决该难题,Liang等[19]提出了OS-ELM(Online Sequential ELM)算法,在学习过程中可以将数据添加到所用的网络中,并且已训练学习完毕的数据可以不用再进行训练,不会影响训练效果,从而极大地缩短了训练所需的时间. OS-ELM 算法的基本假定是数据持续产生,保持网络参数的实施更新,通过数据的连续获取实现连续预测,其计算流程如图2(OS-ELM流程图)所示.
遗忘机制是逐步驱除有错误可能及过时信息数据的有效方法,Zhao等[20]在OS-ELM算法基础上结合了遗忘机制,提出了具有遗忘机制的FOS-ELM(Forgetting Online Sequential ELM)算法,其原理流程图如图2(FOS-ELM流程图)所示.
图2 OS-ELM与FOS-ELM流程图Fig.2 OS-ELM and FOS-ELM flow charts
FOS-ELM算法基本假定:训练数据具有一定的有效时间,超过这个时间该数据即变为无效数据,通过遗忘该数据保证网络的精度.
数据具有s的有效时间,第一步更新过程中,超过s有效时间的数据被舍弃,在此基础进行网络参数的更新,则可表示为如式(2)形式的矩阵:
其中:H=f(wx-b),f为激活函数,w为输入层节点到隐含层的连接权重,b为隐含层的阀值.
从而可以实现初始预测矩阵K的更新,如式(3),则二次预测矩阵β 的更新可表示为
在计算了β(k+1)的基础上,利用式(2)即可实现Y(k+2)的预测.
上述算法及其改进型主要是通过对二次预测矩阵β 矩阵的求解实现预测功能,为了降低该算法产生的随机参数对预测效果的影响,可以通过集成方法,进行多次预测求平均值(如式5)实现预测精度的提高,并降低预测误差.
其中:Yi为第i个预测值.
这里拟采用FOS-ELM算法对边坡变形进行预测分析,将北斗GNSS监测获得的变形位移量转变为随时间变化的时间序列数据,在数据处理过程中,需形成具有一定步长的预测向量,实现时间序列由历史数据预测未来数据的目的.
对于边坡变形预测数据的准确性,通常采用MAE(平均绝对误差)、RMSE(均方根误差)、MSE(均方误差)、R2(决定系数)来进行误差评价,具体表达式如下:
式中:MAE(Mean Absolute Error):平均绝对误差,是绝对误差的平均值. 可以更好地反应预测值误差的实际情况,范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型,误差越大,该值越大;RMSE(Root Mean Square Error):均方根误差,是衡量样本分布的离散度,表示观测值与真实值之间的偏差. 常用来作为机器学习模型预测结果衡量的标准,范围在[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型,误差越大,该值越大;MSE(Mean Square Error):均方误差,是统计学中较为常见的误差计算方式. 它是真实值与预测值的误差的平方的期望,范围在[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型,误差越大,该值越大;R2:决定系数,越接近于1表示预测值与真实值间误差越小.
FOS-ELM算法中有几个重要参数(如运行次数n、训练数据长度k,隐藏节点数t、有效时间s等),需要对其进行合理设置,才能获得较好的预测效果.
运行次数n由于初始权重矩阵随机产生,对结果会产生影响,增加ensemble次数即可消除该影响,可对预测结果求平均;训练数据长度k由于所述方法为连续更新算法,改变初始训练数据长度对结果影响不大;隐藏节点数t在本算法中包含多个隐含层层数,利用黄金分割算法在最大值与最小值中寻找理想的隐含层节点数,这样就充分地保证了网络的逼近能力和泛化能力. 隐藏节点数需要在程序中对结果进行多次计算,在达到逼近能力最强的隐含层节点数取为隐藏节点数,其值对运算结果有较大影响;有效时间s带入运算的数据都具有一定的有效时间,在更新过程中,超过有效时间的数据被舍弃,在此基础进行网络参数的更新,该值极大FOS-ELM算法会退化为OS-ELM算法. 为此,这里针对这几个参数进行了敏感性分析,为预测模型的参数选取提供可靠依据.
图3(a)给出了运行次数n对预测效果的影响,其中给出了4种误差指标. 从图中可以看出,预测效果随着运行次数的增加而逐渐变好,然后趋于稳定,当运行次数n超过30以后,则对预测效果基本没有影响. 因此,建议采用运行次数n=30. 图3(b)给出了训练数据长度k 对预测效果的影响,从4 种误差指标的变化规律,可以看出训练数据长度对预测效果影响较小. 训练数据长度k在50~80之间,预测效果最好,其他范围下会稍微降低预测效果,因此建议采用训练数据长度k=60. 图3(c)给出了隐藏节点数t对预测效果的影响,从4种误差指标的变化规律,可以看出隐藏节点数对预测效果影响显著. 预测效果随着隐藏节点数的增加先增加,然后再逐渐减小. 隐藏节点数t在10~15之间,预测效果最好,其他范围下会稍微降低预测效果,因此建议采用隐藏节点数t=10. 图3(d)给出了有效时间s对预测效果的影响,从4种误差指标的变化规律,可以看出有效时间对预测效果影响非常小,可以不予考虑,因此建议采用有效时间s=100.
图3 不同参数下的预测效果Fig.3 Prediction effects under different parameters
结合浙江地区某高速公路路堑高边坡工程,该段边坡长140 m,最大坡高约52.4 m,设计为五级坡,坡体主要由强风化及中辉绿岩构成,每级坡高10 m,第五级开挖到顶,横断面图如图4所示. 边坡及位移监测点如图5所示,监测点采用的是北斗GNSS边坡变形监测.
图4 边坡横断面图Fig.4 Cross-sectional view of the slope
图5 监测点平面布置示意图Fig.5 Schematic diagram of monitoring site layout
图6给出了边坡两个监测点(1号监测点和2号监测点)的累计水平位移量的预测结果,通过实测结果与预测结果对比,整体上预测结果与实测结果还是非常吻合. 但是由于这两处测点后期数据波动较大,在波动阶段预测结果与实测结果存在一定偏差,这是由于前期训练学习没有对该波动阶段进行过有效学习导致. 图7给出了实测结果与预测结果的分布图,大部分的结果分布在等线周围,其中少量在波动阶段的数据有一定的偏离.
图6 边坡累计水平位移量预测结果Fig.6 Prediction effects of cumulative horizontal displacements of slope
图7 边坡累计水平位移量预测效果Fig.7 Prediction effects of cumulative horizontal displacements of slope
图8给出了边坡两个监测点(1号监测点和2号监测点)的累计水平位移量的预测结果,1号测点的预测结果与实测结果发展趋势较好,仅在个别突变处产生了显著的差别. 图9和图10分别给出了两个监测点的实测结果与预测结果的分布图,预测值的离散性随着超前预测时间的增长而逐渐增大,越来越偏离实测结果与预测结果的等线.
图8 边坡累计水平位移量预测效果Fig.8 Prediction effects of cumulative horizontal displacements of slope
图9 边坡1号监测点的累计水平位移量预测效果Fig.9 Prediction effects of cumulative horizontal displacements of No.1 monitoring site of the slope
图10 边坡2号监测点的累计水平位移量预测效果Fig.10 Prediction effects of cumulative horizontal displacements of No.2 monitoring site of the slope
表1给出了高边坡的两个测点变形量多步超前预测结果误差值,1号监测点测点的6 h超前预测误差R2可达0.7以上,其预测效果在可接受范围内,随着超前预测时间增大而误差增加显著. 2号监测点变形波动性较大,超前6 h的预测结果就大大偏离了实测结果了,超前预测效果较差.
表1 高边坡测点的多步超前预测误差分析数值Tab.1 Multi-step prediction error analysis of high slope monitoring sites
针对高边坡变形时间序列的复杂性和非线性特点,本文基于FOS-ELM的深度学习法开展高边坡变形预测,通过对某路堑高边坡上两个监测点的变形数据进行预测分析,得出如下几点结论:
1)通过边坡断面两个监测点的时间序列变形结果进行单步提前1 h预测,整体上预测结果与实测结果较为一致,误差精度控制在较高水平范围内,验证了所采用FOS-ELM算法预测的可靠性;
2)相比单步预测,超前几小时的多步预测效果随着超前时间的增大而显著降低,总体超前6 h预测效果可以满足工程要求;
3)超前几小时预测误差较大,需要在预测模型中考虑其他影响因素(如降雨、地下水等),通过深度学习方法建立边坡变形与这些参数的相关性才能有效提高超前预测效果.