赵 杰,高志良,巨淑君, 李 龙
(1.国电大渡河流域水电开发有限公司,四川 成都 610000;2.成都嘉捷信诚信息技术有限公司,四川 成都 610000)
边坡系统是一个非常复杂的非线性动力系统,具有典型的非线性、非平稳性、随机性、多维度性、突变性、无序性等,边坡预测被普遍誉为世界性尖端课题[1].国内外学者从上世纪60年代开始聚焦研究边坡预测课题,距今已有近60年.总结已有的研究成果,可将边坡变预测划分为现象与经验预测阶段(20世纪60-70年代)、位移-时间统计分析预测阶段(20世纪80年代)、非线性预测及智能集成预测阶段(20世纪90年代以来)三个主要阶段[2-4].
第一阶段所用方法主要依赖于人为经验,预测精度受限且仅适合中短期预测;第二阶段所用方法主要采用了先进的数学统计方法,逐渐转向量化,忽略了一些影响边坡变形的特征因素,因此预测可靠性受限;第三阶段主要采用了非线性方法及人工智能算法,更加全面对边坡整体系统进行了研究,但是仍然存在边坡位移模式及状态辨识问题、适应性问题、多因子协同问题等[10-15].
基于以上问题,本文以现有国内外位移预测理论和模型算法为基础,以大渡河流域黄草坪滑坡体的工程概况、位移监测及流域库区水文、气象、地震等情况的研究为实际切入点,将地质学、土力学、物理学等理论体系与大数据、机器学习等前沿技术、方法相融合,提出了具有适应性的基于趋势拐点研究的Prophet累计位移预测模型,并对模型的实际预测效果进行评价和分析.
自然界中边坡体形态各异,根据其位移累计曲线大致可以划分为三个阶段:初始变形阶段、匀速变形阶段、加速变形阶段[5-6].初始变形阶段是由于边坡体内部力学结构发生变化,边坡出现裂缝开始变形.前期变形速率较大,后期变形速率降低且逐渐平稳,过渡到匀速变形阶段.此阶段主要受自身重力的影响,位移累计曲线总体呈一缓慢向上的直线,可能过程中由于外界因素扰动出现些微波动.加速变形阶段位移累计曲线斜率不断增大,直至边坡体发生滑坡.
因边坡系统的复杂性,边坡变形的影响因素众多,通过大量的实验研究表明,主要分为内在因素和外部因素两个方面[7].内因是边坡发生变形的根本因素,即边坡的形成条件,包括边坡的地形地貌、地质构造、地层岩性等,决定了边坡变形的规模[8].外因是导致边坡变形乃至滑坡的直接原因,通过改变内在因素的情况影响边坡的稳定性,即边坡的诱发因素,包括降雨、地震、库水位、人类活动、植被覆盖率等[9].本文将边坡变形影响因素划分为形成条件和诱发因素两大类,形成图1所示的边坡变形评价因素体系.
图1 边坡变形评价因素体系
根据边坡变形特性与特征因素关系的研究结果,对于边坡变形位移的预测,在常见的机器学习回归分析预测的场景下,需综合考虑量化的内、外因特征.但因部分监测结果的非时序性和不可监测性,导致有的重要影响因素可能并未考虑进去,造成预测结果具有随机性,预测精度下降.故本文采用只需利用自生变量无需借助外生变量的Prophet框架进行边坡位移预测模型的研究.
Prophet框架基于加法模型构建,其可对存在年、周、季节乃至假期等因素的非线性趋势进行拟合,特别是在至少一年历史数据的情况下,对于日常周期项数据拟合的效果最好.且Prophet对缺失值、异常值、趋势拐点均有极强的鲁棒性.包含增长趋势g(t)、季节趋势s(t)、突发事件h(t)以及噪声ε(t)四个部分:
y(t)=g(t)+s(t)+h(t)+ε(t).
(1)
增长趋势主要包括地形地貌、地层岩性、地质构造等因素对边坡位移的影响,存在一些突变点,默认情况下,Prophet将自动监测到这些点,之后对趋势变化的幅度做稀疏先验(等同于L1正则化)并对趋势做适当地调整,潜在突变点的数量可以通过设置n_changepoints参数来指定.自动监测可能不小心忽略了一个趋势速率的变化或者对历史数据趋势变化存在过拟合现象,因此手动指定潜在突变点的位置,使用n_changepoints参数,根据预测目标曲线特性分类进行手动添加.
季节趋势季包含降雨、温度等具有明显季节特性的影响因素对滑坡位移的影响的模型,使用傅里叶级数来近似表达这个周期属性,具体表达式如下:
(2)
式中:P表示某个固定的周期;N表示在模型中使用的该类周期的个数,一般来说,该值越大越易于拟合出更复杂的季节趋势,但过大会造成过拟合问题.
突发事件模型指地震、人工活动工程等特殊时间造成的变化部分的模型.将不同特殊时间在不同时间点下的影响视作独立模型,且同时为每个模型均设置了时间窗口,模型将同一时间窗口中的影响设置为同一值,表达式如下:
(3)
式中:Di表示窗口期中包含的时间,ki表示时间窗口中的特殊时间对预测值的影响.
噪声,即随机、无法预测的部分,在本发明中可视为没有考虑到的影响因素.
黄草坪边坡地处大渡河左岸泸定县得妥乡,库周交通公路新华村段约K1+200 m~K1+360 m之间,距离坝址16.8 km,边坡发育于大渡河断裂带夹持的三叠系白果湾组(T3bg)薄层砂、页岩中,由崩坡积堆积的块碎石土层和部分碎裂松动变形岩体组成.边坡位于1#沟和2#沟两条浅沟之间,前缘高程约1 115 m,后缘高程约1 600 m,顺河长度约160m~300 m,宽度约660 m,总体积约150万m3.
黄草坪边坡主要由崩坡积堆积的块碎石土层组成,可能涉及部分碎裂松动变形岩体,蓄水前覆盖层曾发生过小型塌滑.截至2019年,黄草坪变形体边坡监测设施布置情况,见下表1、图2所示.
表1 黄草坪边坡监测设施布置情况
图2 黄草坪边坡监测点分布
考虑监测设备测点覆盖性,选取GNSS监测点数据作为研究对象.GNSS监测点位采集了X、Y、Z向位移累计值以及变形速率值.数据情况如表2所示.基于黄草坪边坡数据缺失值比例较高,均为数值型数据,故采取线性填充法进行缺失值填充.
表2 黄草坪GNSS监测点位数据情况表
3.3.1 预测对象选取
黄草坪GNSS监测点(HP01-HP13)位移累计曲线如图3所示,基于对当前模型在不同土质边坡位移特征适应性以及数据的完整性考虑,选取具有匀速-增速-减速-匀速的复合型特征的HP02数据进行模型构建和预测.将HP02数据样本集的后七天划分为测试集(2020-02-17至2020-02-23),将剩余的样本数据划分为训练集(2017-03-14至2020-02-16).
图3 黄草坪GNSS监测点(HP01-HP13)位移累计曲线Fig.3 GNSS monitoring points (HP01-HP13) of Huangcaoping
3.3.2 基于Prophet边坡位移预测模型
将HP02的训练集进行清洗,整理为Prophet可用的时间序列格式,放入基于其边坡位移特征趋势拐点特征设置初始化参数的Prophet中,进行未来7日每一日的边坡位移预测.Prophet框架因HP02样本数据的预测对象累计坡面位移无饱和值,选定基于分段线性函数的增长模型“linear”,且在前90%的训练集中分别预设了145的拐点数和0.5的值来控制“linear”增长模型的平滑度,与此同时,考虑了周、年季节性,以95%的置信区间进行模型训练.
3.4.1 评价指标
构建适合边坡位移预测的模型,实质上需要选取多个指标从多维度考虑模型的预测结果.评估实际值和预测值的准确程度,选取能去除基数本身影响的指标——MAPE,即平均绝对百分比误差,其公式为:
(4)
MAPE的取值范围为[0,+∞),一般而言,MAPE=0%表示完美模型,MAPE大于10%表示劣质模型.
评估实际值和预测值的偏离程度,选取绝对平均误差MAE作为评价指标,MAE的值越小说明模型越好,预测越准确.其公式为:
(5)
3.4.2 评价结果
为了对比Prophet模型的预测效果,因此选用了典型的时间序列预测模型ARIMA和神经网络模型LSTM.未来7日每日的预测值与测试集的对比如图4所示,评价指标结果如表3所示.Prophet在MAPE、MAE上的表现均优于ARIMA和LSTM模型,说明Prophet的预测结果在精度和稳定性上整体较优于LSTM、ARIMA模型,选取该模型进行边坡位移预测更为合理.
图4 黄草坪HP02预测值与实际值对比图
表3 黄草坪HP02评价指标结果
因此进一步分析Prophet模型的增长趋势,如图5所示.红色的竖虚线表示模型自动识别的趋势拐点,红色实线表示HP02在重力的影响下位移的增长趋势.深蓝色曲线代表HP02的实际曲线,浅蓝色曲线代表HP02的模拟曲线,二者的复相关系数为99.0367%,说明拟合的效果非常好.
图5 黄草坪HP02增长趋势图
本文重点研究了边坡变形特性及与特征因素的关系,建立了边坡变形评价因素体系.影响边坡变形的因素分为内在因素(形成条件)和外在因素(诱发因素),内在因素评价了边坡失稳的可能性,而外在因素往往是边坡失稳的诱发因子.依托大岗山水电站黄草坪边坡体开展位移预测研究.由于边坡变形位移部分监测结果的非时序性和不可监测性,并且可获取的降雨量、库水位、温度特征对边坡位移存在的影响其实在长时间窗口中非常小,故采用ARIMA、LSTM、Prophet三种模型针对大岗山黄草坪位移值本身的变动规律进行预测,以7天预测结果的MAPE、MAE值作为评价指标,Prophet模型结果的精度整体高于LSTM模型高于ARIMA模型,实验验证了所提模型的正确性和普适性.后续将通过大量工程实例来进一步佐证和优化模型.