用于洞察多时间尺度水文过程的深度学习模型

2022-02-09 13:36刘文强
现代盐化工 2022年6期
关键词:时间尺度步长水文

刘文强

(1.天津师范大学 水资源与水环境重点实验室,天津 300387;2.天津师范大学 地理与环境科学学院,天津 300387)

河流流量是全球和区域水文循环的基本组成部分[1-2]。准确的流量预测在保障及时有效的水资源管理、农业灌溉、水力发电、防洪调度和风险评估等方面发挥了重要作用[3-5]。循环神经网络长短期记忆(Recurrent Neural Network Long Short-Term Memory,RNN LSTM)是深度神经网络最先进的技术之一,已被广泛应用于流量预测。Hu等[6]在2018年利用RNN LSTM成功模拟了多年洪水事件的“降水-径流”过程,揭示了数据驱动模式下降水和径流时间序列之间的关系。Sudriani等[7]在2019年利用RNN LSTM分析了多年日尺度流量的动态变化,并为灌溉和水资源管理控制提供了方案。Kratzert等[8]在2019年利用RNN LSTM对大型水文进行建模,证明了水文模型在大数据范式下的性能显著提高。

本研究主要评估RNN LSTM模型在每日、每周和每月3种时间尺度下的预测性能,将模型应用于预测海河上游唐河流域的实际案例中,多个水文气候要素作为输入并找出模型中重要参数的最优设置。本研究的主要目标是:(1)比较每日、每周和每月时间尺度下的模型预测结果,揭示模型中长期预测性能的差异,并对流量预测提出见解;(2)通过设置参数中的不同时间序列步长,得出多种流量预测结果,调查每种时间尺度下流量变化对水文气候要素的周期性响应;(3)利用模型学习多个水文气候要素与流量之间的非线性关系,能准确捕捉流量曲线。

1 研究区域和数据获取

1.1 研究区域

研究区域位于大清河流域西部,即113°39′~116°14′E、38°11′~40°04′N,面积约为4 990 km2,如图1所示。本研究以大清河流域上游山区的倒马关水文站为例,研究气候要素和人类活动作用下河流流量的响应机制。该站为大清河水系唐河上游控制站,地处深山,位于东经114°38′、北纬39°05′,主要受季风影响,属温带季风气候,6~8月雨水相对充沛,流域平均年降水量为612.37 mm。控制断面以上流域面积为2 770 km2,主河道长131.0 km,河道纵坡8.0%,流域平均宽度为27.7 km。

1.2 数据获取

本研究收集了2006年1月1日至2014年12月31日唐河流域的水文和气候数据。水文数据来自《中华人民共和国水文年鉴:第三卷 海河流域水文资料》,包括研究区域河流的流量、降水量、水位和水温。气候数据下载于中国科学院地理科学与资源研究所-资源环境科学与数据中心网站(https://www.resdc.cn/),包括地温、气压、相对湿度、日照和风速。

2 研究方法

本研究使用RNN LSTM作为建模框架来建立中长期预测模型,任何给定时间的时间序列数据都作为当时的输入提供,任何给定时间的气候和水文输入数据都作为向量值时间序列,其中每个输入在本研究中被称为指标。这里使用的指标类似于图像处理体系中已知的特征。

RNN LSTM是对传统RNN模型的改进,具有更长的记忆,可以避免梯度在最小化步骤中消失和爆炸(见图1)。RNN LSTM包括3个控制门:遗忘门ft、输入门it和输出门ot。它们在机器学习过程中选择性地允许信息通过。ft、it、新值新单元状态ht和ot的网络结构相似。新状态、遗忘门、输入门、新值和输出门是由之前的状态和新输入计算出来的,方法是将相关变量与权值矩阵Wf、Wi、Wc和Wo相乘,再加上偏差,然后分别由激活函数(sigmoid或tanh函数)作用。等式⊙为Hadmard乘积(元素乘法)。详细的RNN LSTM结构总结在公式(1)~(8)中。

图1 具有LSTM单元的RNN流程

本研究使用双曲正切函数作为激活函数,使传送带上的每个元素限制在﹣1~1。然后将其与ot进行Elementwise multiplication得到状态向量,如公式(6)所示。状态向量被向前推进到下一步,也可以成为下一步RNN LSTM的输出。

RNN LSTM模型能处理多个指标输入的非线性时间序列。在本研究中,RNN LSTM被用于输入不同时间尺度下多个水文、气候指标来预测经过多年演化的河流流量。

为了评估RNN LSTM模型中的误差,本研究使用了4个度量,包括均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE和Nash-Sutcliffe效率系数NSE,定义如下:式中:yi为实测流量数据为RNN LSTM预测值;N为训练或测试周期的时间长度,RMSE反映了预测误差的扩散程度。

3 结果和讨论

本研究开发了3种不同时间尺度(日尺度、周尺度和月尺度)的时间序列数据的RNN LSTM模型,每个时间尺度的多维输入模型用于预测和分析倒马关水文站的河流流量。对于多尺度时间序列预测,构建了4层RNN LSTM作为隐层,全链接层作为输出层,并比较了不同时间尺度下RNN LSTM模型的性能。

RNN LSTM模型的多维输入包括:(1)水温、降水、水位、地温、气压、相对湿度、日照时数、风速(输入指标/变量);(2)河流流量或径流(一维输出)。本研究使用这些模型对3种不同时间尺度下的水文、气候或水文气象指标进行短期预测评估。

3.1 每日尺度的RNN LSTM模型

在日尺度的时间序列中,本研究将2006年1月1日至2011年12月31日收集的数据作为训练集,将2012年1月1日至2014年12月31日收集的数据作为预测集。利用时序步长τ(2~20天)对训练阶段的数据进行分组,通过RNN LSTM模型预测。模型对不同时序步长的性能如表1所示(Stepτ表示设置的时序步长为τ天)。

由表1可知,当时序长度τ从2天增加到12天时,训练集NSE从0.84增加到0.88,训练期间RMSE、MAE和MAPE相对降低。同时,预测集NSE从0.70增加到0.74,RMSE、MAE和MAPE在测试期间相对降低。当时序长度从12天增加到20天时,训练集NSE保持在0.87~0.88,RMSE、MAE和MAPE在训练期间相对提高。同时,预测集NSE保持在0.69~0.74,RMSE、MAE和MAPE在预测期间相对提高。事实表明,RNN LSTM将过去12天的信息存储在存储单元中,最能反映信息流量。

表1 日尺度下训练和预测时序步长τ

续表1

3.2 每周尺度的RNN LSTM模型

在每周尺度的时间序列中,本研究将2006年第一周至2011年最后一周收集的数据归为训练集,将2012年第一周至2014年最后一周收集的数据归为预测集。利用时序步长τ(2~15周)对训练过程中的数据进行建模。模型在各时序步长的性能如表2所示。

表2 周尺度下训练和预测时序步长τ

续表2

表2显示,当时间长度τ从2周增加到3周时,训练集NSE从0.61增加到0.96,训练期间RMSE、MAE和MAPE相对降低。同时,预测集NSE从0.51增加到0.55,RMSE、MAE和MAPE在预测期间相对降低。当时间长度从3周增加到15周时,训练集NSE保持在0.65~0.95,RMSE、MAE和MAPE在训练期间相对提高。同时,预测集NSE保持在0.55~﹣4.13,RMSE、MAE和MAPE在测试期间相对提高。这表明,在每周时间尺度下,RNN LSTM将过去3周的信息储存在储存单元中建模效果最好。

3.3 每月尺度的RNN LSTM模型

在每月尺度的时间序列中,本研究将2006年1月至2011年12月的数据归为训练集,将2012年1月至2014年12月的数据归为预测集。利用时序步长τ(2~12个月)建立RNN LSTM模型。模型对各时序步长的性能如表3所示。

表3 月尺度下训练和预测时序步长τ

续表3

表3显示,当时间长度τ从2个月增加到6个月时,训练期间NSE、RMSE、MAE和MAPE保持稳定。同时,预测集NSE从﹣0.44增加到0.52,RMSE、MAE和MAPE在预测期间相对降低。当时间长度从6个月增加到12个月时,训练集NSE保持在0.90~0.98,RMSE、MAE和MAPE在训练期间略有波动。同时,预测集NSE保持在0.52~0.04,RMSE、MAE和MAPE在预测期间相对提高。事实表明,在每月时间尺度下,RNN LSTM反应流量信息的优化储存时间为6个月。月尺度模型性能优于训练期间每日和每周尺度,但预测效果不如每日和每周尺度,因为较粗粒度的数据无法使月尺度模型比周尺度和日尺度模型更能适应时间序列变化。

4 结论

本研究采用多维输入和长短期记忆的预测方法提高预测的准确性。将上述方案应用于大清河—倒马关水文站上游唐河流域,从不同角度分析其水文机制,探索不同时间尺度下的水文模型机理,并对河流流量预测工作提出见解:

(1)通过试验验证得出模型预测效果:在训练期间,月尺度优于周尺度,周尺度优于日尺度;在预测期间,日尺度优于周尺度,周尺度优于月尺度。这说明较粗粒度的数据更难适应时间序列的变化,需要更多的数据集来学习多维输入变量与输出流量之间的长期依赖关系。

(2)本研究搭建了“Next”时间序列模式神经网络,数据在模型内部以滑动窗口的方式训练,每次窗口的滑动都会预测窗口以外未来1天/周/月的河流流量。不同时间尺度的流量预测取得了较好的效果,可以为以后的水文预测工作提供参考,将这种运行模式推广到洪水和干旱预测中。

(3)RNN LSTM的长短期记忆功能揭示了在不同时间尺度下水文过程的产流机制,筛选出每日、每周和每月时间尺度下的最佳储存时间分别为12天、3周和6个月,说明在每种时间尺度下,水文气候要素对河流汇流的滞后效应不同。

猜你喜欢
时间尺度步长水文
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
时间尺度上带超线性中立项的二阶时滞动力方程的振动性
CaputoΔ型分数阶时间尺度Noether 定理1)
继往开来 守正创新——河北省水文工程地质勘查院
交直流混合微电网多时间尺度协同控制
继往开来 守正创新——河北省水文工程地质勘查院
基于随机森林回归的智能手机用步长估计模型
水文
水文水资源管理
时间尺度上完整非保守力学系统的Noether定理