智能水文预报模型的研究与应用

2023-10-17 07:38余宇峰冯胜男邓劲柏
江苏水利 2023年10期
关键词:鸟巢水文时刻

何 健,余宇峰,冯胜男,邓劲柏,李 凯

(1.江苏省水文水资源勘测局,江苏南京 210029;2.河海大学计算机与信息学院,江苏南京 211110)

1 概 述

准确的洪水预报可有效支撑流域洪水预警、调度与防洪减灾,同时对区域规划、灌溉取水、泥沙输移以及其他水文应用等具有重要意义[1-3]。随着信息技术的快速发展,水利行业已经形成了空、天、地一体的水雨情观测资料,如何将在自动控制、图像识别等领域广泛应用的机器学习算法应用于水文预报领域,构建具有物理含义的数据驱动预报模型,提升洪水预报的智能化业务能力和预报精度,成为当前解决水文学难题、推动水文学进步的驱动力[4-8]。

数据驱动洪水预报模型采用决策树和人工神经网络等机器学习算法,对历史水位流量样本进行训练,构建学习机以实现未来某个时刻的水位流量预测,在水文预报研究和应用领域得到广泛应用[9-12]。机器学习与人工智能技术的发展,给智能洪水预报技术的进步提供了新的机遇。长短时记忆网络(long short-term memory,LSTM)模型[13]通过独特的门结构和单元状态记忆长时间信息,能有效提高洪水预报网络的稳定性与可靠性[12-14]。Cui等[14]提出融合新安江XAJ和LSTM的混合预报模型(XAJ-LSTM),将XAJ 模型的洪水预报结果作为LSTM 模型的输入变量,以增强水文建模的物理机制,实现精确的洪水多步提前预报。周研来等[15]提出了长短期记忆神经网络与批量学习、正则化、筛选神经元技术相结合的深度学习网络,以解决变化环境下雨洪过程统计特征的非线性、随机性和时变性问题。Ding 等[16]提出可解释的时空注意力长短期记忆模型,利用注意力机制动态提取洪水过程中的关键特征向量,实现洪水过程的精准预测。

使用机器学习技术建立预报模型在中小河流水文预报研究中取得了一定的进展,SVM、BP 等机器学习模型虽然具有较强的时间序列问题求解能力,但也存在局部最优解且难以从根本上提升预测结果的准确度和可靠性等问题。本文将自适应步长的布谷鸟搜索(ASCS)算法[17]应用于LSTM 神经网络水文模型参数优化中,构建基于ASCS-LSTM的智能预报模型,并采用注意力机制进一步提高输入输出的相关性,实现高精度的智能洪水预测。

2 预测模型

2.1 模型结构

洪水过程成因与传播机理复杂,如何高效识别并提取洪水时空特征信息是理解洪水模式并进行成功预报预警的关键。本文将自适应步长的布谷鸟搜索(ASCS)算法应用于LSTM 神经网络水文模型参数优化中,同时在LSTM时间序列预测中,采用注意力机制对模型输入进行选择性的学习以提升模型输入输出之间的关联,构建基于ASCS-LSTM 的智能水文预测模型如图1所示。

图1 基于ASCS-LSTM的智能水文预测模型

2.2 模型构建

基于ASCS-LSTM 的神经网络水文预测模型包括输入层、隐含层和输出层。输入层以预报断面水位(流量)及对该断面有影响的雨量站雨量信息为自变量,通过数据归一化、训练测试集划分等操作构建模型输入集;输出层对模型预报结果采用反归一化等操作,得到最终输出结果;隐含层包含一个二维结果,其中网络方向包含多个LSTM 网络,能够学习预报断面水文时间序列数据的本质特征,时序方向可以实现前一时刻的信息向下一时刻传递。LSTM 网络的时间记忆单元可以记忆更多有用的水文时空信息,而遗忘门可以将无用的信息进行过滤。

ASCS-LSTM 采用自适应步长布谷鸟搜索算法确定隐含层节点数和学习率参数,模型构建步骤如下:

(1)选择水文时间序列样本数据,对数据进行划分和归一化处理。

(2)采用AM为模型输入分配不同权重,提高输入输出之间的相关性,建立输入输出序列的长距离依赖关系。

(3)初始化LSTM 神经网络的隐含层节点数和学习率参数取值范围。

(4)将水文时间序列训练样本数据输入到LSTM 神经网络模型中进行训练,采用ASCS 算法进行参数寻优。随机产生n个孵化鸟巢位置,每个孵化鸟巢对应一组LSTM 神经网络的参数,将水文流量数据预测的均方根误差作为各孵化鸟巢位置适应度值,确定当前最优孵化鸟巢位置及其适应度值。

(5)保留该组最优孵化鸟巢位置,利用新的莱维飞行机制更新其他孵化鸟巢位置,得到1 组新的孵化鸟巢位置,并计算其位置对应适应度值,依据适应度值采用优胜劣汰策略进行2 组位置更新,得到1组较优孵化鸟巢位置。

(6)按照概率丢弃差的鸟巢位置,用偏好随机游动生成新的鸟巢位置替代已丢弃的鸟巢位置。

(7)比较得到1组较优鸟巢位置,判断当前迭代次数是否符合终止条件,如果能够满足,则使用该最优解作为ASCS-LSTM 模型的结构进行水文流量时间序列的预测,否则返回上述步骤继续对孵化鸟巢位置进行优化。

2.3 模型评估

智能预报模型通过训练历史水文资料去学习构建最优模型,再以该模型预测未来某时刻的水位流量值。因此,本文采用均方根误差、决定系数、平均绝对误差和Nash-Sutcliffe 系数等预测常用的评估标准对模型结果进行评估。均方根误差表示整个数据集的总体性能,决定系数越接近1,说明模型预测性能越好,平均绝对误差代表预测值与实际值之间的偏差,Nash-Sutcliffe 系数与1 的差距越小,模型模拟效果越好,说明预测结果具有较高的可信度,反之则表明模型的预测结果不可信。

3 实验结果与分析

3.1 实验结果分析

3.1.1 研究区域概况

选择长江流域支流秦淮河流域为例进行模型实验和分析。秦淮河位于江苏省西南部,流域面积2 631 km2,具有典型的平原地形。降水主要集中在4—9月,汛期短,滞洪能力弱。本研究分别以秦淮河流域14个雨量站和1个出口断面水文站(东山)2014年5月28日至2019年1月23日的数据验证本模型。

3.1.2 预报因子确定

秦淮河流域属于平原区的中小流域,采用相关系数衡量预报因子与预报目标断面间的相关性。相关系数计算式为

式中:r为相关系数;n为时段总长度;xi为i时刻的监测数据;yi为i时刻对应的预测值;x为序列的平均值;y为序列对应预测值的平均值。

以东山站水位和流域内14 个关联雨量站降水量为预报因子,计算分析得到各测站的相关系数如表1所示。

表1 秦淮河流域各测站相关系数

由表1 可知,天生桥最优相关系数在t-5 时刻,表示东山站(t+1)时刻预报水位与天生桥站t-5~t时刻时段雨量相关,因此,选择该站(t-5)~t时刻的时段降水量数据作为模型的输入。同理可得,东山站t+1时刻的水位预测模型以东山站t时刻水位和(东山站、前垾村站)(t-1)~t时刻、(土桥站)(t-2)~t时刻、(赵村、卧龙山、方便)(t-3)~t时刻、(天生桥、中山)(t-3)~t时刻、(赤山)(t-5)~t时刻、(天王寺、二圣桥、句容水库、句容、北山水库)(t-6)~t时刻雨量数据、未来1 h 的雨量预报数据平均值作为模型的输入。

3.1.3 模型结果分析

(1)不同参数寻优算法对比分析

将PSO、GA、CS 和ASCS 算法分别用于优化LSTM 模型参数,以均方根误差RMSE 作为适应度,LSTM 模型的学习因子范围为[0.001,0.01],隐含层节点数的范围为[150,250]。

PSO 算法的参数配置:种群最大迭代次数为20,粒子数量为20,解的维度为2,惯性参数为0.8,学习因子数值为2,随机数分别为0.6和0.3。

GA算法的参数配置:最大迭代次数为20,变异概率为0.01,交叉概率为0.8,群体大小为20。

CS、ASCS 算法的参数配置:巢穴数量为20,需要寻优的参数个数为2,发现概率为0.25,最大迭代次数为20。

在预见期为6 h 的预测模型中,GA、PSO、CS 和ASCS 分别需要18 次、14 次、13 次和12 次迭代可以获得最优LSTM 模型参数。ASCS 算法步长因子随迭代次数增加不断减小,寻优前期下降速度较快,寻优后期下降速度变慢,使得算法前期收敛时间短,后期步长变化幅度减小,提升了搜索的准确率,可以更快地搜索到最佳解。从结果可知,ASCS算法的搜索速度和全局搜索能力均要优于PSO算法、GA算法和CS 算法,用ASCS 算法对LSTM 网络进行参数优化可以获得较优的LSTM参数。

(2)ASCS-LSTM模型预报结果分析

根据上述实验中获得的最优解,将ASCS 算法中参数解的数量设为20,解的维度设为2,发现概率设为0.25,最大迭代次数设为20;LSTM 神经网络水文模型的隐含层节点数的范围设为150~250,学习因子的范围设为0.001~0.01。并将依据算法确定的预报因子作为输入,ASCS-LSTM模型在预见期分别为2 h、4 h和6 h的预测结果如图2所示(2018年5月28日9:00至2018年6月3日15:00的数据)。

图2 不同预见期的模型预测结果

由图2可知,ASCS-LSTM 模型可以很好地模拟水位涨落趋势,虽然随着预见期的延长,模型预测能力出现一定程度的削弱,但预测过程线整体较平滑,与实测曲线较为接近。此外,ASCS-LSTM 模型在2 个流域内的NSE 和R2值均在85%以上,RMSE、MAE 均取得良好的拟合效果,说明了ASCS-LSTM模型在智能洪水预报应用中的可靠性和适用性。

3.2 不同模型对比分析

为验证ASCS-LSTM 模型的适用性与可靠性,将其与SVM、BP模型在实验流域内的预测结果进行比较,其中3 个模型的输入与上述实验中确定的预报因子保持一致。3 种模型预见期6 h 的预测结果对比如图3所示。

图3 不同模型的预测结果对比

根据RMSE、MAE、NSE等评价指标,对3种预测模型的不同预见期进行误差比较,结果表明,ASCSLSTM 模型的评价指标均优于其他模型,表明该算法具有较高的精度。

4 结 语

针对传统机器学习模型存在局部最优解且难以从根本上提升预测结果的准确度和可靠性等问题,本文将自适应步长的布谷鸟搜索算法应用于LSTM 神经网络水文模型参数优化中,并采用注意力机制进一步提高输入、输出的相关性,构建ASCS-LSTM模型,实现高精度的智能洪水预测。将上述模型应用于秦淮河流域的水位预测并进行比较分析。实验结果表明,本文所构建的模型在一定程度取得比SVM 和BP 等模型更好的预报效果,具有良好的应用价值。今后可着手将气象、蒸发量等特征因素作为预报因子,进一步提高预报模型的准确性,并探索将洪水过程的物理含义融入到深度学习模型的构建过程中,提升模型的可解释性。

猜你喜欢
鸟巢水文时刻
冬“傲”时刻
继往开来 守正创新——河北省水文工程地质勘查院
捕猎时刻
水文
水文水资源管理
鸟巢
重回鸟巢
鸟巢大作战
水文
一天的时刻