基于神经网络的小型水库洪水预报研究

2023-04-14 03:21熊佳艺江显群高月明
人民珠江 2023年3期
关键词:水文降雨洪水

彭 伟,熊佳艺,江显群,高月明

(1.河海大学,江苏 南京 210098;2.南通河海大学海洋与近海工程研究院,江苏 南通 226300;3.广东华南水电高新技术开发有限公司,广东 广州 510610)

水库是中国防御洪涝灾害广泛采取的工程措施之一,全国约有大小水库9万多座。其中,小型水库数量多、分布广,库容在10万~1 000万m3的小型水库约占水库总数的95%以上[1]。然而,由于建成时间久、运行管理不善、结构设施破损等问题,小型水库成为防洪工作中的薄弱环节。另一方面,洪水预报是防洪减灾过程中非常重要的一项非工程措施,先进、准确的洪水预报体系的研究和应用,将大大提高洪水预测的精度,延长洪水预测时间,为决策争取有效时间,发挥防洪指挥决策的灵敏性和实时性,提高防汛工作的科学性[2]。然而,小型水库常采用的经验公式法预测精度不高,如果采用传统概念性水文预报模型,多数小型水库又缺少足够的工程、地质和水文资料。由此,发展适用于小型水库的洪水预报方法具有良好的应用价值和现实意义。

当前,随着水利信息化快速发展,广东等地区为小型水库配备了水雨情监控设备,采集并积累了大量水文数据,因此可以引入数据驱动模型开展水文预报作业,该方法对水文要素要求相对较低,不需要大量地形和工程资料,对洪水预测有较高的准确率,模型运行速度快且易于实现。人工神经网络(Artificial Neural Networks,ANN)模型是一种典型的数据驱动模型,相较于概念性模型和传统线性模型,在对模拟径流、对降雨和流量进行估计等方面有较好的精度,成为水文预报的一种新途径。Chen等[3]基于长短期记忆神经网络(Long Short Term Memory,LSTM)的深度学习方法建立了预测洞庭湖日水位的模型。Zhang等[4]建立LSTM和门控循环单元(Gated Recurrent Unit,GRU)等4种不同神经网络模型预测模拟联合污水管道水位,验证了LSTM和GRU模型具有较好的多步长时间序列预测能力,可为水文预报提供科学合理的指导借鉴。然而,尽管神经网络方法在水文预报领域应用广泛且取得优异表现,但尝试将神经网络应用于流域控制面积小、汇流时间短、水文资料简单的小型水库洪水预报上的研究尚不多见。

综上所述,本文基于建有水雨情遥测站点、拥有较长时间水雨情观测数据的小型水库,采用多种神经网络方法构建洪水预报模型,并利用遗传算法对神经网络时间步长、隐含层神经元节点参数寻优,提高模型性能。通过对比反向传播神经网络、长短期记忆神经网络和门控循环单元神经网络模型预测结果表现,建立对小型水库洪水预报推广适用性强的神经网络模型。

1 研究方法

1.1 基本理论

a)人工神经网络。人工神经网络(ANN)是一种模拟人类大脑构造与功能的智能模型,由大量神经元彼此相互连接形成,凭借其强大的学习拟合能力,可以在没有明确物理意义的情况下对非线性复杂系统进行建模[5]。

b)反向传播神经网络。反向传播(BP)神经网络,依照误差逆向传播算法进行训练,利用梯度搜索技术实现将网络真实输出值和预期输出值两者之间的均方差误差降至最低的目标[6]。

c)长短期记忆神经网络。长短期记忆(LSTM)神经网络[5]是一种特殊的循环神经网络(Recurrent Neural Network,RNN)。LSTM神经网络在隐含层上存在时间维度上的折叠,拥有记忆功能,能够根据历史信息结合当前输入信息进行预测推断,其内部记忆单元中的遗忘门、输入门和输出门3个“门”结构通过对信息的保留和传递控制,可以存储任意长度的时间信息[7],缓解了RNN中存在的梯度消失或爆炸现象。

d)门控循环单元神经网络。门控循环单元(GRU)神经网络是LSTM神经网络的一种经典变体,其内部思想与LSTM神经网络相似。GRU神经网络的记忆单元结构中,输入门和遗忘门合并成“更新门”,内部记忆单元和隐含层输出合成为“重置门”,与LSTM神经网络记忆单元相比结构更为简单[8]。

e)遗传算法。遗传算法(Genetic Algorithm,GA)基于达尔文的进化论、维茨曼的物种选择学说和孟德尔的遗传学说,通过模拟自然界遗传机制和生物进化论而形成过程搜索最优解[9-10],具有高度的鲁棒性和极佳的全局搜索能力[11]。

1.2 基于遗传算法的神经网络洪水预报模型

洪水过程中库内水位变化主要受降雨和前时段水位、库容影响,为保证预报精度,常采用平均、累计等方法对水文要素进行处理再作为模型输入因子[12]。通过将库容、水位与1、3、6 h累计雨量组合输入模型预测水位变化,发现库容数量级大,相对水位变幅也更大,难以挖掘中小型洪水水位变化非线性特征、拟合水位变化趋势,而长时段累计雨量会放大最大小时降雨影响,降低模型对最大小时降雨的敏感度,预测洪峰偏大且峰现时间延迟。故本文将水库水位和1 h降雨量作为模型的输入因子,通过前期水位和降雨量预测下一时刻水位,并将预测值与同时刻降雨量作为后续模型预测所需的前期数据,利用模型预测值实现连续水位预报功能,将预见期延长至6 h。

神经网络模型性能受网络结构和多个训练参数影响,而这些参数的确定与实际问题复杂程度直接相关,现未有理论指导,大多是依靠试错法对超参数进行优化,该过程需要大量的先验知识,较为复杂且耗时耗力[13]。为实现针对各小型水库构建个性化洪水预报模型,保证良好的洪水预报精度,本文采用遗传算法进行神经网络优化,寻找最优的时间步长和隐含层神经元数量超参数组合,其中时间步长指输入数据的时间长度,其主要过程包括神经网络模型的训练拟合以及遗传算法参数寻优。首先以时间步长和隐含层节点数作为GA中染色体个体,对其初始化赋值,并确定神经网络结构以及其余超参数,完成对整体模型的构建;然后输入训练样本进行模型训练,训练拟合后的模型可以对具有同类型分布特征的样本进行预测;最后以模型对验证集数据预测结果的均方根误差作为GA中的个体适应度值,算法以寻求适应度最小值为目标,使种群通过选择、交叉和变异等操作不断进化,实现对时间步长和隐含层节点参数的寻优。具体计算流程见图1。

图1 神经网络洪水预报模型参数优化流程

1.3 模拟结果评价指标

为分析模型的适用性和洪水预报结果的准确率,根据GB/T 22482—2008《水文情报预报规范》精度评定要求[14],选取以下指标评定模拟结果精度。

1.3.1确定性系数DC

(1)

DC取值范围为(-∞,1],可以用于检验模型模拟结果的优劣。当DC越接近1,表明模拟效果越好,模型可信度高;当DC接近0,表明模拟结果接近实测值平均值水平,总体结果可信,但过程模拟误差大;当DC远小于0,模型不可信。

1.3.2均方根误差RMSE

(2)

均方根误差可用于判断模型预测结果相对于实际测量值的偏离度,当RMSE越接近0,表明两者之间偏差越小,反之则偏差越大。

1.3.3相对误差RE

水文要素预报值减去实测值为预报的绝对误差,绝对误差除以实测值为相对误差,以百分数表示,下文中各洪水过程相对误差由洪水期各时段相对误差取平均值所得。

(3)

1.3.4合格率QR

一次预报误差小于许可误差时为合格预报,规范中许可误差为实测水位变幅的20%。合格预报次数与预报总次数之比的百分数为合格率,表示多次预报总体的精度水平。合格率按式(4)计算:

(4)

式中n——合格预报次数;m——预报总次数。

根据规范要求[11],预报项目的精度按合格率或确定性系数的大小分为3个等级,精度等级见表1。

表1 预报项目精度等级

2 案例分析

2.1 水库概况及数据来源

大冲水库位于广东省罗定市苹塘镇庙前村境内,地理位置为东经111.73°,北纬22.77°,水库坝址以上集雨面积6.23 km2,总库容为188万m3,属西江流域二级支流苹塘河的支流,是一座以防洪灌溉为主的小(1)型水库。本文所采用的水文数据从广东省水利工程动态监管系统中导出,包括水库历史整点水位和每小时累积降雨量。对大冲水库2015年10月至2021年12月监测记录的水文数据进行整编处理,数据集划分比例为25 944∶6 487∶8 065(训练集∶验证集∶测试集)。

2.2 结果与分析

2.2.1模型参数

构建大冲水库BP、LSTM、GRU神经网络洪水预报模型,通过试算确定三者神经网络模型训练次数为300次,批次数为128次,经比选确定激活函数为tanh,优化器为Adam,LSTM和GRU模型学习率为0.000 6,BP模型学习率为默认值。激活函数tanh值域为(-1,1),使输出均值接近0,随机梯度下降趋势更接近自然梯度,可减少迭代次数和训练时间。Adam算法是一种基于梯度的随机优化方法,能够对不同参数计算适应性学习率并且占用较少的存储资源,较其他随机优化方法,Adam算法在实际应用中表现更佳。

遗传算法参数配置为最大迭代次数为50,变异概率0.08,交叉概率0.4,种群大小为20,经寻参确定LSTM神经网络模型时间步长为12,隐含层神经元节点为6,GRU模型采取与LSTM模型同样的参数组合,BP神经网络的隐含层节点为12。

2.2.2模型精度分析

选取验证集中6场洪水、测试集中9场洪水过程以评估模型性能和预测精度,其中模型评价指标确定性系数、合格率和均方根误差由9场洪水预测结果指标取平均值得到,洪水期降雨量、水位变幅和洪峰水位情况见表2。

表2 主要场次洪水情况

从图2可以看到,3种神经网络模型精度均随预见期增加呈下降趋势,验证集和测试集中各模型对应指标变化趋势一致,其中BP模型精度衰减速度最快,RMSE较LSTM和GRU模型涨幅快,6 h预见期下的DC跌至0.5左右,QR低于60%,无法达到预报作业合格水平;LSTM和GRU模型因对时间序列数据有效信息进行筛选,相较于BP模型在各预见期下拥有更佳的预测表现,综合DC和QR指标,可在前3 h预见期内能保持甲、乙级的预测精度,在6 h预见期内也能保持丙级及以上的预测精度。

图2 不同预见期下指标变化曲线

2.2.3洪水误差分析

对表2中的测试集9场洪水预测结果分别进行具体分析,依据各场次洪水过程相对误差、洪峰相对误差以及确定性系数指标,对比BP、LSTM和GRU三者模型的预测表现(表3、4)。

表3 3 h预见期预测结果统计

表4 6 h预见期预测结果统计

预见期为3 h时,预测结果误差大多保持在许可误差范围内,确定性系数结果多数大于0.8,整体预测表现较好。从洪水过程模拟效果看,模型均存在低估洪水过程现象,其中BP模型低估洪水过程现象较严重;观察洪峰模拟效果,BP模型预测精度不佳,相比之下LSTM和GRU模型表达稳定性较好。

预见期延长至6 h,模型精度下降幅度明显,部分预测结果误差超出许可误差范围,确定性系数低于0.7。BP模型最大相对误差为-56.74%,最低确定性系数为0.19,在该预见期下已经无法反映洪水过程,模拟预测效果差。观察洪水过程以及洪峰模拟表现,LSTM和GRU模型差异不显著,两者模拟表现均较好,大部分相对误差能控制在20%范围内,但从确定性系数看,LSTM模型与GRU模型相比精度较优。

LSTM和GRU模型对2019080102、2019082520场次洪水模拟精度较高,这两场洪水降雨量较大,且最大小时降雨处于降雨中后期,降雨与水位间的非线性关系稳定,模型在6 h预见期内能够提供较好的预测结果。洪水量级越小,洪水非线性较强[15],将导致模型对降雨量偏小且水位涨幅不大的洪水模拟效果较差,结合表3、4中确定性系数结果,随预见期延长,GRU模型对各洪水模拟精度差异拉大,预测稳定性不佳,而LSTM模型对各洪水能够保持稳定性高且较好的预测效果。

2.2.4洪水过程线分析

降雨是洪水过程的重要驱动因素,降雨类型会对模型预测结果产生直接影响,为研究3种神经网络模型对不同降雨类型下洪水过程的预测表现,在图3展示了持续性降雨、间断性降雨以及短时强降雨3种典型降雨类型下的洪水过程。在水位上涨过程中,模型预测值较实测值偏低,预见期越长,预测值与实测值之间的偏差越大,以BP模型表现尤为明显,当预见期超过3 h时,BP模型已无法模拟实际水位变化趋势;当水位进入平缓期并到达洪峰水位时,LSTM和GRU模型预测值较实测值偏大,BP模型预测值偏低。通过初步对比,LSTM和GRU模型对实际洪水过程的模拟精度更高。

图3 洪水过程线

进一步对比LSTM模型和GRU模型对实际洪水过程的模拟表现:2019071005场次洪水降雨持续时间较长,降雨量逐渐减小,水位匀速上升,LSTM和GRU模型对该类型降雨下的洪水过程拟合度高,均能较为准确地反映水位变化;2020040500场次洪水降雨过程由2场持续降雨组成,小时降雨量少但持续时间长,LSTM和GRU模型对第一场降雨下的洪峰水位表现出高估现象,对后一水位上涨过程和洪峰模拟表现较好;2020091418场次洪水降雨持续时间短,降雨量峰值明显,水位快速上升,对于该类降雨,GRU模型反应更为灵敏,其预测水位较LSTM模型预测水位偏大且变化趋势更快,在水位上涨阶段,GRU模型预测值更贴近实测值,但水位进入平缓期后,明显偏大的预测值将不利于反映洪峰水位。

得益于独特门控结构对有效信息的捕捉和对长期信息的记忆能力,LSTM和GRU模型较BP模型在6 h预见期内能取得令人较为满意的洪水预报效果。综合模型在洪水过程线图中的表现,GRU模型对应水位过程线存在小范围波动,预测精度稳定性欠佳,而LSTM模型对各降雨类型下洪水过程拟合度更优,较GRU模型更适用于小型水库洪水预报作业。

3 结语

基于神经网络方法构建了小型水库洪水预报模型,利用遗传算法实现时间步长和隐含层神经元节点自动寻参,通过将预测值作为模型输入实现了水位的逐时滚动预报,有效地延长了小型水库洪水预报预见期。通过不同神经网络方法的对比,发现LSTM模型精度衰减速度缓慢且稳定,在3 h预见期内能保持乙级以上预报精度,在6 h预见期内基本能维持丙级以上预报精度。同时,LSTM模型在捕捉水文序列时序和时变特征方面预测精度和可靠性较高,对小型水库适用性强,可以在拥有一定水文累积数据的小型水库中进行推广实践,助力于水利信息化和水库标准安全运行管理。

猜你喜欢
水文降雨洪水
继往开来 守正创新——河北省水文工程地质勘查院
水文
水文水资源管理
洪水时遇到电线低垂或折断该怎么办
又见洪水(外二首)
水文
沧州市2016年“7.19~7.22”与“8.24~8.25”降雨对比研究
红黏土降雨入渗的定量分析
洪水来了
南方降雨不断主因厄尔尼诺