BP神经网络和数值模型相结合的城市内涝预测方法研究

2022-06-07 05:25:56刘媛媛刘业森郑敬伟柴福鑫
水利学报 2022年3期
关键词:内涝积水水文

刘媛媛,刘业森,郑敬伟,柴福鑫,李 敏,穆 杰

(1.中国水利水电科学研究院,北京 100038;2.水利部防洪抗旱减灾工程技术研究中心,北京 100038)

1 研究背景

随着全球气候环境的变化,极端降雨出现的频率越来越高,城市内涝灾害频发[1-2]。随着我国城镇化建设的快速发展,极端降水及其伴生的次生灾害所造成的损失也被成倍放大[3],北京、广州、深圳、武汉等多个城市均发生过较大的内涝灾害[4],2021年7月20日,郑州市遭遇极端大暴雨灾害,暴雨引起地铁、地下隧道雨水倒灌,道路、桥区积水严重,造成了重大人员伤亡和财产损失[5-6]。当前,大暴雨引起的内涝已经成为影响城市运行、居民生活的城市型水灾害。城市内涝防治对保障国家水安全、支撑社会经济可持续发展具有重要的科学价值和战略意义。提前预知、预判、预防城市内涝风险,及时发布预警信息,指导市民生活,保障人民群众生命财产安全,是城市内涝风险管理工作中迫切需要解决的问题[7]。

当前城市内涝风险分析主要采用数值模型,包括水文学模型、水动力学模型,以及水文水动力模型。这些模型各有优缺点:水文学模型计算效率高,但不能计算洪水演进过程;水动力学模型,可以计算网格内的流速、水深等水力要素,但其计算效率较低;水文水动力学模型采用水文模型与二维水动力模型进行耦合,不仅可以保证模型精度又具有良好的计算效率,是洪涝模型研究的热点方向。学者们从水文、水动力学的角度,对地表模型、河道模型以及地下管网模型的耦合机制进行了深入的研究,并取得了丰硕的研究成果[8-9]。黄国如等[10]提出水文水动力耦合模型IHUM(Integrated Hydrology and Hydrodynamics Urban Flood Model),将一维SWMM 模型与二维水动力模型进行耦合;刘家宏、梅超等[11-12]提出通过雨篦子将片区水文模型与排水系统水动力 模型进行耦合;臧文斌[13]从水文学和水动力学两方面研究了模型机理嵌套模拟方法,从地表排水、地表与河道连接两方面研究了模型间耦合机制。这些方法均将基于水文学方法计算的汇水区出口流量过程作为排水管网入流条件,实现了分布式水文模型与水动力模型直接动态双向耦合,可以兼顾模型的精度和计算效率。徐宗学等[14]将水文模型和水动力学模型作为一个整体统筹考虑,对控制方程联立求解,这种耦合模式在机理上最为完善,但联立求解方程组的难度较大。

随着耦合算法的发展以及基础数据质量的提高,水文水动力学模型对城市内涝模拟的精度也越来越高,是当前城市内涝风险的主要分析方法。但随着城市的发展,地表、河道、管网耦合情况越来越复杂,模型的网格尺寸越来越小,网格量巨大,在巨大的网格量上进行十分复杂的计算,会消耗庞大的计算资源。虽然近几年出现了超级计算机等硬件以及GPU 并行计算等技术手段[15-16],数值模拟计算速度有了提升,但是依然无法满足城市防汛应急时效上的需求。因此,有必要寻找一种全新的方法,可以对当前暴雨条件下城市内涝的风险情况进行快速分析,提前预判暴雨内涝风险,及时调度人员物资,降低内涝风险。

近十几年,人工智能(Artificial Intelligence,AI)技术在计算机视觉、自然语言处理、机器翻译、机器人与控制、生物信息等领域已取得长足发展[17]。目前,AI 在气象预报的辅助决策和一些极端灾害的识别上初步获得了成功的应用[18-19],在多个城市的水资源管理、供排水厂的调度等“智慧水务”的应用中也很广泛[20]。卷积神经网络模型(Convolutional Neural Networks,CNN),初步应用在对洪水演进以及道路积水的识别中[21-22],但是该算法对计算机算力及训练样本的要求都很高,推广应用难度较大。

人工神经网络技术离不开大量的高质量数据样本的训练,而实际上,无论是从降雨的场次、还是实测的内涝积水数据,从质量和数量上,都远远不能满足该技术对样本的需求,这就限制了人工神经网络技术在城市内涝风险预测中的有效应用。如何将人工神经网络技术,引入到训练样本数量少、标注数据少的暴雨-内涝场景中,在暴雨样本较少的情况下,快速预测下垫面内涝积水,是个重点关注且亟待解决的问题。另一方面,人工神经网络模型的算法种类繁多,如何从中选择运算速度快、预测准确率高的算法,对暴雨-内涝进行快速预测,也是个需要探索和研究的问题。

反馈式神经网络模型,即BP(Back Propagation)神经网络模型,是最成熟也是应用最为广泛的人工神经网络模型,非常适合解决非线性回归问题。本文将BP 神经网络模型和水文水动力学模型相结合,提出了一种城市内涝风险预测的新方法,并以深圳市河湾流域为例,利用该方法对各积水点的积水过程进行模拟预测。结果表明,该方法的预测结果和实测积水监测数据以及数值模拟结果相比,误差都较小,预测精度高,而且计算速度快,大大缩短了内涝风险预测时间,有效解决了城市内涝预测预警的时效性问题。

2 研究流程和方法

2.1 研究流程 深圳市河湾流域包括深圳河流域和深圳湾流域,是深圳市五大流域之一。河湾流域是深圳市高速发展的典型区域,下垫面硬化程度较高,而排水设施建设相对不够完善,近几年,内涝灾害损失呈上升趋势[23]。经过对历史资料的统计分析,造成深圳河湾流域内涝积水的降雨,主要是发生在3 h 之内的短历时强降雨过程。因此,本文就以深圳河湾流域内3 h 短历时强降雨过程为降雨方案,利用数值模拟模型进行模拟,并以模拟结果作为数据驱动,构建各积水点的神经网络预测模型。最后用没有参与训练的暴雨-内涝样本作为预测样本,利用训练好的神经网络模型对各积水点的积水过程进行预测,以检验神经网络模型的预测效果。具体的技术流程见图1。

图1 技术流程图

2.2 降雨方案 人工神经网络模型的训练样本量越大,包含的信息越多,训练出来的模型越智能[24,31]。因此,本文采用多时空分布、多雨型的降雨过程作为输入降雨条件,通过数值模型模拟,得到多种降雨条件下的降雨-内涝样本。利用这些样本训练出来的人工神经网络模型更智能,可以对各种降雨条件下积水点的积水过程进行预测。

降雨方案主要包括三种来源:①深圳市2008—2018年实际发生的短历时强降雨过程;②根据深圳市降雨时空分布特性设计的降雨过程;③根据深圳市暴雨强度公式构建的设计降雨过程。

(1)实际短历时强降雨方案。通过对深圳市2008—2018年63 个自动气象站,逐5 min 的降雨资料进行分析,筛选出实际发生的降雨持续时间3 h 之内的短时暴雨过程178 场[25]。

(2)不同时空分布特征的降雨方案。刘媛媛[25]等通过对深圳市2008—2018年短历时强降雨时空分布特征进行研究,发现深圳市短历时强降雨时空分布,主要有以下三个特征:①降雨中心自西部快速移动到东南;②降雨中心从东南开始,向西、北部地区扩散;③降雨主要集中在城市的中心区域,降雨中心发生移动的幅度较小。根据该研究成果,本文设计了符合以上三种时空分布特征的、3 h最大单站累积雨量从30 mm 到500 mm 的降雨过程708 场。

(3)根据暴雨强度公式的设计降雨方案。根据深圳市暴雨强度公式[26],本文设计了全市范围普降,3 h 累积雨量从30 mm 到500 mm 的芝加哥雨型的降雨过程,总计236 场。

将以上各降雨方案,利用数值模型进行模拟,共计算了1122 场历时3 h 逐5 min 的降雨方案,得到了40 392 个暴雨-内涝样本。从样本的数量和类型上,满足了神经网络模型对学习样本的要求。训练时,选择其中90%的样本进行训练,10%的样本进行测试。

2.3 城市洪涝模拟模型 本文结合深圳市河湾流域洪涝特点和数据条件,构建水文水动力学模型,包括水文产汇流模型、河道一维水动力学模型,地表产汇流模型以及地下管网模型。这些模型通过耦合计算,详细刻画了城市下垫面内涝积水的演进过程。

2.3.1 河道一维水动力学模型 河湾流域内河道洪水演进,采用显格式有限差分方法的一维水动力学模型方法进行模拟,能很好地处理干床问题,并且方便添加各类水利工程。

构建的一维河网模型,包括河湾流域内25 条河流,1325 个断面、25 座闸坝、22 个蓄滞水体(水库20 宗,滞洪区2 座),建设范围如图2 所示。

图2 一维河网模型建设范围

2.3.2 地表产汇流模型 为了提高计算效率,在河湾流域内的建成区构建二维地表水动力学模型,在非建成区构建水文产汇流模型,具体如图3 所示。

图3 二维水文及水动力产汇流模型计算区域分布图

(1)二维地表水动力学模型。 二维地表水动力学模型采用交错网格法布置状态变量,在网格的形心计算水深,在网格周边的通道上计算单宽流量。在时间上采用交替计算方法,水深与流量在时间轴上分层布置,交替求解,该方法物理意义清晰,且有利于提高计算的稳定性。

建模时,二维地表水动力学模型采用边长5 ~10 m 的不规则网格进行剖分,刻画了立交桥、道路、铁路、桥涵、小区房屋等区域的微地形阻水、导水作用,建设范围内网格共计304 万个,边564 万条,模拟总面积226.76 km2。模型网格布置图如图4 所示,各网格的糙率根据地表形态取值。图4 中,左上角为河湾流域全区,一维河道模型和二维地表水动力学模型耦合位置为图中蓝色河段与相邻网格沿着河道的堤防边。当河道水位高于堤防边或网格内水位高于堤防边时,则有水交换发生,即在耦合位置上产生流量过程;一维河道模型和二维地表水动力学模型计算时间步长分别为6 s、0.1 s。

图4 二维地表网格图

(2)水文产汇流模型。水文产汇流模型选用新安江模型,将流域内非建成区划分为相互独立的水文计算单元,模拟建模区域内的产流、坡面汇流以及河网汇流过程,计算各控制断面流量过程。河网汇流采用滞后演算法,计算公式为:

式中:Q( t )为t 时刻的单元面积河网汇流,m3/s;QT ( t )=QS( t )+QI ( t )+QG ( t ),QT ( t )为t 时刻的单元面积河网总入流,m3/s;QI ( t )为单元面积壤中总入流,m3/s;QG ( t )为单元面积地下总入流,m3/s;t 为河网汇流时间,s;L 为滞后时间,s;CS 为河网水流的消退系数。

选用研究区内水文资料条件较好的景田站及草铺站,2011—2018年的水文资料对模型进行合理性验证。景田站选取了22 场次洪水过程,其中21 场洪水的洪水洪峰模拟误差均在20%以内;草铺站选取了31 场次洪水过程,其中29 场洪水的洪峰模拟误差均在20%以内。

2.3.3 地下管网汇流模型 圣维南方程组结合Preissmann 虚拟窄缝法[27],统一了明流和有压管流的控制方程,建立的地下管网汇流模型,可对自由表面水流和有压流精确计算。其中,

连续方程为:

动量方程为:

式中:无压管流时,Z 为水位,m; 有压管流时,Z 为水头,m;有压流时,B 为虚拟窄缝的宽度,m。

在离散上,采用变量交错布置方式,将管段流量和管段形状定义在管段中心,而水位或测压管水头定义在管段节点上,方便管网间以及管网和水量入口的衔接。对流项采用一阶迎风格式,确保模型有较好的稳定性,可避免产生数值震荡。如此,动量方程在以管段中点为中心的控制体上离散,而相应的连续方程在以节点为中心的控制体上离散,这种方式求解的稳定性强。

本文建立的地下管网模型包括共12.7 万条雨水管段、7 万多个检查井、5 万多个雨篦子、12 座泵站,计算步长为6 s。

2.3.4 模型耦合计算 本文将水文学模型、一维河道模型、二维地表产汇流模型及地下管网模型进行耦合,依据城市立体空间结构以及模型物理机制,进行模拟计算。水文模型与水动力模型耦合时,先独立计算非建成区水文模型,再独立计算水动力模型;水文模型模拟的产汇流结果,分别作为河道一维水动力学模型以及二维地表水动力模型的边界条件。一维河道模型、二维地表产汇流模型及地下管网模型三者之间的水动力学模型耦合采用时间追赶法进行数据交换,涉及了三类耦合:①河道一维模型通过河道堤防与地表二维模型耦合;②管网模型通过管网排水口与河道一维模型耦合;③管网模型通过雨水口、雨水检查井、排水口与地表二维模型耦合等。

该水文水动力学模型具有物理机制,刻画了雨水在城市下垫面中的产、汇流过程。但是,由于模型精细化程度较高,模型计算量巨大,一个3 h 的降雨方案,计算时间都在12 h 以上,这显然不能满足防汛应急工作时效性的要求。

2.4 训练样本生成 在训练神经网络模型之前,本文利用实际的降雨过程,对水文水动力数值模型进行校核,以得到更为准确的训练样本。经校核,数值模型的模拟结果和实测值相比,预测误差较小,可以满足学习样本质量上的要求。由于篇幅所限,本文仅以2018.8.29 深圳大暴雨为例进行说明。选择河湾流域内6 个典型积水点,积水点分布如图5 所示,将其实测最大积水深度数据和模型模拟的最大积水深度进行对比,如表1 所示。

图5 典型积水点分布图

从表1 可以看出,模拟值和实测值相比,平均预测误差为2.92%,满足了神经网络模型学习样本质量上的要求。

表1 2018.8.29 大暴雨内涝积水点实测积水深度和模拟积水深度对比表

本文就利用该数值模拟模型,对以上三类共计1122 场降雨方案进行分析计算,得到40 392 个暴雨-内涝样本,并以此模拟结果作为驱动,构建各积水点的人工神经网络模型。

2.5 BP 神经网络模型 积水点的内涝积水深度,跟降雨条件、积水点的前时序积水情况都相关,属于多影响因素的非线性回归问题。因此,本文选取反馈式神经网络模型,即BP 神经网络模型对积水情况进行训练和预测。

BP 神经网络模型由Rumelhart[28]首次提出的,是目前最成熟也是应用最广泛的神经网络模型之一,只要有足够多的隐含层和隐节点,就可以以任意的精度逼近非线性映射关系[29]。BP 神经网络结构主要分为输入层、隐含层和输出层[30-31],模型结构图如图6 所示。

图6 BP 神经网络模型结构图

如图6 所示,该模型有k 个输入值,s 个隐含层,每个隐含层的神经元分别为n1,n2,…,ns个,输出层有m 个输出值。输入向量为X={x1,x2,…,xk},各层的权值和阈值为ω和b,输出层的输出结果为Y={y1,y2,…,ym},模型的期望输出为模型期望输出O 和Y 之间的误差值Δe。

训练时,输入向量X 通过各层之间权值ω 和阈值b,经过前向传输,一直到输出层,输出结果Y ,并计算期望输出值O 和实际输出值Y 之间的误差值Δe。如果Δe不满足预先设定的收敛值,则进入逆向反馈过程,修改各层之间的权值ω和阈值b,并进行下一次训练;如果Δe满足,则停止训练。神经网络训练的过程,就是不断调整各层之间参数的过程,使得模型的输出结果Y 和期望输出O 之间的误差Δe逐渐减小,直到最终达到预期设定的值。

具体的计算步骤如下[31]:

首先确定网络模型的输入层节点数k、隐含层层数s 及各隐含层节点数ns以及输出层节点数m,初步确定各层之间的权值ωij,隐藏层的阈值bij。

计算输出变量Ok

式中:Ok为输出层第k 个神经元的输出;ns为第s 个隐含层的神经元个数;为第s 个隐含层第i 个神经元的输出;ωik为第s 个隐含层第i 个神经元和输出层第k 个神经元之间的权值;bk为输出层第k 个神经元的阈值。

计算样本的实际输出值和期望输出值的误差Δe( t )。

式中:t 为训练次数;m 为输出层输出向量个数;yk为输出层第k 个神经元的输出;ok为第k 个期望输出。

按正常的训练原则调整网络的权值和阈值,再次进行前馈训练,得到Δe( t+1) 。设e=Δe( t+1) -Δe( t )为前后两次训练输出值与期望值的误差的差值。若Δe >β(β 为神经网络的训练精度),则更新权值和阈值,若Δe <β,则训练结束。

2.6 内涝积水预测模型构建 以图5 中河湾流域内的6 个典型积水点为研究对象,对各点分别建立BP 神经网络模型。积水点各时刻的积水深度主要和该积水点前时序的降雨量和前时序的积水深度有关系。因此,BP 神经网络预测模型考虑的因素包括积水点所在排水区前时序的降雨量Rt和该积水点前时序的积水深度Ht。

本神经网络模型输入层的输入变量为6 个,为前3 个时序的降雨量{ Rt-3,Rt-2,Rt-1} 和该积水点前3 个时序的积水深度{ Ht-3,Ht-2,Ht-1} ,输出变量为1 个,为未来1 个时序的该积水点的积水深度Ht,隐藏层神经元设为20 个。通过模型的不断的循环和训练,以实现对整个降雨过程中,积水深度变化的预测。为了避免各类数据数值区间的差异性,在训练学习之前,对原始数据做归一化处理,公式如下:

式中:x*i为某一类影响因子归一化之后的值;xi为原始数值;为该类影响因素中的最小值;为其中最大值。

训练时,将分别选择暴雨-内涝样本中的90%作为训练样本,以余下的10%作为测试样本。并利用训练好的模型对没有参加模型训练的暴雨过程进行积水预测。最后通过计算预测数据与模拟数据的决定系数R2来判断这两条曲线的相似程度,决定系数R2越接近1,这两条曲线的拟合程度越高,也就是神经网络模型的预测结果和数值模型的预测结果越接近。

3 结果分析

利用训练好的神经网络预测模型分别对基于暴雨强度公式的设计降雨、特征降雨方案以及实际降雨过程进行预测。计算时,设计降雨方案为芝加哥雨型,全区普降;特征降雨的降雨方案为,降雨中心自西向东移动。结果如图7、图8 所示。

图7 基于暴雨强度公式的设计降雨方案模拟结果对比

图8 特征雨型降雨方案模拟结果对比

从图7 和图8 可以看出,对于各积水点,数值模型模拟出来的积水过程和利用BP 神经网络模型预测出来的,拟合误差非常小,决定系数R2都在0.9 以上。图7 是利用基于暴雨强度公式的设计降雨方案进行模拟,全市普降。可以看出,分布在流域内西、中、东部的A—F 6 个积水点的积水深度变化趋势基本相似。图8 是特征设计降雨方案的模拟结果,该方案暴雨中心自西向东移动。图8 中A—F 6 个积水点的积水深度变化反映了这种降雨峰值移动的时空变化的趋势。位于流域西部的A、B积水点,降雨峰值出现早,相应的最大水深出现的就早,而位于流域东部的E、F 积水点,降雨峰值出现的晚,则相应的最大水深出现的就晚。而C、D 积水点,位于流域中部,降雨峰值处于中间,则相应的最大水深也对应的出现在中间时刻。由此可见,本文所建立的洪涝数值模型和基于数值模型结果训练出来的BP 神经网络模型,都反映出了各积水点积水深度变化和降雨时空变化的关系,预测结果和实际情况接近。

由于实测降雨积水监测数据连续性较差,因此仅选择该方法计算的最大积水深度和实际监测的最大积水深度进行对比。利用该模型对没有参与训练的2018年“8·29”暴雨中,各积水点最大积水深度结果进行预测,和实测最大积水深度对比结果见表2。

表2 2018.8.29 大暴雨内涝积水点实测积水深度和模拟积水深度对比表

从表2 可以看出,数值模型模拟的最大积水深度和实测值之间的误差为2.92%,BP 神经网络模型模拟的最大积水深度和实测值之间的误差为3.84%,预测误差增加了0.92%,这主要是由于神经网络模型是在数值模拟结果的基础上训练出来的,预测结果有误差的累积,但是这两种模型之间的误差仅为1.98%。

在预测时效上,BP 神经网络模型计算一个积水点3 h 历时的降雨方案,计算耗时仅为0.01 s,而数值模型计算相同的降雨方案,耗时则需数小时。BP 神经网络模型的计算速度比数值模型提高了数万倍。如果计算网格数量增加,数值模型的计算模拟耗时也随之增加,计算效率无法满足实时模拟需求。本文提出的方法,不仅模拟精度高,而且计算速度快,大大节约了计算时间,可有效满足防汛应急工作需要。

4 结论和展望

本文将洪涝数值模拟模型和人工神经网络相结合,提出了城市内涝积水快速预测的新方法,结果表明,该方法在城市内涝积水预测方面,优势明显,主要表现在:(1)该方法预测的最大积水深度与实测数据相比,平均误差为3.84%,预测精度高;(2)在计算效率方面,该方法的计算速度比数值模型的计算速度提高了十几万倍,计算速度快;(3)该方法将人工神经网络技术和数值模拟模型相结合,为人工智能技术在防洪减灾方向的应用提供了新思路。

该方法以数值模型的计算结果作为训练样本进行训练,有两种模型误差叠加的问题。随着实测降雨-内涝数据日益丰富以及神经网络模型算法的逐渐发展和完善,对样本的数量要求逐渐降低,未来可以实测的暴雨-内涝过程作为驱动,构建神经网络模型,可得到更为客观准确的预测结果。

猜你喜欢
内涝积水水文
2022年《中国水文年报》发布
原来是输卵管积水惹的祸
水文
水文水资源管理
小熊当当玩积水
原来是输卵管积水惹的祸
水文
国外应对城市内涝的智慧:从“驯服”到“巧用”
2011款现代悦动车驾驶人侧地毯有积水
城市内涝的形成与预防
河南科技(2014年1期)2014-02-27 14:04:32