谢克勇 , 张勇平 , 邓德文 , 毕 晨 , 李三角
1. 江西省气象服务中心, 江西 南昌 330096 2. 新余市气象局, 江西 新余 338008
江西全省目前共有水库 10 676 座,其中大型 30 座,中型 263 座,小(Ⅰ)型 1 508 座。这些水库多数坐落在丘陵地带,少数在高山峡谷。黎凤赓和周志维(2018)指出,这些水库对于保障我省粮食安全和饮水安全,发展农村经济,改善农民生产生活条件和生态环境,稳定农村社会秩序等都起到了巨大的作用。随着全球变暖,近年来江西省天气气候极端事件频繁发生,汛情旱情接连不断,特别是2020年气候异常,7月上旬全省平均降雨量259 mm,为历史同期第一(陈娟等,2020;凌婷等,2020)。饶河、信江、修河及鄱阳湖先后多次发生编号洪水和超警戒洪水,多站点水位甚至超保证、超1998年和超历史。水利水电的安全运行、科学调度以及水利枢纽工程防汛、抗旱、发电、蓄水对天气预报服务提出了更高的要求。传统水文气象服务科技含量较低,已不能完全满足水利水电部门的需求(谢克勇等,2021)。因此,提高水利水电气象预报科技含量,提升气象服务水平,丰富气象服务产品,十分迫切。
文中以七一水库为例,利用地形的数字化模拟研究,确定水库集雨区划定技术方法;通过对水库集雨区上降水预报和观测站点的实况两者对比分析,进行库区面雨量本地化订正技术研究,建立水库雨量预报数学模型,并利用频率统计和频率匹配方法进行效果检验;利用水库历史水文观测资料,进行模式参数化率定方法研究以及开展雨洪耦合来水量预报方法研究,建立了水库来水量预报模型。基于此项研究开发了江西省水库安全保障气象服务系统,以期为水库及防汛部门提供更加智能化、精准化和专属化的服务。
选用2007—2020年江西省七一水库的水文数据资料,主要为水位、库容和日均入库流量数据以及气象日雨量等资料。主要研究方法包括基于高精度DEM及水系数据的流域集雨区划分和实况面雨量精确计算方法,基于多种预报模式的降尺度及模式融合的流域面雨量预报方法和基于物理水文模型与人工智能算法相结合的流量预测方法,其中流量预测模型是在新安江模型的基础上自主研发的分布式水文预报模型,输入量为日面雨量和蒸发量,输出量为日入库流量。然后利用2007—2019年数据进行建模,并利用2020年数据对模型预测效果进行对比检验。
基于DEM数据,根据D-8算法可以计算出DEM数据范围内的各个栅格上的水流流向,迭代计算得到每个栅格上的汇流数,设定阈值再经过一系列计算得到河网水系。根据水库大坝位置或者流量监测点的位置,捕捉水系中相应的倾泻点位置,最后划定出七一水库集雨区范围如图1所示。
图1 七一水库集雨区范围
很多学者(邓雪娇等,2000;冀春晓等,2008)提出雷达估计的降雨量不够准确,因此使用雷达—雨量计联合探测的方法,将雨量计单点测量精度较高和雷达能测量降水时空分布的优点结合起来。文中利用雨量计对雷达定量估测降雨量进行面(场)校准,获得比单纯用雷达定量估测降雨量更精确的结果。再利用变分法从时空意义上对雷达观测值进行校准,得到更精确的估测结果。将雷达降水估测和实况站点监测降水等数据进行一系列数据质量控制后,利用卷积神经网络将这些多源数据融合,再匹配到集雨区外延100 km范围生成降水实况分析场。
文中对七一水库进行面雨量预报主要采用多模式融合技术,再进行降尺度得到集雨区格点预报数据。首先通过降尺度方法生成更高分辨率的降雨场,采用DCNN(深度卷积神经网络)模型,再输入地面2 m气温、露点温度、相对湿度、地面气压等气象要素特征,以及DEM、土地利用等地理特征,对低分辨率的降水进行降尺度,最后得到本地预报模型CQOCF。
利用卷积神经网络进行多模式融合,基于算法和近期数据自动调整权重大小,可以根据各模式预报质量进行有效调整权重,最大化准确率。在CNN(卷积神经网络)的卷积层中,一个神经元只与部分邻层神经元连接。根据很多学者经验(毛新宇等,2019;邢世宏等,2019),在CNN的一个卷积层中,通常包含若干个特征映射,每个特征映射由一些矩形排列的神经元组成,同一特征映射的神经元共享权值,这里共享的权值就是卷积核,卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。
为了更加高效、准确地实现降尺度,选择基于深度学习的DeepSD模型。DeepSD模型是由多层的SRCNN堆积而成;SRCNN降尺度则是利用了卷积神经网络提取高维特征并进行数据重构,从而实现降尺度。耿瑞(2019)指出,SRCNN将深度学习与传统稀疏编码之间的关系作为依据,将3层网络划分为图像块提取、非线性映射以及最终的重建。
本地化订正采用Encoder-Decoder神经网络模型,在对降水预报进行订正时,不仅需要考虑到历史数据的影响,也要考虑区域范围的影响。因此,在建模时,需要考虑时间因素和空间因素。考虑到深度学习中的CNN擅长处理空间数据,长短时记忆网络(LSTM)由于其特殊的结构设置擅长处理时序数据,所以利用这两种网络建立订正模型Seq2Seq。Seq2Seq模型的核心是CNN和LSTM,模型由Encoder和Deconder两部分组成,其中Encoder是用来解析历史信息,而Decoder是用来编译历史信息生成订正结果。
对实况和预报的面雨量基于江河流域面雨量等级(GB/T 20486-2017)界定(表1)划分雨量等级后进行对比检验。其中,实况面雨量采用实况分析网格再根据地形与库区范围加权计算,预报面雨量通过本地化预报模型得出,面雨量采用格点数值预报再根据地形降尺度与库区范围加权计算。若某日预报面雨量降水等级为小雨且当日实况面雨量降水等级为小雨,则算作准确,准确率=预报准确天数/实际出现天数×100%。得到2020年七一水库面雨量等级预报准确率(表2)。
表1 面雨量等级界定
表2 2020年七一水库未来1—7 d面雨量等级预报检验结果
分析表2可见,通过对2020年未来1—7 d的面雨量等级预报结果进行检验,得出小雨量级的降水预报准确率较好,未来3 d的平均预报准确率达70.1%。中雨和大雨量级的降水预报准确率分别为30.7%和28.3%。未来3 d各等级降雨预报综合准确率在47.8%—64.4%之间。未来1 d的暴雨、大暴雨预报准确率分别为19.1%和20.0%,未来2 d时效的暴雨、大暴雨预报准确率较低,较难预报。
2020年7月7—10日七一水库逐日面雨量分别为20.2、72.5、64.8和42.1 mm,此次过程连续出现2 d大暴雨,1 d暴雨和1 d大雨量级的降水。分析此次强降雨过程的本地预报模型CQOCF和EC模式预报结果的TS评分(表3)可见,CQOCF在暴雨、大暴雨量级预报上要优于EC模式。
表3 2020年7月7—10日七一水库强降雨过程EC模式和CQOCF本地面雨量模型预报TS评分
分析频率统计和频率匹配效果检验(图2、3)可知,在小雨、暴雨和大暴雨量级上,本地面雨量预报模型CQOCF均优于EC模式,大雨量级上EC略优于CQOCF。分析EC模式和CQOCF本地面雨量模型预报和实况箱须图(图4)可知,本地面雨量模型CQOCF模型雨量值的分布与实况更接近,但存在一些过高值,EC模式较CQOCF预报偏小。
图2 EC模式和CQOCF本地面雨量模型未来7 d预报与实况对比样本频率Fig. 2 Statistical chart of sample frequency of comparison between prediction and actual situation in the next 7 days of EC amd CQOCF
图3 EC模式和CQOCF本地面雨量模型预报概率分布(a)和频率匹配映射关系(b)Fig. 3 Prediction probability distribution (a) and frequency matching mapping (b) of EC model and CQOCF local area rainfall model
图4 EC模式和CQOCF本地面雨量模型预报值和实况值箱须图Fig. 4 Actual forecast box diagram of area rainfall calculated by EC and CQOCF model
目前已经有许多成熟的降雨—径流模型理论,如新安江模型、SWAT模型、Topmodel、HBV模型等,随着深度学习的发展及其在水文领域的应用越来越多,文中利用粒子群算法对新安江模型进行参数率定,并通过刘培贞等(2019)研究的LSTM神经网络模型对流量进行模拟,最后耦合物理水文模型和神经网络模型,以达到流量的最优预测。
物理水文模型中的计算基于对水文过程的描述,机理表达清晰,应用较广泛,且只需要相对少量的历史实况流量资料(2 a以上)就能进行较好的模拟,但物理模型在实际运行中也存在一些难点或问题。物理模型中的一些状态参量的调整常常需要有预热过程,模型的初值设定也对模型结果有一定影响,为了保证模型连续性,需要保存历史状态参量;对物理过程的描述只是对实际水文过程的近似和概化,存在一些没有在物理模型中体现出来的过程;一些物理机制不明确的过程只能用经验公式来描述。
LSTM神经网络流量模型可以实现端到端的流量预测,对于物理模型中未进行描述或近似描述的变量关系也能通过高维特征提取和反向传播自主学习,可以有效弥补物理模型的不足,但神经网络模型需要较多的历史流量资料。结合物理模型和神经网络模型的特点,可以先用物理模型基于现有历史资料进行流量模拟,再用KNN(近邻算法)对物理模型进行校正得到更精确的模拟流量,然后将较长时间的模拟流量和历史实况流量作为LSTM流量模型的标签数据训练模型,实现物理水文模型和人工智能算法的嵌套耦合。
特征向量由一段时间的实况降雨量、蒸发量和模拟流量组成,标签为实测流量与模拟流量的误差,模型公式可表示为
E(t)=FKNN[Qsim(t-1),Qsim(t-2),…,
Qsim(t-n0),P(t-γ1),P(t-γ1-1),
P(t-γ1-2),…,EM(t-γ1),
EM(t-γ1-1),EM(t-γ1-2),…,
EM(t-n1+1),…]
(1)
式中,E(t)为模拟流量和实况的误差;Qsim(t-n)为历史模拟流量;P为历史雨量;EM为历史蒸发量。为了进一步提高模型的预测精度,当有新的实时观测流量数据积累,再对物理模型结果进行更新校正。
水库的库容是水位的三次曲线,因此根据水位和库容的历史资料,用三次曲线进行线性回归,关系式如下
V=a(G-Gmin)3+b(G-Gmin)2+
c(G-Gmin)+Vmin
(2)
式中,V为库容;G为水位;Gmin为水库死水位;Vmin位水库死库容。
当完成水库来水量预报后,根据实时库容增加来水量得到预报库容,然后根据统计关系计算出预报水位。最后可根据正常蓄水位、汛期限制水位、防洪高水位制定调蓄方案(刘志萍等,2020)。
新安江水文模型的15个参数分别为K、WUM、WLM、C、WDM、B、IMP、SM、EX、KG、KSS、KKG、KKSS、CS、L。15个参数作为空间中粒子i的15个维度,X=(Xi1,Xi2,Xi3, …,Xi15),每个维度的搜索空间范围按参数阈值取值(表4)。
表4 新安江水文模型参数搜索阈值界定
速度Vi= (Vi1,Vi2,Vi3, …,Vi14),Vmax限制范围取第d维参数取值范围的10%,Vmax= (Xmax-Xmin)×10%。以日流量的均方根误差为目标函数:
(3)
式中,Xobs,i为率定期的实测流量序列;Xmodel,i为率定期的模拟流量序列;n为实测和模拟流量资料的总个数。
根据翁士创等(2018)的方法,参数率定的具体步骤如下:1) 初始化种群,规模设为60,迭代次数T设为400,确定粒子位置X,速度V;2) 计算每个粒子i的适应值,找出每个粒子的个体极值Pi和粒子的全体极值G;3) 比较粒子i的适应度值和个体极值,较好的作为Pi;4) 比较粒子i的适应度值和全局适应度值,较好的作为G;5) 根据第2—5步更新粒子的速度和位置;6) 回到第2步循环,直到迭代完毕退出。文中利用七一水库历史数据,经过6次参数率定,率定结果如表5所列。
表5 七一水库新安江模型参数率定结果
根据水文情报预报规范(GB/T 22482-2008),采用纳什效率系数(NSE),用以验证水文模型模拟结果的的好坏,NSE适用于长期连续的流量模拟,被广泛地应用到流量模拟地评估中。NSE取值为负无穷至1,NSE接近1,模型可信度越高;NSE接近0,表示模拟结果接近观测值的平均值水平,即总体结果可信,但过程模拟误差大;NSE远远小于0,则模型是不可信的。公式如下
(4)
(5)
式中,y和yi分别为观测流量和模拟流量。
经过计算,在水库入库流量方面,采用粒子群算法率定新安江模型的参数后,率定期(2017—2019年)日流量纳什效率系数(NSE)分别从0.649提升至0.829,均方根误差(RMSE)从17.617 m3/s降低至12.901 m3/s,验证期(2020年)日流量NSE分别从0.499提升至0.681,均方根误差从36.807 m3/s降低至29.802 m3/s(图5)。
图5 2020年七一水库集雨区来水增量预报Fig. 5 Increment forecast of incoming water in rain collecting area of Qiyi reservoir during 2020
文中以七一水库为例,详细介绍了江西省中小水库集雨区划定技术方法和本地化水库面雨量预报方法,进行了模式参数化率定,建立了水库来水量预报模型。得到结论如下
1) 通过对七一水库2020年未来一周面雨量的预报效果检验,得出本地化预报模型未来3 d的平均预报准确率达70.1%;中雨和大雨量级的降水预报准确率分别为30.7%和28.3%;未来3 d各等级降雨预报综合准确率在47.8%—64.4%。未来1 d的暴雨、大暴雨预报准确率分别为19.1%和20.0%,预报时效长于2 d的暴雨、大暴雨预报难度较大。
2) 在水库入库流量方面,采用粒子群算法率定新安江模型的参数后,流量模拟效果大大提升,并且强降水过程的流量预报效果改善明显。
通过技术改进和创新,江西省中小水库安全保障气象服务系统不断完善,水库面雨量和来水增量预报准确率不断提升,提高了水库气象服务科技含量。下一步,将通过积累数据、调整参数、完善系统方面,提高库区面雨量及来水增量的预报准确率。