基于参数不确定性的概率预报研究

2017-05-30 10:48:04赵信峰徐鹏刘开磊赵丽霞徐十锋郏建

人民黄河 2017年9期

赵信峰　徐鹏　刘开磊　赵丽霞　徐十锋　郏建

摘要：水文模型参数的选取通常依靠经验判断或者依赖历史库中的不完备数据集进行自动优选，所选参数并不一定能够准确反映流域降雨径流特点，更不足以反映不同洪水涨落阶段洪水特征的变化。基于水文模型参数存在显著不确定性的客观事实，以随机参数驱动水文模型，并结合数值模型实现概率预报。通过东湾流域36场洪水模拟试验，揭示了水文参数不确定性对洪水预报结果的显著影响，提出的概率预报算法能够给出精确、可靠的预报结果，说明该算法能够降低水文模型参数所带来的洪水预报不确定性。

关键词：洪水预报；新安江模型；参数不确定性；概率分布；概率预报

受参数不确定性影响，洪水预报模型往往难以达到足够的精度，在实际洪水预报中基于传统的洪水预报模型得到的预报结果，其不确定性程度较高，难以据此作出合适的防汛调度决策，在实际应用中往往通过校正或概率预报的方式来降低洪水预报的不确定性。本研究从模型参数存在不确定性的客观现实出发，分析参数的概率分布特征以生成随机参数簇，驱动洪水预报模型产生初始预报解集，采用适合的方法对预报结果进行综合，得到概率预报结果。

1模型介绍

1.1新安江模型及其参数

新安江模型是1983年由河海大学赵人俊教授带领水文预报教研室研制，并逐步完善起来的流域产汇流模型。该模型在国内水文预报中得到广泛应用，并在国际水文学研究中取得有价值的成果。

新安江模型是典型的概念性模型，由蒸散发、产流、分水源和汇流4个模块组成。模型参数较多，一般需要根据优化目标函数对参数的敏感性，将参数划分为敏感、不敏感、区域敏感三类。对不敏感参数一般取经验值，不参与优选；对于敏感或区域敏感参数，则需要充分考虑参数水文特性，采用客观优选或SCE-UA等自动优化方法确定参数值。

河网蓄水消退系数CS常被归为敏感参数，对洪水预报结果的影响较大，目前针对其水文特性及统计规律的研究较多，成果也较为丰富。根据李致家在沙埠流域对CS参数规律的研究成果可知，CS是时段长度和线性水库的蓄泄系数的函数，反映流域汇流特性及线性水库的时问尺度变化。陆曼皎尝试通过蓄泄系数参数规律来间接推求CS值，其模拟试验在皖南山区面积为100-3 000 km2的13个流域进行，结果表明地理因子公式推求得到CS的方法具有一定的可操作性，同时验证了计算步长、时段内人流分布可能带来的参数不确定性。

1，2 BMA模型

BMA（Bayesian Model Averaging）是基于多预报序列的先验信息进行模型综合的数值模型。DUAN等在美国3个水文站进行模拟试验，研究BMA方法的集合预报性能，其研究表明BMA对降低洪水预报结果的不确定性程度效果显著。BMA模型依赖较长系列预报结果进行模型训练，进而根据各个时刻的初始（先验）预报结果估计预报变量的后验概率特征，生成概率预报以及均值、中位数形式的确定性预报结果。

在采用BMA模型进行集合预报时，无须关注各模型中哪个是最优模型，也無须要求各模型均能够提供高精度的预报结果，只须提供序列足够长的资料以进行BMA模型训练。因此，在实际使用中，BMA模型能够避免因对最优模型的判断不准而带来的不确定性，避免产生较差的预报结果，同时能够提供较为可靠的预报变量概率分布描述。

2基于参数不确定性的概率预报算法

实际上，BMA模型的先验信息并不局限于多模型预报结果，只要给出多个时间序列的原始预报数据及相应的实测序列，BMA就可以正常执行运算。考虑到在执行实时洪水预报时，最优参数并不能提前预知，因此可以依据参数的先验概率分布特征，随机给出某参数多个可能的值，以驱动水文模型产生相应多个预报结果。在BMA框架下，把随机参数所产生的多个预报结果视作BMA的集合预报成员，以基于以上各参数模拟历史场次洪水的计算结果作为先验信息，进行BMA模型训练；进而，以BMA模型综合当前洪水的多个预报结果，得到在考虑参数不确定性的情境下，预报变量的概率分布的描述。其中，随机生成的该参数的多个可能值被统一称为参数簇。

根据以上思路，以新安江模型为例，考虑其参数CS的不确定性，采用如下步骤构建基于参数不确定性的概率预报算法（简称PROP）。

（1）获取参数的先验概率分布。根据经验，选择以新安江模型的参数CS为例，考察该参数在历史各场洪水中的数值变化特征，考察各常见分布类型在描述CS的概率分布中的适用性。选出合适的分布类型之后，计算分布函数的参数，获取CS的先验概率分布。

（2）随机生成参数簇。根据CS的先验概率分布特征，随机生成维度为Ⅳ的参数簇。

（3）构建预报信息库。基于以上N个参数，分别驱动新安江模型模拟所有场次的历史洪水，计算得到各场洪水的次模模拟结果。在实时洪水预报中，步骤（2）中得到的参数簇可以在洪水预报之前生成，以降低运算量，保证实时性；这里提到的“历史洪水”应当变成“当前场次以前的历史洪水”。

（4）训练BMA模型。根据成员数为N的历史洪水预报结果的集合，训练BMA模型参数。受限于篇幅，此处不对相关技术细节作详细描述，可在参考文献[7]中查阅。

（5）生成预报变量后验概率分布。设后验分布的采样数目为L，然后将当前的N个预报结果代入训练好的BMA模型中，基于蒙特卡罗采样方法生成成员数为L的预报变量的解集。当L值足够大时，该解集与预报变量的后验概率分布相似，可以认为该解集的分布情况反映了预报变量的后验概率分布特征，解集的均值可以视作预报变量的期望值。

在PROP算法中，模型参数的最优值无须提前预知，因此该算法能够避免洪水预报中不合理的参数对预报结果的负面影响。该算法仅依靠比较成熟、单一的新安江模型即可实现集合预报，无须引进其他模型，算法的实现简便。该算法能够提供变量的后验概率分布及期望值等信息，比传统水文模型的信息更丰富，能够为防汛决策提供更多有价值的支持信息。

3试验流域及数据介绍

3.1流域概况

本研究所选试验流域为东湾流域（见图1），位于东经111°-112°、北纬33.0°-34.5°之间的伊河河源地区，流域面积为2 856 km2。流域地势西高东低，上游林地面积大，属大陆性季风气候区。降水量的年内分布极不均匀，每年7-9月降水量占年降水量的一半以上。年降水量随高程增加而递增，山地为多雨区，河谷及附近丘陵为少雨区。降水年际变化较大，最大年降水量为最小年降水量的2倍左右。

3.2流域数据

本研究选择东湾流域1962-2011年36场洪水用于数值模拟试验。模型参数率定中，采用先优化日模参数，再模拟出各场次洪水初始时刻的流域土壤饱和程度，然后排列出敏感次模参数的顺序。由于本研究所关注的是参数的不确定性程度及基于参数不确定性的相关理论方法，每场洪水的最优参数值不同，这就需要知道各场洪水中的最優参数值，因此每场洪水都需要优化得到一个最优参数值。

根据《水文情报预报规范》（GB/T 22482-2008），本研究中涉及的洪水预报精度评定，均采用NSE（Nash-Sutcliffe Efficiency Coefficient）指标作为评价依据。以每场洪水的最优参数为依据，分别执行预报并计算NSE指标值。统计结果显示，所选各场洪水均达到丙级以上精度，其中乙级以上32场，甲级以上11场，说明新安江模型在东湾流域适用性好，本研究的成果对于推进新安江模型在该流域及相似流域的应用具有一定的参考价值。

4参数CS的先验概率分布

本研究采用SCE-UA算法。分别对每场洪水进行参数率定，以获取CS在每场洪水的最优值。计算率定得到36个CS参数值的累计概率值，并应用常见的Beta、Gamma、Laplace、Logistic、P-Ⅲ、Weibull（两参数）、对数正态、正态、指数分布共9种分布函数对CS值的统计概率分布点进行拟合。拟合情况见图2，图中横坐标表示直接统计最优CS值的频率；纵坐标表示相应CS值在不同分布类型中的频率估计值；NSE为拟合确定性系数，其数值范围为（-∞，1]，数值越大，则拟合度越高，相应的分布函数越适合于描述最优CS值的概率分布特征。

从图2可以看出，所选9个分布函数的确定性系数值均在0.9以上，各分布函数对最优CS值的拟合度均较高。Beta、P-Ⅲ相对于其他分布函数表现更优，然而P-Ⅲ分布对较大CS值的拟合效果较差，因而可以认为Beta分布是这9个分布函数中最好的，适合于描述不同场次洪水中最优CS值的概率分布特征。在确定参数CS所服从分布类型之后，记录其分布函数的各项参数值，随机生成50组（L=50）不同的CS参数。

5原始预报集合的获得

将随机生成的50组参数分别代入新安江模型，独立地对所选历史洪水进行模拟计算，可以获得集合预报成员数为50的预报值序列，然后结合对应的实测数据对BMA模型进行训练。针对每场洪水，利用训练好的BMA模型综合50个原始预报结果进行集合预报运算。图3、图4分别展示了实测一原始预报一PROP均值预报流量过程比较、PROP概率预报流量过程。限于篇幅，在图3、图4中将36场洪水彼此首尾相连，绘制在同一张图上。由于图中相邻两时刻的时间跨度可能比较大，因此该洪水过程并不代表1962-2011年完整的流量过程，仅用于说明各集合预报成员及PROP在这36场洪水中的表现。

从图3可以看到，基于随机参数所构建的各集合预报成员，模拟得到的流量过程的总体趋势与实测的相差不大，但是仍然可见大量的原始预报结果偏离实测值。各集合预报成员所选CS参数值不同，是各自预报结果之间产生显著差异的唯一原因。这进一步印证了参数不确定性的存在会导致预报结果显著发散的现象，也强调了参数不确定性是水文预报中必须考虑的一个重要因素。PROP算法均值预报结果与实测流量结果的总体变化趋势一致，说明基于PROP方法进行洪水预报时，其确定性预报结果更为稳定、可靠，且无须事先进行参数率定，因而可以避免参数不确定性导致的计算精度降低。

6概率预报结果的获得与分析

概率预报时常采用90%置信区问来表征预报变量的概率分布情况，置信区间中的实测点占全部实测点的比例（即覆盖率CR）被认为能够反映概率预报结果的可靠性。CR的取值范围为[0，1]，CR值越大，实测点落在置信区问内的比例越大，依据概率预报结果漏报的可能性越小。

从图4可以看出，PROP所提供的90%置信区间基本上能够将实测值包含在内，CR值达到93.0%。PROP算法的洪峰预报结果可靠性高，所选36场洪水中有31场的实测洪峰落在概率预报的置信区间之内，例如在1975年大洪水中，实测洪峰流量为4 200 m3/s，对应的PROP预报90%上、下限分别为4 430 ma/s与490 m3/s。综合PROP的概率预报结果对整体与洪峰附近洪水过程的匹配程度，可以认为该模型所获得的概率预报结果较为可靠。

7结论

本研究基于水文模型的参数存在显著不确定性的客观事实，以随机生成的参数驱动水文模型，并结合数值模型构建PROP算法实现集合预报。通过东湾流域36场洪水模拟试验，揭示了水文模型参数不确定性对洪水预报结果的显著影响，并验证了PROP所提供的确定性及概率预报结果的精确性、可靠性，证明PROP能够降低水文模型参数所带来的洪水预报不确定性。

在实际洪水预报中，参数的优选往往依靠经验判断或者依赖历史库中的不完备数据集进行自动优化，然而由于洪水特征无法准确预知，甚至在一场洪水不同阶段所要求参数的值也存在较大差异，因此所选参数并不一定适合当前洪水的预报。PROP算法为考虑参数不确定性的条件下实现准确的洪水预报问题，提供了一个可靠的解决方案。该算法强化了对参数概率分布特征的描述，弱化了对求解最优参数值的要求，降低了参数不确定性导致较差预报结果的可能性：依赖现有较为成熟的BMA模型，为洪水预报工作提供更为丰富、可靠的预报信息，对于完善并提高现有的洪水预报技术具有参考价值。

然而也需要看到，本研究所采用的参数仅仅针对单一的参数CS，实际洪水预报中往往有多个参数存在明显不确定性，如何准确描述多参数的联合概率分布，以及如何在洪水预报中同时考虑多参数不确定性的影响，将是一个有价值的研究方向。