基于不同目标函数GLUE方法参数不确定性研究

2018-02-22 03:59:58温娅惠李致家霍文博张汉辰童冰星

水力发电 2018年11期

温娅惠，李致家，2，霍文博，张汉辰，童冰星

(1.河海大学水文水资源学院，江苏南京 210098；2.河海大学水安全与水科学协同创新中心，江苏南京 210098)

0 引言

水文系统的不确定性主要体现在自然现象、水文数据、模型结构和模型参数4个方面。近年来，水文模型参数的不确定性问题得到了广泛的研究，1992年Beven和Binley提出普适似然不确定性估计方法(Generalized Likelihood Uncertainty Estimation，GLUE)。GLUE方法认为：模型最后模拟结果的好坏由模型参数的综合决定，而不是某一个模型参数所致[1]。1996年，Free等将GLUE方法应用于TOPMODEL模型预报中[2]；1997年，Franks等将GLUE方法应用于SWAT模型中[3]；2009年，卫晓婧等人结合MCMC方法，对GLUE方法进行改进[4]；2010年，刘艳丽等人基于GLUE方法体系分析了大伙房模型参数的不确定性[5]。虽然GLUE方法在流域水文模型的不确定性分析中得到广泛应用，但是在使用GLUE方法优选参数时，对于选择单目标似然函数(确定性系数)的研究较多，而对于多目标似然函数的研究还需进一步发展。GLUE方法选取确定性系数为似然目标时，确定性系数只能描述水文过程的整体拟合特征，会使模拟误差进行累积均化，造成模拟精度虚假增高，却忽略了模型的其他判断标准。比如说，洪峰误差和峰现时间误差，这些特征对于洪水预报都具有重要的参考价值及意义。新安江模型作为我国最重要的流域水文模型之一，已经在洪水预报方面发挥了非常大的作用[6]。传统预报过程中，不管通过人工调参或计算机自动率定，都是得出一组最优参数，得到单一预报结果；又由于新安江模型参数之间具有较强的互补性，而新安江模型内部的产汇流参数又有地区性的特征，因而给预报结果带来很大的不确定性[7]。因此，本文以半湿润的陈河流域研究区域，分别运用以确定性系数为目标函数的单目标GLUE方法和以综合确定性系数、洪峰合格数、峰现时间合格数为似然目标函数的多目标GLUE方法，研究新安江模型参数的不确定性和敏感性以及对两种方法筛选出的参数进行对比。

1 GLUE方法介绍

1.1 GLUE方法原理

GLUE方法基于Bayesian方程和Monte-Carlo随机取样方法。其在预先设定的参数分布取值空间内，利用 Monte-Carlo随机采样方法获取模型的参数值组合，运行模型。选定似然目标函数，计算模型模拟结果与观测值之间的似然函数值，在所有的似然值中，设定一个临界值，对高于临界值的所有参数组似然值重新归一化，按照似然值的大小，求出在某置信度下模型预报的不确定性范围[8]。

1.2 GLUE方法步骤

1.2.1 定义似然判据

本文采用单目标GLUE方法和多目标GLUE方法分析研究。单目标GLUE方法：选择用于反映模拟结果与实测结果吻合程度的确定性系数(Nash系数)作为似然判据。即

(1)

多目标GLUE方法：本文采用综合确定性系数、洪峰合格数、峰现时间合格数三个目标函数。多目标似然函数为

L(M(θI)/Y)=L(L1(θI)，L2(θI)，L3(θI))

(2)

其中：

(1)综合确定性系数

(3)

式中，DYi为第i场洪水的确定性系数；α为平衡因子，表示模拟效果差的洪水对目标函数的影响，本文取4；n为洪水场次数。

(2)洪峰合格数

(4)

式中，l2i为第i场洪水是否合格，合格指洪峰误差控制在20%之内，记为1；不合格指洪峰误差绝对值大于20%，记为0；n为洪水场次数。

(3)峰现时间误差合格数

(5)

式中，l3i为第i场洪水的峰现时间误差是否合格，合格，则峰现时间误差小于3 h，记为1；不合格，则峰现时间误差大于3 h，记为0；n为洪水场次数。

1.2.2 参数先验分布和取值范围确定

在新安江模型中，选择蒸散发折算系数K、自由水蓄水容量SM、地下水出流系数KG、壤中流出水系数KI、地下水消退系数CG、壤中流消退系数CI以及河网水流消退系数CS这7个较为敏感的参数来研究其对模型模拟结果的不确定性。由于对参数缺乏足够的信息和认知的局限性，因此假设参数的先验分布服从均匀分布[9-11]，参数的取值范围见表1。

表1 新安江次洪模型敏感参数取值范围

1.2.3 计算过程

(1)根据Monte-Carlo随机取样方法，对以上的7个参数的取值范围内随机取样，生成10 000组参数组合。

(2)将10 000组参数依次带入到流域的次洪模型中，计算预报流量与实际流量过程的确定性系数，统计洪峰合格数，峰现时间误差合格数，根据单目标函数和多目标函数筛选原则，筛选出符合要求的参数组合。

(3)将筛选出的有效参数组合，带入到需要验证的洪水过程中。最后，将符合要求似然值的模拟流量按大小排序，估算出模型预报的置信区间为90%的不确定性的洪水序列。

(4)似然函数的更新，当有新的实测洪水数据加入计算时，利用之前模拟结果得到的参数组作为本次模拟的先验分布，重新调整参数后验概率分布和不确定性范围。

2 流域介绍与模型率定

陈河流域位于北温带，属于大陆性季风气候[12]。该流域面积为1 350 km2，河长126 km，多年平均降水量700～900 mm，河流水量主要系雨水补给[13]，发生洪水的主要原因是局部暴雨[14-15]。流域平均径流深度100～500 mm，径流系数0.2～0.5，为相对较高产流区。陈河流域上所辖雨量站有两河岔、厚畛子、沙梁子、老水磨、金井、南留、钓鱼台、麦场、板房子、小王涧(见图1)。

本文选择研究的参数有K、SM、KG、KI、CG、CI、CS这7个较为敏感的参数，其他不敏感参数数值(见表2)采用新安江模型的率定值。新安江模型参数率定采用人工优选法和SCE-UA自动优选法结合，计算时段长为1 h。

表2 陈河流域非敏感参数取值

3 参数敏感性分析

确定性系数反映洪水预报过程与实测过程之间的吻合程度，反映总体模拟的拟合好坏；因此，用确定性系数绘制参数与似然值散点分布图，以陈河流域2003090319号洪水计算结果为例，绘制似然函数与散点分布图(图略)。散点图反映了各个参数对模型不确定性的影响程度，体现了各个参数的敏感性。

参数似然值散点分布图清晰地反映了参数值的选取与似然值之间的关系。从散点图分析得，参数K变化平缓且分布比较均匀，说明该参数为非敏感参数，参数K在新安江日模型中为敏感参数，在次洪模型中为非敏感参数；参数SM在(50，200)的范围内有变化，参数SM数值越大，似然值呈偏小趋势，但变化幅度不大，说明参数SM对不确定性有影响但在一定范围内影响不大；参数KG、KI、CG变化平缓，表明他们对不确定性影响不大；参数CI变化也较为平缓，但随着参数值的增大，似然值呈现微弱幅度的增大；参数CS存在明显的高峰区域，在(0，0.2)范围内变化较为平缓，在(0.2，3)范围内变化十分明显，随着参数CS数值的增大，似然值变小，说明CS对不确定性的影响比较显著。

综上所述，将研究的7个参数分为敏感参数(SM、CS)和非敏感参数(K、KG、KI、CG、CI)。

4 计算结果分析与比较

选择陈河流域2003年～2012年的18场洪水对新安江模型参数进行不确定性研究。其中，前14场对参数进行先验分布分析；后4场洪水进行后验分布检验。将随机采样得到的10 000组参数分别代入陈河流域的每一场洪水中进行计算，得到10 000组模拟流量过程和目标函数值。结果发现，与实测流量相比，有些参数组合模拟的较好，有的较差；但流量过程线整体趋势相同。而且，不同的参数组合可以得到相同的模拟过程。这恰恰印证了GLUE方法的中心思想，模型的结果由参数组合决定。

4.1 单目标GLUE方法筛选结果

根据单目标似然函数标准进行筛选，设定似然临界值为0.7，不断更新似然函数，参数组数不断减少。在经过14场洪水演算后筛选得到14个参数组，这些参数组满足了使所有场次洪水的确定性系数均大于0.7，为最优模型参数解的集合。单目标似然函数筛选结果(见表3)。其中，序号中的数值表示筛选的参数组合在随机生成的10 000万参数中的排列序号。

表3 单目标似然函数筛选参数组

图2 单目标GLUE方法后四4场洪水后验分布得到的不确定性范围

将筛选出的14组参数对没有用来更新似然分布的后4场洪水模型进行模拟，将模拟流量按大小排序，估算出90%置信度下新安江模型模拟的不确定性范围。即，用累计似然分布的5%和95%两个分位点作为不确定的上限和下限。陈河流域单目标GLUE方法后4场洪水检验的不确定性范围(见图2)，包括实测值，面平均雨量和90%置信区间范围。

4.2 多目标GLUE方法筛选结果

根据多目标似然函数标准进行筛选，满足综合确定性系数L1(θi)≥(改为：L1(θi)≥；下同)0.8的有297组参数，满足洪峰合格数L2(θi)≥11的有54组参数，满足峰现时间合格数L3(θi)≥11的有82组参数。经过筛选，同时满足这三个似然函数的参数有32组次。表4列出了陈河流域多目标似然函数筛选结果。

表4 多目标似然函数筛选参数组

将筛选出的32组参数对没有用来更新似然分布的后4场洪水模型进行模拟。即，陈河流域多目标GLUE方法后4场洪水后验分布得到的不确定性范围(见图3)。

4.3 分析与比较

将单目标GLUE方法筛选的14组参数和多目标GLUE方法筛选的32组参数进行总和标准化计算，计算公式

(6)

式中，Xij′为总和标准化后的新值；Xij为原始值；i为参数类别；j为参数组号；n为参数组数。

总和标准化图如图4所示。

由图4和表5中可知，参数K、KG、KI、CG、CI取值较为分散，参数SM和CS取值较为集中，同类参数在等效的似然值中的取值不同。这说明模型中每类参数不确定性程度和敏感度存在一定的差异。使用多目标GLUE方法筛选的参数范围都大于单目标GLUE方法筛选的参数，非敏感参数最后固定的取值范围与本文设定的先验分布的取值范围中基本不变，而敏感参数SM和CS取值相较于本文设定的参数先验取值范围，最后筛选出的数值基本上集中在一个小的范围内。值得注意的是，其中敏感参数CS基本在0.01～0.17之间，并没有像其他敏感参数分布那样差距很大；说明CS在模型计算有导向作用。这应该与模型以洪峰和径流深合格为主要评价标准有关，也从侧面反映了CS在对洪峰有主导控制作用。

图3 多目标GLUE方法4场洪水后验分布得到的不确定性范围

图4 参数标准化

单目标GLUE方法和多目标GLUE方法筛选出的参数对后四场洪水进行模拟分析，由图2和图3可知，在高流量区不确定性大，在低流量区不确定性小。统计检验洪水实测流量过程在90%置信区间所占的比例，即覆盖率，计算结果见表6。由表6可知，用于检验的四场洪水，多目标GLUE方法得到的不确定性范围相对于单目标GLUE方法得到的不确定性范围大，且区间覆盖率高，即实测流量被包入置信区间的范围大，预报精度更高，得到的概率预报更具有实践意义。

采用单目标GLUE方法共筛选出14组参数，采用多目标GLUE方法共筛选出32组参数。其中，两种方法筛选出的重复参数组合有7组，参数序号分别为1 584，4 442，6 644，6 886，7 106，7 563，7 989。单目标GLUE方法选择确定性系数为似然目标函数，选定0.7为似然值。即，满足确定性系数大于等于0.7的参数组合才能被筛选出来，确定性系数表示预报过程与实测过程之间的吻合程度，会使模拟误差进行累积均化。另外，对于一个流域，会存在模拟效果较差的洪水，即不同的参数组合都不能使该场洪水确定性系数大于等于0.7，以确定性系数为筛选标准时，则会使筛选出的参数大大减少或者没有。相对于单目标GLUE方法，多目标GLUE方法在选择似然函数时进行了优化，采用综合确定性系数、洪峰合格数、峰现时间合格数为似然目标函数，而且综合确定性系数会通过平衡因子调解模拟效果较差的洪水，平衡因子取值越大，模拟效果差的洪水对综合确定性系数影响更大；另外，洪峰相对误差和峰现时间误差也是半湿润地区非常重要的参考指标。综上，使用多目标GLUE方法筛选参数更合理。

表5 单目标方法和多目标方法筛选参数最大值和最小值

表6 两种方法区间覆盖率计算结果 %

5 结论

以半湿润的陈河流域为研究流域，运用基于单目标GLUE方法和多目标GLUE方法对新安江模型的参数进行的对比分析表明：

(1)在半湿润的陈河流域，可将所研究的7个参数分为不敏感参数(KG、KI、CG、CI、CS)、敏感参数(K、SM)两类。另外，以确定性系数的单目标GLUE方法和以综合确定性系数、洪峰合格数、峰现时间合格数的多目标GLUE方法对参数不确定性进行对比分析讨论的结果表明，多目标GLUE方法比单目标GLUE方法得到的区间覆盖率更大，预报精度更高，有利于下一步的参数以及预报不确定性范围的分析。

(2)实测流量并不能完全包含在90%置信度的流量界限内，说明参数的取值范围还不能覆盖所有的值， GLUE不确定性分析方法还需在实践中进一步完善和推广；另外，还可将该方法与模糊数学结合，并对模型输入不确定性和模型结构不确定性进行研究，构建更全面的不确定性评价体系。