基于Bootstrap法的水文模型参数不确定分析
——以伊通河流域为例

2016-03-23 03:53宋文博卢文喜董海彪肖传宁吉林大学环境与资源学院长春3006松辽流域水环境科学研究所长春3006
中国农村水利水电 2016年10期
关键词:置信区间水文径流

宋文博,卢文喜,董海彪,张 正,肖传宁(.吉林大学环境与资源学院,长春 3006;.松辽流域水环境科学研究所,长春 3006)

流域水文循环过程及其演化规律通常可以应用流域水文模型进行模拟。为了将复杂的水文过程概念化和抽象化,流域水文模型通常包含大量数学方程和参数用以描述实际流域水文过程和流域特征[1,2]。在确定模型参数的过程中往往由于主观和客观的因素影响而存在着较大的不确定性,这会导致在模拟过程中将会出现“失真”现象,进而导致模型模拟结果的不确定性。水文模型中,参数的不确定性主要来源于2方面。首先,由于下垫面的空间异质性将使参数值存在空间异质性,这进而导致了参数的不确定性[3,4];其次,模型中的参数值常使用观测数据进行率定来确定,但是模型率定获取参数值受到诸多因素的影响,例如参数之间的相互影响、参数的敏感性差异、时间和空间尺度以及模型残差的统计特征[5],这些因素使模型参数值与其真实值“所谓”的等价,导致不确定性问题始终贯穿于整个模型模拟的过程中[6]。因此,需要对参数的不确定性进行现实评估,并正确评价参数的不确定性对模型模拟的不确定性影响程度以及模型模拟结果的不确定性范围。

国内外学者在模型参数不确定分析方面开展了大量研究,很多方法被应用于分析参数的不确定性问题,常用的方法如GLUE方法[9]、马尔科夫链蒙特卡洛方法[10]、贝叶斯方法[11]等。Bootstrap法是一种非参数的统计方法,有别于其他不确定分析方法,它从实际数据出发,不需要对观察数据的分布作任何假设,简单易行,在许多领域都具有广泛的应用。本文运用SWAT模型对伊通河流域的水文过程进行模拟,通过参数敏感性分析,得到模型敏感性参数。与以往不同的是,本文尝试应用Bootstrap法获取模型敏感参数的边缘分布,以95%置信区间对其不确定性范围进行描述,并结合变异系数对参数的不确定性程度进行评估。在此基础上,进一步分析了模型参数的不确定性对模型模拟结果不确定性的贡献。研究成果可以为Bootstrap法运用于模型参数不确定性分析以及SWAT模型在伊通河流域水文模拟应用方面研究提供借鉴与参考。

1 材料与方法

1.1 Bootstrap法

Bootstrap法是由美国Stanford大学统计学教授Efron最早提出的,它是利用再抽样技术来评估不确定性的方法[12]。Bootstrap法通过计算机模拟来替代对偏差、方差和其他统计量的复杂而不精确的近似方法[13,14]。这种方法不必对未知分布做出人为假设,通过对原始数据进行再抽样来获取未知分布。因此Bootstrap法是一种对独立同分布的中小样本进行统计推断,并能在统计信息不充分的条件下提高推断的方法[15]。然而统计数据在很多情况下并不能满足独立同分布,而是存在一定的相依结构,如时间序列数据等,在这种情况下,如果继续应用独立同分布的Bootstrap,则很可能会导致失败。由此衍生出一系列带有相依结构数据的Bootstrap方法,如区间Bootstrap法和基于模型的Bootstrap法[16]。

(1)在ε(t)中进行有放回抽样,获得新的残差系列ε*(t)。

(4)重复步骤(1)-(3),本研究进行再抽样1 000次。

(5)应用Bootstrap法获取 的1 000个Bootstrap估计量(θ*i1,…,θ*i 1 000),确定θi在置信水平α的置信区间[θ*i 1 000(α/2),…,θ*i 1 000(α/2)]。

1.2 SWAT模型

SWAT(Soil and Water Assessment Tool)模型是20世纪90年代由美国农业部农业研究中心(USDA-ARS)在SWRRB[19]基础上开发的基于过程的连续性分布式流域水文模型,它主要用于气候变化和管理措施对流域水文过程和非点源污染物的影响研究[20]。SWAT模型结构上分为水文过程、土壤侵蚀和污染负荷3个子模型[21]。

其中水文过程子模型采用水量平衡原理,表达式为:

(1)

式中:SWt为土壤最终含水量,mm;SW0为土壤前期含水量,mm;Rday为第i天降水量,mm;Qsurf为第i天的地表径流,mm;Ea为第i天的蒸发量,mm;Wseep为第i天存在于土壤剖面地层的渗透量和测流量,mm;Qgw为第i天地下水含量,mm。

在描述地表降水径流时模型采用SCS曲线数法,其表达式为:

(2)

式中:P为一次性降水总量,mm;Q为径流量,m3/s;Iα为产生地表径流前的降雨损失,mm;F为产生地表径流后的降雨损失,mm;S为流域当时的可能最大滞留量,mm。

1.3 研究区概况

伊通河流域面积8 840 km2,地处东经124°30′~125°45′,北纬43°0′~44°45′。伊通河发源于吉林省伊通县,全长342.5 km,多年平均径流总量5.4 亿m3,由南向北贯穿长春市城区,流经伊通县、长春市、德惠市、农安县,在农安县境内的靠山镇附近汇入饮马河后流入第二松花江,流域地理位置见图1。研究区属于中温带大陆性半湿润季风气候类型,年平均气温4.8 ℃,年平均降水量583.5 mm,多集中在6-9月份,占全年降水量的80%以上。研究区包括旱田、水田、林地、草地、水域、城镇6种土地利用类型,以旱田为主。土壤类型有暗棕壤、白浆土、黑土、黑钙土、草甸土、水稻土、新积土、沼泽土、风沙土9种。

图1 伊通河流域地理位置与相关测站分布Fig.1 Watershed location and meteorological stations distribution

1.4 模型数据准备

SWAT模型所需数据由地形、土壤、土地利用、水文和气象数据组成。本研究选用的伊通河流域地形数据来源于分辨率为30 m数字高程模型(DEM)栅格数据;土地利用数据为2008年伊通河流域1∶50万土地利用类型图;土壤数据为吉林省1∶50万土壤类型图矢量化获得;气象数据为2008-2012年的长春、农安、双阳、烟筒山、四平5个气象站的逐日气象资料(包括降水量、最高和最低气温、相对湿度、太阳辐射、风速);本文采用伊通水文站2009-2012年月径流数据进行模型参数的率定与检验。该水文系列包含了流域丰(2010年)、平(2011、2012年)、枯(2009年)水期的径流,具有代表性和可靠性。其中应用2009-2010年月径流数据进行模型参数率定,2011-2012年数据进行验证,数据来源及说明见表1。

表1 数据来源及说明Tab.1 Source of data and instructions

1.5 子流域划分及水文响应单元(HRU)生成

SWAT模型基于流域DEM提取水系,通过设置子流域集水面积阈值和流域出口位置进行子流域的划分和子流域的参数计算。本文设置子流域集水面积阈值为15 km2,并将伊通河流域划分为31个子流域,见图1。在子流域划分的基础上,根据不同的土地利用类型和土壤类型的组合,在每一个子流域内进一步划分水文响应单元(Hydrologic Response Unit,HRU)。HRU的划分是根据不同土地利用类型和土壤类型组合将子流域划分为多个HRUs,为提高计算效率设置土地利用和土壤面积阈值,忽略低于阈值面积的土地利用类型和土壤类型。根据实际情况,本文设置土地利用面积阈值为4%,土壤面积阈值为10%,共划分为495个HURs。

1.6 模型参数的选择

SWAT模型中包含众多参数,但并非所有参数对模型的输出结果都具有显著影响。因此本研究采用LH-OAT(Latin Hypercube-One foctor At a Time)方法进行参数敏感性分析,同时在参考相关研究经验的基础上,筛选出CN2、ESCO、ALPHA_BF、SOL_AWC、SMTMP 5个对模型输出较为敏感的参数进行不确定分析。由于SWAT模型为分布式水文模型,某些参数在不同的子流域上具有不同的参数取值,并需要在各自子流域上单独率定。因此为简化参数的率定过程并提高工作效率,同时保持参数在空间上的分布性,参数以a_、v_集成参数[22](aggregate parameters)的形式进行表示,其中a_表示在给定值域范围内,原值基础上加减这个范围内的值,v_表示用给定值域范围内的值替换原值,各参数表示形式与取值范围见表2。采用SWAT模型自动率定模块中最小二乘法进行模型参数的率定和验证,并应用决定系数R2、Nash-Sutteliffe效率系数Ens和相对误差Re对模拟结果进行评价,当径流模拟值与实测值相对误差在±20%内,Ens>0.5,R2>0.6,则符合SWAT模型模拟要求,可用于流域模拟。

表2 模型参数及取值范围Tab.2 Parameter selection and its scope

2 结果与分析

2.1 模型模拟结果

根据前述模型评价标准,模型月径流量模拟结果良好,见表3和图2。其中率定期R2为0.93,Ens为0.89;验证期R2为0.82,Ens为0.80。相对误差Re率定期与验证期分别为7.21%和10.38%。模型模拟结果符合SWAT模型模拟要求。

表3 模型率定与验证结果Tab.3 model calibration and verification

2.2 参数不确定分析

应用基于模型的Bootstrap法生成1 000组SWAT模型敏感参数的Bootstrap估计值,分别对每个参数1000个自助估计值进行有序排列,并分别以2.5%和97.5%的阈值作为上限和下限,获取敏感参数95%的置信区间。5个敏感参数的95%置信区间以及边缘分布见表4和图3。

表4 参数95%置信区间及变异系数Tab.4

图2 月径流量拟合曲线Fig.2 Monthly runoff fitting curve

图3 参数边缘分布频率直方图Fig.3 Parameters of the marginal distribution frequency histograms

从图3中可以看出,a_CN2.mgt、v_ESCO.hru、v_ALPHA_BF.gw、v_SMTMP.bsn近似服从正态分布,而a_SOL_AWC.sol呈负偏态分布。表4中给出了每一个参数的不确定性范围,CN2在SWAT模型中表示径流曲线数,是土壤渗透性、土地利用和土壤前期含水量的综合反映,是影响径流量的重要参数,其不确定区间为[1.176,2.634]。ESCO在SWAT模型中表示土壤蒸发补偿系数,该参数值越小说明土壤蒸发量越大,其参数不确定区间为[0.343,0.392]。ALPHA_BF为基流系数,反映了地下径流对降水补给的响应,不确定性区间为[0.217,0.353]。SMTMP是雪融最低气温,对寒冷季节融雪具有重要影响,进而影响地表径流,它的不确定性范围为[1.332,2.017]。SOL_AWC为土壤可利用水量,其不确定区间为[0.024,0.080]。从中可以发现在进行bootstrap不确定性分析之后,这些参数的取值范围都较初始的取值范围小。

进一步探讨模型参数的不确定性,本研究采用变异系数Cv值对各个参数的不确定性进行评估。变异系数为标准差与均值的比,是用来描述数据离散程度的指标,变异系数越大,表明数据离散程度越大,即不确定性程度越高[23,24]。由表4可知,a_CN2.mgt、v_ESCO.hru相比于其他参数具有较高不确定性,变异系数分别为21.03%和16.43%,而v_ALPHA_BF.gw、v_SMTMP.bsn、a_SOL_AWC.sol参数不确定性程度较低,变异系数在10%左右。参数按不确定性程度高低进行排序为:a_CN2.mgt>v_ESCO.hru>v_ALPHA_BF.gw>v_SMTMP.bsn>a_SOL_AWC.sol。

2.3 模型模拟不确定分析

参数的不确定性会带来模型模拟结果的不确定性,因此为探究参数的不确定性对模型模拟的不确定性的影响程度,本研究计算了月径流量模拟的95%置信区间。若落入该置信区间的观测值越多,则表明参数的不确定性对模型模拟的不确定性贡献越大,若置信区间内包含的观测值很少,则说明参数的不确定性对模型模拟的不确定性贡献较小。图4是月径流模拟的不确定性范围,对结果进行统计发现58%的观测流量落入到了这个置信区间内。这表明参数的不确定性对模型模拟结果的不确定性具有较大贡献,在所有不确定性因素中占据较大比例。其次,从图4中可以看出,径流量大的月份具有较大不确定性范围,相反径流量小的月份不确定性范围较小,说明模拟结果的不确定性与径流量的大小有关,这与程晓光[25]等人得到的结论一致。同时发现在每年11月份到第2年3月份期间仅8.3%观测流量落入该不确定区间内,表明这段时间内模型参数的不确定性对模型模拟结果的不确定性贡献较小。这段时期伊通河流域正值降雪期,流域内径流主要通过融雪产生。SWAT模型融雪模块是利用温度因子方法来实现[26],然而仅由温度不能作为模拟融雪过程的主导因素[27],这会给模拟结果带来较高的不确定性。因此研究区降雪期模型模拟的不确定性可能主要来自于模型结构的不确定性影响。

图4 研究区2009-2012年月径流模拟的不确定性范围Fig.4 Uncertainty range of monthly runoff simulation in study area from 2009 to 2012

3 结论与建议

(1)Bootstrap法作为一种非参数统计方法,可以在不对模型参数作任何分布假设情况下,通过实测数据来获取模型参数的未知分布,为水文模型参数的不确定分析提供了新的思路。

(2)本文应用Bootstrap法获得了模型5个敏感性参数的边缘分布以及这些参数的不确定性范围,结果表明在进行Bootstrap不确定性分析之后,参数的取值范围都较初始的取值范围小,其中SOL_AWC呈负偏态分布,其余4个参数近似服从正态分布,并通过对参数的变异系数计算,表明CN2和ESCO 2个参数具有较高的不确定性。研究成果说明Bootstrap方法可以运用于水文模型参数的不确定分析研究。

(3)进一步分析了参数的不确定性对模型模拟结果的不确定性贡献,结果表明参数的不确定性对模型模拟的不确定性具有较大贡献。此外计算结果还显示研究区降雪期模型模拟的不确定性受参数的不确定性贡献较小,可能主要受模型结构的不确定性影响,建议进一步对模型结构的不确定性进行分析。

[1] 卫晓婧.流域水文模型不确定性研究进展[J].中国水运,2008,8(7):165-167.

[2] 卫晓婧,熊立华.改进的GLUE方法在水文模型不确定性研究中的应用[J].水利水电快报,2008,29(6):23-25.

[3] 杜新忠.流域水文模型的不确定性分析[D].长沙:长沙理工大学,2011.

[4] 林凯荣,陈晓宏,江 涛,等.基于Beta-PERT分布的水文模型参数不确定性分析[J].中山大学学报(自然科学版),2010,49(4):139-143.

[5] 李向阳.水文模型参数优选及不确定性分析方法研究[D].大连:大连理工大学,2005.

[6] 熊立华,万 民.水文模型两种不确定性研究方法的比较[J].武汉大学学报(工学版),2009,42(2):137-142.

[9] 李 胜,梁忠民.GLUE方法分析新安江模型参数不确定性的应用研究[J].东北水利水电,2006,24(2):31-33,47.

[10] Kanso A,Chebbo G,Tassin B.Application of MCMC-GSA model calibration method to urban runoff quality modeling[J].Reliability Engineering & System Safety,2006,91:1 398-1 405.

[11] K Engeland,Xu C Y ,Gottschalk L.Assessing uncertainties in a conceptual water balance model using Bayesian methodology[J].Hydrological Sciences Journal,2005,50:45-63.

[12] 刘 伟,龙 琼,陈 芳,等.Bootstrap方法的几点思考[J].飞行器测控学报,2007,26(5):78-81.

[13] 邓海军,查亚兵.自助法中若干问题研究及其在命中精度评估中的应用[J].2005,24(1):59-63.

[14] Jhun M,Jeong H C.Application of Bootstrap Methods for Categorical Data Analysis[J].Computational Statistics & Data Analysis,2000,(35):83-91.

[15] 黄 玮,冯蕴雯,吕震宙.基于Bootstrap方法的小子样试验评估方法研究[J].机械科学与技术,2006,25(1):31-35.

[16] 曾 翀.Bootstrap方法的历史发展及其在金融风险管理和药物动力学中的应用[D].武汉:华中科技大学,2009.

[17] Domingo M,Leandro P,Laureano S.Bootstrap confidence regions in multinomial sampling[J].Applied Mathematics and Computation,2004,(155):295-315.

[18] 张金槐.精度评估中的自助方法[J].飞行器测控学报,2000,19(3):61-66.

[19] Arnold,J G,Williams,J R,Nicks,A D,et al. SWRRB: a basin scale simulation model for soil and water resources management[M]. College Station:Tex as A&M Press,1990.

[20] 尹雄锐,章光新,杨 帆,等. 东北半干旱地区流域分布式水文模拟——以洮儿河流域为例[J]. 吉林大学学报(地球科学版),2011,41(1) :137-144.

[21] 汤 洁,杨 巍,李昭阳,等. 辽河大伙房水库汇水区农业非点源污染入库模拟[J]. 吉林大学学报(地球科学版),2012,42(5):1 462-1 468,1 476.

[22] Yang J,Reichert P,Abbaspour K C,et al.Hydrological modelling of the Chaohe basin in China:statistical model formulation and Bayesian inference[J].Journal of Hydrological,2007,(340):167-182.

[23] Francos A, Elorza F J, Bouraoui F, et al. Sensitivity analysis of distributed environmental simulation models: understanding the model behaviour in hydrological studies at the catchment scale [J]. Reliability Engineering and System Safety, 2003,79:205-218.

[24] Zhang zheng,Lu wenxi,Chu haibo,et al. Uncertainty analysis of hydrological model parameters based on the bootstrap method:a case study of the SWAT model applied to the Dongliao River Watershed,Jinlin Province,Northeastern China[J]. Science China,2014,57(1):219-229.

[25] 程晓光,张 静,宫辉力. 半干旱半湿润地区HSPF模型水文模拟及参数不确定性研究[J]. 环境科学学报,2014,34(12):3 179-3 187.

[26] 孟现勇,吉晓楠,刘志辉,等. SWAT模型融雪模块的改进与应用研究[J]. 自然资源学报,2014,29(3):528-539.

[27] Marks D,Kimball J,Tingey D,et al. The sensitivity of snowmelt processes to climate conditions and forest cover during rain-on-snow:a case study of the 1996 Pacific Northwest flood [J]. Hydrological Processes,1998,12(10/11):1 569-1 587.

猜你喜欢
置信区间水文径流
格陵兰岛积雪区地表径流增加研究
定数截尾场合三参数pareto分布参数的最优置信区间
基于SWAT模型的布尔哈通河流域径流模拟研究
继往开来 守正创新——河北省水文工程地质勘查院
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
雅鲁藏布江河川径流变化的季节性规律探索
水文
水文水资源管理
变化环境下岩溶区流域径流变化特征研究