张彩玲 鲁帆 方文 堵传聪
摘 要:為研究蒸发序列非一致性,增强水文频率计算的稳定性,以黄河流域典型三级区蒸发序列为研究对象,以GAMLSS模型为基础,选择黄河流域5个典型水资源三级区,引入时间t作为解释变量进行参数拟合,分析各三级区年、汛期、非汛期蒸发序列的非一致性特征。采用Kendall法进行趋势检验,Mann-Kendall法和5 a滑动T检验法进行突变检验。分析结果表明:①伊洛河、三门峡—小浪底区间、花园口以下干流区间的蒸发序列突变较为明显,大夏河与洮河、湟水蒸发序列的突变存在一定的差异;②5个三级区不同时间尺度的蒸发序列以Generalized Gamma为最优分布的最多,Logistics的最少;③5个三级区不同时间尺度的蒸发序列除部分序列外,均与时间t成负相关,大部分蒸发数据均包含在置信水平为5%和95%的置信区间内,表明不同时间尺度的蒸发序列的GAMLSS模型拟合效果较好;④5个三级区蒸发序列非一致性特征较为明显,以花园口以下干流区间年、非汛期蒸发序列的非一致性特征最为明显。
关键词:GAMLSS;非一致性;蒸发序列;三级区;黄河流域
中图分类号:P333;TV882.1 文献标志码:A
doi:10.3969/j.issn.1000-1379.2021.08.004
引用格式:张彩玲,鲁帆,方文,等.黄河流域典型三级区蒸发序列非一致性分析[J].人民黄河,2021,43(8):19-25.
Abstract: In order to study the inconsistency of evaporation series and increase the certainty of hydrological frequency calculation, this paper took the evaporation series of typical third-level regions in the Yellow River Basin as the research object. Based on the GAMLSS model, it selected five typical water resources third-level regions in the Yellow River Basin, introduced the time t as an explanatory variable to fit the parameters, and analyzed the non-uniform characteristics of the evaporating sequences in the three-stage regions of the year, flood season and non-flood period. The Kendall method was used for trend test and the mutation test was performed by using Mann-kendall and 5-year sliding T method. The results show that: a) the evaporation sequence of the Yiluo River, Sanmenxia-Xiaolangdi reach and the main stream below the Huayuankou is more obvious and the mutations of evaporation sequence of Daxia, Taohe and Huangshui Rivers are different; b) the evaporation sequence at different time scales in the third-level region is the most optimal distribution with the most Generalized Gamma, and the Logistics is the least; c) the evaporation sequence on the different time scales of the five tertiary regions is negatively correlated with the time t except for some sequences. Most of the evaporation data are included in the confidence interval of 5% and 95% confidence level, indicating that the GAMLSS model of the evaporation sequence on different time scales has a better fitting effect; d) the five third-level evaporation sequences are not consistent. The sexual characteristics are more obvious. The non-uniform characteristics of the annual and non-flood season evaporation sequences in the main stream below the Huayuankou are the most obvious.
Key words: GAMLSS; non-stationary; evaporation sequence; tertiary zone; Yellow River Basin
水文频率分析的一个重要前提是水文资料序列具有一致性,属于同一分布。气候变化和人类活动使黄河流域蒸发序列发生了不同程度的变化[1],致其不再满足一致性的假设,基于一致性假设理论的水文频率计算方法不再适用。为进一步反映环境变化对水文频率计算的影响,需要对水文序列进行非一致性分析,这对减小水文频率分析结果的不确定性具有重要意义[2]。国内外专家学者在对水文序列进行计算时会将非一致性假设条件考虑在内[3],并对非一致性假设条件下水文频率的计算模型[4]与方法进行研究[5]。鲁帆等[6-7]利用Metropolis-Hastings算法,将广义极值分布(GEV)模型和广义帕雷托分布(GPD)模型应用于大渡河流域。熊立华等[8-9]引入时变矩模型及基于P-Ⅲ型分布的时变矩模型,对非一致性进行归因分析。但水文序列的计算模型对序列复杂程度和长度有一定要求,各具针对性。而GAMLSS模型包含多个分布函数及相应的程序包,应用范围较广。顾西辉等[10]将GAMLSS模型应用于珠江流域,分析了洪水极值序列的平稳性。张冬冬等[11]将GAMLSS模型应用于大渡河流域,分析了降水频率非一致性。熊斌等[12]应用GAMLSS模型对渭河华县站的枯水频率进行了研究。江聪等[13]采用GAMLSS模型对宜昌站的年平均流量和年最小月流量序列的趋势进行了研究。
笔者选取黄河流域上游、中游、下游共计5个典型水资源三级区的面蒸发序列为研究数据,采用Kendall法检验序列的趋势和显著性,以Mann-Kendall法和滑动T检验法(步长为5)检验序列的突变性[14],采用GAMLSS模型[15]检验序列的非一致性,比较不同统计建模方法的计算结果,以期为后续黄河流域典型水资源三级区蒸发序列的变化规律研究提供理论依据。
1 GAMLSS模型
1.1 模型定义
1.2 评价准则
以最小GD(Global Deviance)值对应的模型为最优模型。AIC(Akaike Information Criterion)和SBC(Schwarz Bayesian Criterion)准则[16]用来判别序列适用一致性还是非一致性模型,若非一致性模型的AIC和SBC值小于一致性模型拟合值,则表明GAMLSS模型更倾向采用非一致性模型对序列进行拟合,序列体现出非一致性特征。
采用概率点据相关系数法,检验正态标准化的残差序列ri是否服从标准正态分布,该方法是由Filliben[17]在1975年提出并广泛应用于统计学中。Filliben值越接近1,则待检验序列越接近标准正态分布。
1.3 分布类型
本文采用Gumbel、Gamma、Logistic、Generalized Gamma四种分布函数,选择一次函数、三次样条函数(cs,自由度分别为1、2、3)、幂次分段多项式函数(bfp,自由度分别为1、2、3)三个函数[18],共7个表达式。以SBC值最小为准则选择最优表达式。
2 研究区域及研究数据
2.1 典型区域选择
黄河流域有29个水资源三级区,根据蒸发情况和气候特征等因素选择了大夏河与洮河、湟水、伊洛河、三门峡—小浪底区间、花园口以下干流区间5个三级区。
大夏河与洮河中,大夏河海拔为2 500 m以上,属寒冷温润气候区,洮河海拔为1 629~4 260 m,属高原气候区;湟水海拔为1 727~4 520 m,属于典型的大陆性季风气候区,其气候垂直变化明显,越向上游蒸发量越小,年平均气温0.6~7.9 ℃;伊洛河是伊河和洛河的简称,伊河属暖温带大陆性季风气候(半湿润)区,洛河海拔为169~2 449 m,属暖温带季风气候区;三门峡—小浪底区间属亚热带和温带过渡地带;花园口以下干流区间属于北温带大陆性季风气候区,年平均气温为14.0~14.3 ℃。
2.2 研究数据分析
本文所用的蒸发皿日蒸发量数据
资料来源于中国气象局气候中心和黄河水利委员会。选用1963—2013年的蒸发皿蒸发数据作为基础数据,研究黄河流域蒸发序列的非一致性演变规律。
基础数据由Matlab处理,GAMLSS模型的计算是基于R软件平台的GAMLSS程序包,在RStudio软件中完成的。
3 计算结果
3.1 趋势及突变检验
采用Kendall法检验大夏河与洮河、湟水、伊洛河、三门峡—小浪底区间和花园口以下干流区间5个三级区年、汛期(6—10月)、非汛期(11—5月)的面蒸发序列的变化趋势。结果显示,5个三级区不同时间尺度上的面蒸发量均呈显著性变化,除大夏河与洮河的蒸发量呈显著增加外,其他4个三级区的蒸发量均呈显著减少状态。
采用Mann-Kendall(M-K)检验法和滑动T检验法(步长为5)检验5个三级区不同时间尺度上蒸发序列的突变情况,见表1。M-K检验法属于定性的突变检验方法,统计量u0.05=1.96;滑动T检验法属于定量的突变检验方法,统计量t0.05=2.31。两种检验方法各有优势[19],所以本文综合考虑来确定突变年份,两种检验方法检验结果一致时以检验结果为准,检验结果不一致时,综合考虑两种检验方法及不同时间尺度蒸发序列的变化特征。检验结果显示,伊洛河、三门峡—小浪底区间、花园口以下干流区间的蒸发序列突变较为明显,突变多发生在2000年左右,而大夏河與洮河、湟水蒸发序列的突变存在一定的差异。大夏河与洮河年蒸发序列在1997年以前一直处于平缓变化状态,于1997年开始进入急剧升高状态;汛期蒸发序列在1965—1981年之间处于升高—平缓变化状态,1995年之后趋于平缓变化状态,于1986年发生低蒸发量区向相对高蒸发量区的突变;非汛期蒸发序列于1995年之前处于平缓变化状态,1995—1998年处于蒸发量减少的状态,以1998年为节点发生急剧增加的变化。湟水年蒸发序列于1973年发生高蒸发量区向相对低蒸发量区的突变;汛期蒸发序列突变不明显;非汛期蒸发序列呈升高—急降—急升—下降的变化状态,于1976年发生突变。
3.2 一致性分析
对5个三级区在不同时间尺度上的蒸发序列采用一致性模型进行拟合,将概率密度函数中的参数设为固定值,根据选取的4种备用分布函数拟合5个三级区的蒸发序列,根据4种备用分布函数计算所得的全局拟合偏差GD值优选各三级区年、汛期、非汛期蒸发序列的分布函数类型,结果见表2。
由表2可看出:对于年蒸发序列,上游的大夏河与洮河、湟水均以Logistics为最优分布,下游的花园口以下干流区间以Generalized Gamma為最优分布,中游的伊洛河以Gumbel为最优分布、三门峡—小浪底区间以Generalized Gamma为最优分布;对于汛期蒸发序列,大夏河与洮河、三门峡—小浪底区间均以Generalized Gamma为最优分布,伊洛河、花园口以下干流区间均以Gumbel为最优分布,湟水以Logistics为最优分布;对于非汛期蒸发序列,除大夏河与洮河以Gumbel为最优分布外,其他4个三级区均以Generalized Gamma为最优分布。总体而言,5个三级区不同时间尺度上的蒸发序列以Generalized Gamma为最优分布的最多,Gumbel次之,Logistics最少。
3.3 非一致性分析
对黄河流域的5个三级区不同时间尺度上的蒸发序列的拟合结果选择适合序列的最优分布函数,采用以时间t为解释变量的非一致性模型,拟合相关参数成果见表3,重现水平拟合成果如图1所示,相关系数成果见表4。
由表3可看出,位置参数与时间t的函数关系种类较多。对于年蒸发序列,除大夏河与洮河、花园口以下干流区间与时间t建立了自由度为3的幂次分段多项式函数外,其他3个三级区均与时间t建立自由度为1~3的三次样条函数;另外,除大夏河与洮河与时间t成正相关关系外,其他4个三级区均与时间t成负相关关系。对于汛期蒸发序列,5个三级区均与时间t成负相关关系;除花园口以下干流区间与时间建立幂次多项式函数,其他4个三级区均与时间t建立了自由度为1~3的三次样条函数关系。对于非汛期蒸发序列,其代表函数比较单一,均与时间t建立了自由度为1~3的三次样条函数,且5个三级区均与时间t成负相关关系。
由图1可看出,除伊洛河的年蒸发量点据有7个数据点位于5%和95%分位数线外,其余三级区蒸发量点据落入5%和95%分位数线外的不多于5个。对于年蒸发量点据,除三门峡—小浪底区间、花园口以下干流区间2个三级区于50%分位数线周围相对较散之外,其他3个三级区均相对较为集中于50%分位数线周围。另外,花园口以下干流区间有5个数据点位于95%分位数线上。对于汛期蒸发序列,除三门峡—小浪底区间的蒸发数据点相对较散之外,其余三级区均相对较集中,重现水平的拟合效果较好。非汛期蒸发序列,5个三级区的拟合效果都相对较好,除大夏河与洮河外,其余三级区均有不多于5个数据点位于95%分位数线上。综合来说,5个三级区大部分蒸发数据均包含在置信水平为5%和95%的置信区间内,仅有极少数数据位于置信区间之外,表明非一致性拟合效果较好。序列拟合图的分位数线为曲线,表明蒸发序列跨度较大,非一致性特征更为明显。
分析蒸发序列的残差序列的分布情况来检验非一致性模型是否合理,对5个三级区蒸发序列的GAMLSS模型进行残差检验。对残差序列进行标准化处理,采用PPCC法对处理后的序列进行检验,计算蒸发序列最优分布残差的前4阶中心矩值及Filliben值,计算结果见表4,不同时间尺度上5个三级区Filliben值在0.926~0.996之间,接近于1,说明残差序列服从标准正态分布。
残差序列正态分布图如图2所示,由最优分布残差序列拟合图可直观看出残差序列的分布情况,5个三级区的正态残差序列均沿红色曲线且分布在理论曲线的上、下限区间内。大夏河与洮河年蒸发序列有4~5个正态残差值点据位于理论曲线下限之下,非汛期有2个正态残差值点据位于理论曲线下限之下;湟水年蒸发序列有1个正态残差值点据位于理论曲线上限之上,汛期蒸发序列有2个点据位于理论曲线之外。其他各蒸发序列均位于理论曲线之内。但综合来看,5个三级区不同时间尺度上的蒸发序列的非一致性模型拟合效果较好。
4 结果分析
5个三级区不同时间尺度上的蒸发序列通过考虑统计参数的非一致性模型和不考虑统计参数的一致性模型的计算,得到两组GD、AIC、SBC值,其拟合效果对比情况见表5。由表5可以看出,5个三级区不同时间尺度的蒸发序列的全局拟合偏差GD、AIC和SBC值拟合效果均比不考虑统计参数非一致性特征的情况下有所改善。
对于年蒸发序列,以SBC值为例,改善效果最明显的三级区是花园口以下干流区间,为44.40,大夏河与洮河改善幅度最小,为7.66,其改善效果明显程度由大到小排序:花园口以下干流区间、三门峡—小浪底区间、伊洛河、湟水、大夏河与洮河。以AIC值为例,改善效果最明显的三级区是花园口以下干流区间,为46.33,大夏河与洮河改善幅度最小,为9.59,其改善效果明显程度由大到小排序:花园口以下干流区间、三门峡—小浪底区间、伊洛河、湟水、大夏河与洮河。
对于汛期蒸发序列,以SBC值为例,改善效果最明显的三级区是伊洛河,为31.24,大夏河与洮河改善幅度最小,为1.43,其改善效果明显程度由大到小排序:伊洛河、花园口以下干流区间、三门峡—小浪底区间、湟水、大夏河与洮河。以AIC值为例,改善效果最明显的三级区是伊洛河,为37.04,大夏河与洮河改善幅度最小,为9.16,其改善效果明显程度由大到小排序:伊洛河、三门峡—小浪底区间、花园口以下干流区间、湟水、大夏河与洮河。
对于非汛期蒸发序列,以SBC值为例,改善效果最明显的三级区是花园口以下干流区间,为43.68,伊洛河改善幅度最小,为5.88,其改善效果明显程度由大到小排序:花园口以下干流区间、湟水、大夏河与洮河、三门峡—小浪底区间、伊洛河。以AIC值为例,改善效果最明显的三级区是花园口以下干流区间,为47.55,伊洛河改善幅度最小,为13.91,其改善效果明显程度由大到小排序:花园口以下干流区间、湟水、大夏河与洮河、三门峡—小浪底区间、伊洛河,其中伊洛河、三门峡—小浪底区间两个三级区的SBC和AIC值非常接近。
总体来说,在考虑统计参数非一致性特征情况下,5个三级区不同时间尺度的蒸发序列的拟合效果具有不同幅度的改善,说明这5个三级区的蒸发序列存在较为明显的非一致性特征。以花园口以下干流区间的年、非汛期的蒸发序列的非一致性特征最为明显,伊洛河汛期的蒸发序列次之,大夏河与洮河的年、汛期蒸发序列相对最差,湟水的汛期蒸发序列、伊洛河的非汛期蒸发序列、三门峡—小浪底区间的非汛期蒸发序列的拟合效果相对次之。
5 结 论
以黃河流域的5个水资源三级区为研究对象,采用Kendall秩次相关法、Mann-Kendall检验法和滑动T检验法,并引入GAMLSS模型,对5个三级区年、汛期、非汛期的蒸发序列进行非一致性研究。主要结论如下。
(1)伊洛河、三门峡—小浪底区间、花园口以下干流区间的蒸发序列突变较为明显,突变多发生在2000年左右;大夏河与洮河、湟水蒸发序列的突变存在一定的差异,大夏河与洮河突变发生在1990年左右,湟水蒸发序列突变发生在1975年左右。
(2)5个三级区不同时间尺度的蒸发序列以Generalized Gamma为最优分布的最多,Gumbel次之,Logistics最少。
(3)5个三级区不同时间尺度上的蒸发序列除部分序列外,均与时间t建立了自由度为1~3的三次样条函数,且与时间t成负相关;大部分蒸发数据均包含在置信水平为5%和95%的置信区间内,仅有极少数数据位于置信区间之外,表明不同时间尺度的蒸发序列的非一致性模型拟合效果较好。
(4)在考虑统计参数非一致性特征情况下,5个三级区不同时间尺度的蒸发序列的拟合效果具有不同幅度的改善,说明这5个三级区的蒸发序列存在较为明显的非一致性特征;以花园口以下干流区间的年、非汛期的蒸发序列的非一致性特征最为明显。
参考文献:
[1] 邱新法,刘昌明,曾燕.黄河流域近40年蒸发皿蒸发量的气候变化特征[J].自然资源学报,2003,18(4):437-442.
[2] 张冬冬.洪水频率分析与预报中的不确定性问题研究[D].北京:中国水利水电科学研究院,2015:44-50.
[3] XIONG L, DU T, XU C Y, et al. Non-Stationary Annual Maximum Flood Frequency Analysis Using the Norming Constants Method to Consider Non-Stationarity in the Annual Daily Flow Series[J]. Water Resources Management, 2015, 29(10):3615-3633.
[4] 鲁帆,肖伟华,严登华,等.非平稳时间序列极值统计模型及其在气候-水文变化研究中的应用综述[J].水利学报, 2017,48(4):379-389.
[5] 严登华,袁喆,王浩,等.水文学确定性和不确定性方法及其集合研究进展[J].水利学报,2013,44(1):73-82.
[6] 鲁帆,严登华.基于广义极值分布和Metropolis-Hastings抽样算法的贝叶斯MCMC洪水频率分析方法[J].水利学报,2013,44(8):942-949.
[7] 鲁帆,宋昕熠,朱奎,等.大渡河流域超阈值降雨样本模拟及不确定性分析[J].人民长江,2016,47(7):23-27,33.
[8] 熊立华,江聪,杜涛,等.变化环境下非一致性水文频率分析研究综述[J].水资源研究,2015,4(4):310-319.
[9] 熊立华,江聪.考虑非一致性的渭河流域设计洪水过程线研究[J].水资源研究,2015,4(2):109-119.
[10] 顾西辉,张强,王宗志.1951—2010年珠江流域洪水极值序列平稳性特征研究[J].自然资源学报,2015,30(5):824-835.
[11] 张冬冬,鲁帆,周翔南,等.基于GAMLSS模型的大渡河流域极值降水非一致性分析[J].水利水电技术,2016,47(5):12-15,20.
[12] 熊斌,熊立华.基于基流退水过程的非一致性枯水频率分析[J].水利学报,2016,47(7):873-883.
[13] 江聪,熊立华.基于GAMLSS模型的宜昌站年径流序列趋势分析[J].地理学报,2012,67(11):1505-1514.
[14] 魏凤英.现代气候统计诊断与预测技术[M].北京:气象出版社,2007:63-71.
[15] RIGBY B A, STASINOPOULOS D M. A Flexible Regression Approach Using GAMLSS in R[R]. London: London Metroditon University,2009:106-112.
[16] MIKIS S, RIGBY R B, CALLIOPE A. Introductions on How to Use the GAMLSS Package in R[J].Chemical Communications, 2018(1): 67-69.
[17] FILLIBEN J J. The Probability Plot Correlation Coefficient Test for Normality[J].Technometrics, 1975, 17(1):111-117.
[18] 张彩玲.变化环境下黄河流域水文非一致性演变规律研究[D].郑州:华北水利水电大学,2018:16-20.
[19] 贾文雄,何元庆,李宗省,等.近50年来河西走廊平原区气候变化的区域特征及突变分析[J].地理科学,2008,28(4):525-531.
【责任编辑 张 帅】