王晶 王双银
摘 要:研究短历时暴雨频率分布可为小流域暴雨分析计算提供科学依据,对城市排涝和山洪灾害防治具有重要意义。以陕西省泾河和渭河流域39个气象站1981—2017年8个统计时段年最大值暴雨序列为基础,以概率点据相关系数法(PPCC)和拟优绝对值准则法(MAE)为评价标准,结合计算暴雨量与实测暴雨量相关图,以皮尔逊-Ⅲ型分布、指数分布、正态分布、广义极值分布、广义帕累托分布和耿贝尔分布为备选频率分布对陕西省泾河和渭河流域短历时暴雨频率分布进行研究,同时对矩法、线性矩法和极大似然法3种参数估算方法进行对比分析。结果表明:各频率分布采用线性矩法估算参数后的计算值与实测值之间误差最小,表现出了很好的适用性,是频率分布参数估算的最佳方法;PPCC法相较于MAE法的最优频率分布集中,在区域频率分布选择时适用性更强;广义极值分布为最优分布的暴雨序列数和气象站点数均远多于其他分布,表现出明显优势,可作为陕西省泾河和渭河流域短历时暴雨频率计算的理论频率分布。
关键词:频率分布;短历时暴雨;参数估算;陕西省泾、渭河流域
中图分类号:P333.2 文献标志码:A
doi:10.3969/j.issn.1000-1379.2020.07.003
Abstract:Studying on frequency distribution of short-duration rainstorm can provide scientific basis to small watershed rainstorm analysis and is also important to urban drainage and mountain flood disaster control. Based on eight series of the annual maximum rainstorm from 39 meteorological stations in Jinghe and Weihe basin, Shaanxi Province over 1981 to 2017, this paper analyzed the applicability of P-Ⅲ distribution, exponential distribution, normal distribution, generalized extreme value distribution, generalized Pareto distribution and Gumbel distribution, and their parameters assessed by combining the probability point correlation coefficient, mean absolute error and Q-Q methods, and the three parameter estimation methods including MOM, LM and MLE methods were also compared. The results show that the error between calculated and observed values of LM method are the smallest, suggesting that it may be the best method to parameter estimation; the optimal frequency distribution of PPCC method is more concentrated than that of MAE method, suggesting that it is more suitable for selection of regional frequency distribution; and the GEV distribution has obvious advantage in number of both rainstorm sequences and stations, indicating that it is optimal theoretical frequency distribution for short-duration rainstorm in Jinghe and Weihe basins of Shaanxi Province.
Key words: frequency distribution; short-duration rainstorm; parameter estimation; Jinghe and Weihe Basins of Shaanxi Province
短歷时暴雨极易导致城市内涝和山洪灾害的发生,威胁着区域生态环境和人民的生命财产安全,对区域经济社会的持续发展造成严重影响。研究短历时暴雨的频率分布,可为城镇排水工程设计、小流域山洪灾害防治和沟道综合治理等提供设计依据,是合理确定工程规模和预警预报措施的基础,对防治暴雨洪水灾害具有重要意义。
对频率分布的研究有两派,一派以结合水文现象的物理成因和概率论的有关定理为准则(如耿贝尔分布、对数正态分布等);另一派则以分布曲线与实测资料拟合最佳为准[1]。由于水文现象受气象和地理等多种因素的综合影响,有着错综复杂的成因过程,因此很难满足统计学中的有关定理要求。目前应用最为广泛的是结合频率分布曲线统计特点,以实测资料为基础,通过估计的频率分布参数计算的“理论”值与实测值的误差,在一定拟合优度准则下对不同频率分布进行比较,以符合大多数水文系列的频率分布作为“理论”频率分布。我国很多学者研究了单个测站的暴雨频率分布,发现常用的皮尔逊-Ⅲ型分布(P-Ⅲ)[2-4]、指数分布(EXP)[5]、广义极值分布(GEV)[6-7]、广义帕累托分布(GP)[8-9]和耿贝尔分布(GUM)[2,10]都有较好的适用性;也有学者针对区域进行过研究[4,11],但依据的站点偏少或区域气候分带比较明显,得出的结论可能存在一定的偶然性。
频率分布参数的估计方法有两大类,一类是以实测资料的矩为基础的估计方法,如矩法[12]、线性矩法[11-13]、概率权重矩法[14]、权函数法[15]等,这类方法简单实用;而另一类是以极大似然原理为基础的极大似然法,在理论上被认为是最好的参数估算方法[16],但计算过程复杂,有时候会出现似然方程无解,得不到参数的情况。近年来也有学者将群居蜘蛛优化算法[17]、模拟退火法[18]等智能优化算法用于频率分布参数估计中,这类方法在计算频率分布参数时优化函数多,需要编写相应的计算程序才能实现,在水文分析中还未能广泛应用。
笔者以正态分布(NORM)和上述常用频率分布为备选分布对陕西省泾河和渭河流域短历时暴雨频率分布进行研究,以期为该区域的设计暴雨计算提供依据。人 民 黄 河 2020年第7期
1 研究区域概况
陕西省泾河和渭河流域介于东经106°19′—110°15′和北纬33°41′—35°31′之间,属内陆性季风气候区,暖温带半湿润半干旱气候带,四季分明,雨热同期。渭河干流以北多为树状水系,以南多为羽状水系。区域内地势南北高中部低,西部高东部低,是一个三面环山、向东敞开的河谷盆地,包括黄土台塬、黄土高原沟壑和关中盆地3种地貌类型。受复杂地形的影响,暴雨、洪水、渍涝等水灾一直是区域内主要的自然灾害,尤其近年来,在人类活动和气候变化的综合影响下,暴雨导致的城市内涝、山洪灾害等时有发生。
研究区为泾河和渭河陕西省部分,研究区域范围及气象站点分布见图1。
基本资料为陕西省气象中心提供的陕西省泾河和渭河流域39个气象站1981—2017年历年10、20、30、45、60、90、120、180 min统计时段的年最大暴雨量数据。
2 研究方法
(1)参数估算方法。结合数理统计理论,从简单实用的角度考虑,选用矩法(MOM)、极大似然法(MLE)和線性矩法(L-M)作为各频率分布的参数估算方法,具体计算方法见文献[19]。
(2)拟合优度检验方法。通常采用拟优平方和准则法(RMSE)和拟优绝对值准则法(MAE)进行拟合优度检验,从实测资料的拟合情况看,MAE较为合理,且可避免个别点据对成果夸大的影响[20]。RMSE一般适用于长重现期的长历时设计暴雨和设计洪水的频率分析,而短历时设计暴雨的重现期一般不超过20 a[21],实测暴雨资料的整体拟合情况对其影响较大。笔者选用MAE,并结合概率点据相关系数法(PPCC)和图形分析法(Q—Q图)进行拟合优度检验。
3 结果与分析
3.1 参数估算方法对比分析
3种参数估算方法估算的各测站不同统计时段暴雨序列同一频率分布的参数有一定差异,表1列出了乾县站最大10 min暴雨序列3种参数估算方法所得各频率分布的参数,可以看出,整体上MOM和L-M估算的参数比较接近,MLE估算的参数与MOM和L-M估算的参数差异较大。在用MLE估算P-Ⅲ分布参数时,会出现似然方程无解而得不到参数的情况(长武站180 min序列和陈仓站20~120 min序列等)。
为了对比各参数估算方法的优劣,分别计算3种参数估算方法下各假定频率分布计算暴雨量与实测暴雨量的相关系数r与差值平均绝对值MAE*,采用概率点据相关系数法和拟优绝对值准则法优选最佳参数估算方法。从39个测站8个统计时段暴雨序列在3种参数估算方法下各频率分布的最优方法站点数看(表2),采用PPCC检验法时,P-Ⅲ分布、EXP分布、GEV分布和GP分布在各序列中以L-M最优的站点数最多,均在17~26之间;GUM分布除180 min统计时段暴雨序列MOM的最优站点数最多外,其他7个统计时段暴雨序列也是L-M最优的站点数最多;对于NORM分布,以L-M、MLE和MOM为最优参数估算方法在各统计时段暴雨序列中均有一定数量,且最优站点数差异不大,但以L-M最优的总序列数最多,占计算序列数的38%,略微优于MLE和MOM;采用拟优绝对值准则法时,P-Ⅲ分布、EXP分布、NORM分布、GEV分布和GUM分布在各序列中以L-M最优的站点数最多,在19~38之间;对GP分布,L-M、MLE为最优参数估算方法在各历时暴雨序列中均有一定数量,且最优站点数差异不大,但以L-M最优的总序列数最多,占计算序列数的52.9%,略微优于MLE。
综合两种优选方法的结果,L-M对6种频率分布均有很好的适用性,可作为短历时暴雨频率分布对比分析的统一参数估算方法。当以GP分布为理论分布进行短历时暴雨频率计算时,L-M和MLE均可用于参数估算,而以其他分布为理论分布进行短历时暴雨频率计算时,建议采用L-M估算参数。
3.2 频率分布适用性
根据前述结果,用L-M法估算各测站不同统计时段暴雨序列6种分布的参数,根据估算的参数分别计算6种频率分布在各序列假定频率分布计算值与实测值的r值和MAE*值,以此筛选各序列和各测站暴雨的最适用(最优)频率分布。
3.2.1 各统计时段暴雨序列频率分布
通过统计研究区域8个统计时段暴雨序列的最优频率分布站点数(表3)可以看出,以PPCC为评价标准时,各序列最优频率分布均以GEV分布最优站点数量最多,占比在44%~56%之间,且随着统计时段长度的增加占比有增大趋势,其次为GP分布,占比在13%~31%之间。以MAE为评价标准时,小于等于30 min序列中GP分布优势站点最多,占比在33%~41%之间,其次为GEV分布和P-Ⅲ分布,且两者占比接近;120 min序列中P-Ⅲ分布优势站点最多,其次为GEV分布,二者占比差距仅为8%;其他时段以GEV分布最优站点数量最多,且从各频率分布最优序列数量看,GEV分布、GP分布和P-Ⅲ分布为最优的序列数分别为103、93和86,GEV分布占比最大。综合考虑PPCC和MAE的评价结果,认为GEV分布可作为各时段短历时暴雨序列的最优频率分布。
从评价结果的一致性来看,以PPCC为评价标准时,各时段间6种频率分布最优站点数量稳定且各频率分布间8个时段最优站点数量差距显著,最优分布更集中,评价结果一致性强;以MAE为评价标准时,GEV分布、GP分布和P-Ⅲ分布在8个时段最优站点数量差距较小,没有显著差异。可见,PPCC检验法在区域频率分布选择时适用性更强。
3.2.2 各站点暴雨序列频率分布
研究同一站点不同统计时段暴雨序列的频率分布时,尽可能选用同一频率分布。当以PPCC和MAE评价的某一暴雨序列结果不一致时,通过绘制两种评价标准适用分布的计算暴雨量与实测暴雨量相关图(Q—Q图)选择最优分布。表4列出了乾县站各统计时段暴雨序列在两种评价方法下的适用分布,对90、120、180 min暴雨序列,两种评价方法的适用分布均为GEV分布,则这3个历时的最优分布确定为GEV分布;而其他统计时段暴雨序列两种方法的评价结果不一致,绘制10 min暴雨序列的Q—Q图发现两种适用分布在中值区很接近,如图2所示,但GEV分布在低值区的离差大,高值区离差小,GP刚好相反,考虑到暴雨频率计算的目的是推求设计暴雨,对中大值的精度要求较高,选取GEV分布作为乾县站10 min的最优频率分布;同样选定的20、30、45、60 min暴雨序列的最优分布见表4。从8个统计时段暴雨序列选定的最优分布看,GEV分布有5个,相比其他两个分布具有明显优势,据此以GEV作为乾县站短历时暴雨频率计算的理论分布。
采用同样的分析过程,所得研究区域内各测站最优频率分布见表5,在39个测站中,最优分布为GEV分布的站点有22个,占总数的56%,其次是GP分布、P-Ⅲ分布、EXP分布和GUM分布,其站点数量分别为12、5、3、1个,其中宝鸡站和千阳站对GP分布和P-Ⅲ分布同样适用,武功站对EXP分布和GP分布同样适用,兴平站对GEV分布和EXP分布同样适用,且GP分布、P-Ⅲ分布、EXP分布和GUM分布零散地分布在研究区域内。
同一测站不同统计时段暴雨序列和同一统计时段不同测站暴雨序列两个角度的分析结果均表明,不同评价标准下适用分布不同,GEV分布和GP分布适用性均比较明显,且GEV分布在8个短历时暴雨序列和39个站点中最优的数量比例最高,推求的暴雨精度相对较高,其适用性更强。在对陕西省泾河和渭河流域进行短历时暴雨频率计算时,建议选用GEV分布作为理论频率分布。
4 结 论
(1)各频率分布采用L-M估算参数后的计算值与实测值之间的误差最小,表现出了很好的适用性,是频率分布的最优参数估算方法。
(2)PPCC法相较于MAE法的最优频率分布集中,在区域频率分布选择时适用性更强。
(3)GEV分布为最优分布时的暴雨序列数和站点数均远多于其他分布为最优时的数量,表现出明显优势,且据此推求的短历时暴雨精度相对较高,建议在研究区域短历时暴雨频率分析计算时把GEV分布作为理论频率分布。
参考文献:
[1] 金光炎.水文统计理论与实践[M].南京:东南大学出版社,2012:114-150.
[2] 朱齐艳,张端虎.韶关站年最大值法暴雨强度公式频率曲线对比[J].人民珠江,2014,35(6):70-72.
[3] 赵琳娜,王彬雁,白雪梅,等.北京城市暴雨分型及短历时降雨重现期研究[C]//第33届中国气象学会年会S9水文气象灾害预报预警.北京:中国气象学会, 2016:1-3.
[4] 毛慧琴,杜尧东,宋丽莉.广州短历时降水极值概率分布模型研究[J].气象,2004,30(10):3-6.
[5] 卢金锁,程云,郑琴,等.西安市暴雨强度公式的推求研究[J].中国给水排水,2010,26(17):82-84.
[6] 樊利利,王艳永.广义极值分布的参数估计及实例分析[J].首都师范大学学报(自然科学版),2017,38(3):13-18.
[7] 金光炎.广义极值分布及其在水文中的应用[J].水文,1998,18(2): 10-16.
[8] 赵瑞星,翟宇梅.极端降水广义帕累托分布参数的Pickands自助矩估计研究[J].水力发电学报,2015,34(10):42-50.
[9] 马京津,李书严,王冀.北京市强降雨分区及重现期研究[J].气象,2012,38(5):569-576.
[10] 杨译舒,叶兴成,王飞,等.基于不同频率分布的乐山市暴雨参数分析[J].灾害学,2017,32(4):214-218.
[11] 牛晨,王双银,吴素娟.基于线性矩法的短历时暴雨频率分布研究[J].长江科学院院报,2019,36(8):55-60.
[12] 梁玉音,刘曙光,钟桂辉,等.线性矩法与常规矩法对太湖流域降雨频率分析的比较研究[J].水文,2013,33(4):16-21.
[13] HOSKING J R M, WALLIS J R. Regional Frequency Analysis: An Approach Based on L-Moments[M]. Cambridge:Cambridge University Press,1997:720-721.
[14] 雷冠軍,王文川,殷峻暹,等. P-Ⅲ型曲线参数估计方法研究综述[J].人民黄河,2017,39(10):1-7.
[15] 马秀峰,阮本清.对权函数法求概率分布参数的讨论[J].水利学报,2001,32(11):34-40.
[16] 李航,宋松柏,石继海.指数Gamma分布参数估计方法对比研究[J].水力发电学报,2019,38(4):96-107.
[17] 吴光琼.群居蜘蛛优化算法在水文频率曲线参数优化中的应用[J].水资源与水工程学报,2015,26(6):123-126,131.
[18] 李宏伟.水文频率参数计算方法与应用研究[D].杨凌:西北农林科技大学,2009:37.
[19] 黄振平,陈元芳.水文统计学[M].北京:中国水利水电出版社,2011:168-186.
[20] 李松仕.几种频率分布线型对我国洪水资料适应性的研究[J].水文,1984,4(1):1-7.
[21] 中华人民共和国住房和城乡建设部.城市防洪工程设计规范:GB/T 50805—2012[S].北京:中国计划出版社,2012:2.
[22] HEO J H, KHO Y W, SHIN H, et al. Regression Equations of Probability Plot Correlation Coefficient Test Statistics from Several Probability Distributions[J]. Journal of Hydrology, 2008, 355(1-4):1-15.
[23] 李兴凯,陈元芳.暴雨频率分布线型优选方法的研究[J].水文,2010,30(2):50-53.
【责任编辑 张 帅】