杜 懿,麻荣永
(1.广西大学土木建筑工程学院,广西 南宁 530004;2.广西防灾减灾与工程安全重点实验室,广西 南宁 530004)
洪水、暴雨等水文极值事件一般都具有总量、强度和历时等多属性特点,且各属性之间均存在着一定的相依关系[1]。传统的单变量分析法已无法满足应用要求,为了让水文事件得到全面描述,进行多变量分析就显得尤为必要。关于多变量分析的计算,目前概括起来主要有多元正态分布、非参数法、将多维联合分布转换成一维分布等方法[2]。但上述方法均存在一定问题。Copula函数的引入,有效地解决了这一问题。Copula函数是构建多变量联合分布的一种高效方法,能够构造出边缘分布为任意分布的多变量联合分布函数,具有极强的灵活性与适应性[3]。但Copula函数类型的选择是个难题,不同的Copula函数具有不同的分布特性,对水文变量的描述也存在差异。对此,国内外很多学者也做了大量研究,大体上均认为Archimedean Copula函数族更适合于多数水文变量的描述[4]。随着更多Copula函数的不断涌现,这一经验逐渐受到越来越多的挑战。基于此,本文以郁江南宁水文站历年最大洪峰、洪量为研究对象,通过建立不同Copula函数下两变量的联合分布来推求最佳函数选择,以期为未来区域水利工程规划和防洪减灾工作提供一定指导。
Copula函数是定义在[0,1]区间上均匀分布的多维联合分布函数,其理论最早可追溯到1959年Sklar提出的Sklar定理。该定理认为可以将一个N维联合分布函数分解成N个边缘分布函数和一个Copula连接函数。Nelsen于1999年给出了Copula函数的严格定义,即Copula函数是把随机变量X1,X2,…,XN的联合分布函数F(x1,x2,…,xN)与各自的边缘分布函数FX1(x1),FX2(x2),…FXN(xN)相连接的连接函数。即函数C(u1,u2,…,uN),使得
F(x1,x2,…,xN)=C[FX1(x1),
FX2(x2),…FXN(xN)]
(1)
Copula函数具有椭圆型、二次型和Archimedean型三大类。其中,Archimedean Copula函数族又包括G-H、Clayton和Frank 等多种Copula函数[5]。本文选用的5种Copula函数的分布函数分别如下:
(1)正态(高斯)Copula
(2)
式中,u、v;ρ为变量间的线性相关系数;φ-1为标准正态分布的分布函数的逆函数;其他变量为函数中的参数。
(2)t-Copula函数
(3)
(3)G-H、Clayton、Frank Copula函数
C(u,v)=e-[(-lnu)θ+(-lnv)θ]1/θ
(4)
C(u,v)=(u-θ+v-θ-1)-1/θ
(5)
(6)
式中,θ为各Copula连接函数的参数值。
以上Copula函数具有不同的特点,无明显的优劣之别。总体来说,正态Copula函数和Frank Copula函数适合于尾部对称且渐近独立的二维随机变量; t-Copula函数适合于尾部对称且尾部相关的二维随机变量;G-H Copula函数和Clayton Copula函数均适合于具有非对称尾部的二维随机变量,前者上尾相关、下尾渐近独立,后者相反。
本文根据郁江南宁水文站1942年~2002共61a洪水资料,整理出历年最大洪水所对应的洪峰流量与洪水总量(具体数据略)。从推求两变量各自最佳的边缘分布、选取Copula连接函数、参数估计、模型评价4个过程来进行郁江南宁水文站洪水峰量联合分布Copula函数选取问题的研究。
在我国,一般认为,P-Ⅲ型曲线可以很好地拟合水文变量的频率分布。基于此,本文初选P-Ⅲ型分布对洪峰、洪量两序列进行拟合,二者累积概率密度函数如图1、2所示。
图1 洪峰的P-Ⅲ型分布拟合结果
图2 洪量的P-Ⅲ型分布拟合结果
从图1、2中可以看出,P-Ⅲ型曲线对洪峰、洪量两序列的拟合结果均不理想,误差较大。为准确快速地推求出两变量的边缘分布,笔者采用非参数核密度估计法来对两变量的分布形态进行研究。利用MATLAB软件编程得到两变量的核分布估计与经验分布函数的拟合结果(见图3、4)。
图3 洪峰的核分布估计与经验分布函数
图4 洪量的核分布估计与经验分布函数
从图3、4可看出,洪峰和洪量的经验分布函数与核分布估计几乎重合,拟合效果优秀,误差较小;从而说明本次利用非参数核密度估计法求得的两个变量的边缘分布较为准确,很好地反映出了两序列的分布特性。
G-H、Clayton、Frank 3个Copula函数的参数取值分别为θ1=3.117 415,θ2=3.660 801,θ3=9.997 817。
将计算得到的经验联合分布值与用5种Copula函数计算得到的理论联合分布值点绘作图,结果如下。
图5 经验联合分布与理论联合分布的拟合
由图5可以看出,以上5种Copula函数的拟合效果都较好,点据均分布在45°直线附近。为了更精确地评价每个Copula函数的拟合效果,分别以拟合趋势线斜率(k)、相关系数平方(R2)、平方欧式距离(d)为标准进行判别。其中,k和R2值越接近于1或d值越小,拟合效果越好。比较结果见表1。
表1 五种Copula函数比较结果
比较发现,5种Copula连接函数中以二元t-Copula函数的拟合效果最好,Frank Copula函数最差(与经验结论相悖)。故在郁江南宁水文站洪水峰量联合分布研究中,推荐使用二元t-Copula连接函数。函数的联合概率密度见图6。其中,U表示洪峰,V表示洪量。
图6 二元t-Copula概率密度
仔细观察图6可知,二元t-Copula函数具有对称的尾部,且尾部较厚。该函数对变量之间的尾部相关变化较为敏感,可以很好地捕捉到变量的对称的尾部相关关系。
本文以郁江南宁站61a洪水资料为基础,采用5种不同的Copula函数来建立洪峰与洪量的联合分布。在洪峰、洪量的边缘分布推求中,由于传统的P-Ⅲ型分布拟合较差,遂采用了非参数核密度估计法来描述两个变量各自的边缘分布,拟合误差较小,结果有了很大提高;通过点绘5种Copula函数的理论联合分布与经验联合分布的相关图发现,5种Copula函数均适用于本次峰量联合分布研究;以拟合趋势线斜率、相关系数平方、平方欧式距离作为评价指标,比较得出适用于本次研究的最优Copula连接函数,即二元t-Copula函数。