风速概率分布模型在桥梁基本风速计算中的应用

2023-11-23 10:15陈泓欣曾加东张志田
中外公路 2023年5期
关键词:皮尔逊帕累托概率分布

陈泓欣,曾加东,张志田

(海南大学土木建筑工程学院,海南海口 570228)

0 引言

基本风速准确取值是保证桥梁抗风安全性和正常使用功能的前提,在工程实践中,主要依据《公路桥梁抗风设计规范》(JTG/T D60-01—2004、JTG/T 3360-01—2018)的规定进行预测,其对基本风速定义是10 min 平均年最大风速推算100 年重现期的数学期望值[1],并给出了标准取值条件。

极值风速是风速样本中风速较大的风速值[2]。在长重现周期下,极值风速可通过年最大风速数据拟合极值分布曲线得到。极值分布曲线为规范中所采纳的概率分布模型,包括:极值Ⅰ型分布、广义极值分布、广义逻辑分布、广义帕累托分布、广义正态分布和皮尔逊Ⅲ型分布。其中,极值Ⅰ型分布为《公路桥梁抗风设计规范》(JTG/T D60-01—2004)(以下简称“旧规范”)使用的概率分布模型;其余5 种是现行《公路桥梁抗风设计规范》(JTG/T 3360-01—2018)(以下简称“新规范”)增加的概率分布模型。显然影响极值风速预测的关键就是概率分布模型的选择,因此通过对比新旧规范中风速分布模型选择的差异性和适用性,将有助于提升公路桥梁基本风速取值准确性。

极值风速统计发展初期,国际上许多学者认为极值Ⅱ型分布为最优分布概率分布模型[3],而后大量学者研究表明极值Ⅰ型分布和皮尔逊Ⅲ型分布更切合极值风速分布规律[4-5]。在中国,使用最多、最早的是皮尔逊Ⅲ型分布,而后改为极值Ⅰ型分布,主要原因是极值Ⅰ型分布在理论上比较合理,并且在运算推演方面具有优势。徐欣等[6]研究并对比了中欧规范桥梁结构风荷载取值,二者都是基于极值Ⅰ型分布且计算结果近似;段忠东等[7]基于时段最大取样和跨阈取样法,研究了极值风速理论分布的特征和极值Ⅰ型分布、极值Ⅲ型分布和广义帕累托分布等模型的尾部特性及对极值风速的估计精度,认为极值Ⅲ型分布为年最大风速普遍最优概率模型;赵林等[8]则通过Monte-Carlo 数值模拟技术对上海地区龙华、川沙气象站的极值风速进行估算,研究结果显示无论风速母样为何种类型,按年或半年抽样估算的最优极值风速是极值Ⅱ型;陈朝晖等[9]通过重庆地区10年月最大风速数据讨论了3 种极值分布和广义帕累托分布的拟合结果,研究显示:模拟当地极值风速最佳的概率分布模型是极值Ⅲ型;郑刚等[10]则通过湖南省某气象台的风速数据研究了不同抽样间隔与不同概率分布模型的对比,结果表明该地区更符合极值Ⅰ型分布;Fawad 等[11]根据巴基斯坦地区短期少资料的情况对比并分析了广义极值分布、广义逻辑分布、广义正态分布、广义帕累托分布、皮尔逊Ⅲ型分布和极值Ⅲ型分布等概率分布模型的优劣性,研究表明:广义逻辑分布和广义正态分布模拟结果比其他概率分布模型更精确,且广义逻辑分布的误差比广义正态分布的更小。

本文根据新、旧规范对各地区气象台风速观测资料的修正和概率分布模型的选取进行对比分析。研究不同概率分布模型的差异,总结各概率分布模型的适用性,给桥梁设计人员提供更通透的规范解读。

1 极值概率分布模型

1.1 极值理论

基于风速随机过程为平稳过程的假定,在一段时期内该地区的外界环境变化不大。并考虑每次引起风速极值都是相互独立的。

研究表明渐近分布有3 种情况,分别为极值Ⅰ型、Ⅱ型、Ⅲ型,也写成统一形式,即广义极值分布函数[12]。由于极值Ⅱ型与极值Ⅲ型在新旧规范中均无列举,本文只讨论极值Ⅰ型和广义极值分布。

1.2 6 种概率分布模型

1.2.1 极值Ⅰ型概率分布

在旧规范中,年风速极值的统计分布采用极值Ⅰ型分布曲线,其分布函数为:

式中:μ为风速均值;σ为标准差;C1、C2为矩法估算参数。

极值Ⅰ型分布由Gumbel 首次提出,亦称Gumbel分布,因其没有形状参数,表达形式更为直观简洁,应用也颇为广泛。极值Ⅰ型分布发展较为成熟,也有丰富的研究成果。因其尾部特性较为平缓和延长,与风速有限无界等特点十分相似,使其成为普遍认可的风速统计概率分布模型之一。

1.2.2 广义极值分布

广义极值分布(Generalized Extreme Value Distribution,GEV)函数如下式所示:

式中:k、ξ、α分别为形状参数、位置参数和尺度参数,且极值Ⅰ型、Ⅱ型、Ⅲ型分布可以由GEV 表示。

当k→0 时,表 示 为 极 值Ⅰ型;当k>0 时,表 示为极值Ⅱ型;当k<0 时,表示为极值Ⅲ型。通常认为极值Ⅰ型分布偏安全;极值Ⅱ型对小概率情况拟合较差,给出风速极值偏小;极值Ⅲ型分布不是无界型,与风速有限无界这一特性相冲突[2]。广义极值分布较为综合,广泛适用,准确地估算三参数能有效地拟合极值风速的分布。

1.2.3 广义逻辑分布

广义逻辑分布(Generalized Logistic Distribution,GLO)函数表示如下:

早期的逻辑分布曲线是S 形曲线,在生物学中称为生长曲线,用于描述物种繁衍的速度。而广义逻辑分布由Ahmad[13]最初提出的对数逻辑分布的重新参数化得到。通过广义逻辑分布的形状参数,可描述样本的偏度和尾部性质,从而推导出极值风速的预测值。

1.2.4 广义帕累托分布

广 义 帕 累 托(Generalized Pareto Distribution,GPA)函数表示如下:

广义帕累托分布是母体风速分布尾部的渐近表示,它具有与渐近极值风速分布相同的形状系数,因此,理论上广义帕累托分布的形状系数等于0[14]。

1.2.5 广义正态分布

广义正态分布(Generalized Normal Distribution,GNO)函数表示如下:

广义正态分布为函数族,是正态分布的推广,解决了正态分布的对称性、轻尾性、单峰性等特征,对实际数据有很好的拟合效果[15]。

1.2.6 皮尔逊Ⅲ型

皮尔逊Ⅲ型(Pearson Type ⅢDistribution,PE3,P-Ⅲ)函数分布如下:

式中:β、α分别为皮尔逊Ⅲ型的尺度参数和形状参数。

该曲线由英国生物学家K·皮尔逊1985 年提出,是一条一端有限一端无限的不对称分布单峰概率分布曲线。在某种程度上近似服从二项分布、泊松分布、超几何分布和正态分布,也常用于水文频率计算中。

2 基本风速理论值对比

旧规范中对极值风速预测采用的是极值Ⅰ型概率分布;而新规范则根据地区推荐最优概率分布模型。基于新规范对各地区最优概率分布模型的判断,本文分别选取5 个不同地区进行风速拟合。通过不同地区风速资料对比以下4 种方法:旧规范查表计算法、新规范查表计算法、极值Ⅰ型概率模型计算法及新规范推荐的最优概率分布模型计算法。选择地区1 为丽江,新规范对该地区极值风速预测采用的是广义极值分布;地区2 为腾冲,采用广义逻辑分布;地区3 为广州,采用广义帕累托分布;地区4 为临沧,采用广义正态分布;地区5 为阳江,采用皮尔逊Ⅲ型分布。5 个地区的年最大风速采集源于国家气象科学数据中心,但由于5 个气象台对最大风速的记录资料年限限制,选择气象台近30 年最大风速资料作为样本。估算出5 个地区,6 种概率分布模型,在10 年、20年、30 年、50 年、100 年一遇最大风速,并与新旧规范所对应的重现期风速取值作对比。对比结果如图1所示。

图1 新旧规范取值和概率分布拟合对比

新旧规范不同重现期的风速值对比表明:新规范中的取值通常比旧规范的大,这是偏于保守,也是安全的。新规范风速取值,随重现期的增长,变化较为平缓,这是由于参照相邻气象台和平滑增长修订的结果,避免了不同重现期下取值突变导致的设计问题。但也由于这种原因,使得历年风速拟合数据与规范值存在一定差值。对于阳江地区,近30 年来的风速预测值十分接近甚至略高于旧规范风速取值,在没有桥址风速观测资料的情况下,可能导致安全储备不足,对桥梁的设计和使用存在隐患,所以使得新规范修改值比以往增加了近50%,这也考虑了地球自然气候变化逐年激烈的影响。新规范中对类似地区进行风速修订,这类地区为高危险风速区,与文献[16]分类较为接近,如湛江、林西等。特别是对于短重现期极值风速的提高,有助于保障桥梁设计和使用过程中有足够的安全储备,也使得对风速的预测更为准确。

分析5 种不同概率分布模型对极值风速不同重现期的结果表明:随着重现期越长,风速估计也越大,但不同模型间有本质差别。在短重现期下,基于广义逻辑分布风速预测值会略低于极值Ⅰ型分布,但随着重现期增长,预测值会有所改善,这类概率分布模型适合于风速增长或风速资料不完备的地区。基于皮尔逊Ⅲ型分布的风速拟合值与极值Ⅰ型相差无几。基于广义帕累托分布风速预测值随着重现期增长,变化最为缓和,因为广义帕累托尾部收敛迅速。基于广义极值分布的风速预测值大于极值Ⅰ型分布,而基于广义正态分布的风速预测值小于极值Ⅰ型分布,这与分布模型的尾部特性有关,如图2 所示。若分布曲线趋于零的速度越慢,其尾部拖得越长,则相应长重现期下风速预估值越大。所以极值分布模型估计风速会比一般概率分布模型偏大,即偏于安全。在利用广义帕累托分布拟合广州气象台数据时,同时计算了广义正态分布的拟合结果。计算结果表明:基于广义帕累托分布,重现期30 年的风速估计值为16.4 m/s,而重现期100 年的风速估计值为16.7 m/s,相比之下,极值Ⅰ型风速估计值为19.2 m/s,二者差距15%。重现期同为100 年,基于广义正态分布估计的风速值为16.8 m/s,比广义帕累托估计值略大。以此可推测6 种概率分布模型在长重现期下风速预测值的大小排序如下:广义极值>极值Ⅰ型、广义逻辑、皮尔逊Ⅲ型>广义正态>广义帕累托。这与文献[6]研究分析结果一致:在风速母体分布一致的情况下,极值模型往往给出偏安全取值,而广义帕累托分布则给出较小取值。

图2 极值分布与广义正态分布概率密度函数对比

所以根据概率分布曲线在重现期增长下的走势,大致可分为3 类:风速增长型,如广义极值分布;风速生长型,如广义逻辑分布、皮尔逊Ⅲ型分布;风速平稳型,如广义正态分布、广义帕累托分布。风速增长型曲线的走势几乎与重现期呈正相关,随着重现期的增长,会一直增长。相比之下,风速生长型曲线会逐渐走缓,增加幅度逐渐下降。而风速平稳型曲线的走势比风速生长型变化更为平缓,甚至短重现期与长重现期的预测值相当。

3 概率分布模型的区域适用性

概率分布模型对区域有适用性,从而使得在一定范围内,使用该分布模型的概率上升。为验证这一可能性,做出5 种模型的地区分布热力图如图3 所示,并观察各模型的分布情况。结果表明:5 种概率分布模型在应用中均有聚集情况,但不同概率分布模型聚集程度不尽相同。其中风速增长型的广义极值分布模型主要集中在华中等地,根据广义极值模型尾部特性分析判断,该地在估计风速时,重现期越长,估值可能会发生较大增长。华中等地偏向内陆,与沿海等地不同,常年风速较为柔和,其年最大风速取决于n年一遇的超强台风进入内地,或季风气候突然剧增,但由于常年风速不高,所以使得重现期越长,风速估值越大。对于风速生长型的广义逻辑分布和皮尔逊Ⅲ型分布而言,规范应用略少。其中运用广义逻辑分布的地区只有84 组,约为总数的11%,但也出现局部聚集现象。皮尔逊Ⅲ型分布也有较为明显的聚集,分别在黄河及长江流域附近。由于风速生长型分布模型与生长规律有一定相似性,在少风速资料条件下对极值风速进行预测比其他概率分布模型更为接近真实值。风速平稳型分布模型运用则最为广泛,在新规范中超总占比的1/2。其中运用广义正态分布的气象台共288 个,约占总数的38%。但实际风速并不严格地满足平稳高斯过程,所以利用广义正态分布是一种有效的数据处理办法。其次为广义帕累托分布,该模型主要集中于亚热带季风气候,特别是沿海地区。因为受季风和常年台风影响,即使伴随重现周期增长,其预测风速值未必有较大提升。所以广义帕累托分布预测的平稳性能更好地反映这类地区风速随重现期增长的变化。

图3 5 种模型区域热力图

通过热力图可以确定不同概率分布模型在一定区域内有最优性,而且能很好解释该地区风速变化及发展规律。

4 结论

针对基本风速取值变化,研究旧规范与新规范的取值差异,总结基本风速取值的变化规律。通过比较极值Ⅰ型与5 种概率分布模型的拟合情况,讨论各概率分布模型在不同重现周期下的预测值及发展规律。利用区域热力图分析5 种不同概率分布模型各自的适用性及在新规范中的运用及分布情况。研究结果表明:

(1)新规范对风速取值进行了修正,该值随重现期增长变化更为缓和,但其相比历年数据拟合值存在一定差距。新规范打破传统单一的极值Ⅰ型风速估值方法,收纳了5 种概率分布模型供不同地区择优使用。

(2)通过不同概率分布模型风速拟合发现:广义极值分布预测值最大;广义帕累托分布预测值最小;广义逻辑分布和皮尔逊Ⅲ型分布在长重现周期下与极值Ⅰ型拟合值相差无几。

(3)概率分布模型可大致分为3 类:风速增长型、风速生长型和风速平稳型。风速增长型适用于华中腹地等内陆地区;风速生长型适用于新兴气象台或风速资料匮乏等地区;风速平稳型适用于随年份增长风速较稳定的地区,包括沿海的季风区,西部的高抗风风险区等。不同概率分布模型对所在地区能良好反映出风速变化和发展规律,使一定区域内该模型运用频率较高,出现热力现象。

猜你喜欢
皮尔逊帕累托概率分布
成都经济区极端降水广义帕累托分布模型研究
离散型概率分布的ORB图像特征点误匹配剔除算法
现代统计学之父:卡尔·皮尔逊
现代统计学之父:卡尔·皮尔逊
Excel在水文学教学中的应用
卡方分布的探源
审判工作量何以最优:民事审判单元的“帕累托效率”——以C市基层法院为例
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算
帕累托最优