孔德兵,尚可政,王式功,赵文婧,叶 伟
(1.兰州大学大气科学学院/半干旱气候变化教育部重点实验室,甘肃 兰州 730000;2.中国人民解放军95605部队气象台,重庆 402361)
基于逐步回归分析的西北地区东部雷暴概率预报方法研究
孔德兵1,2,尚可政1,王式功1,赵文婧1,叶伟2
(1.兰州大学大气科学学院/半干旱气候变化教育部重点实验室,甘肃兰州730000;2.中国人民解放军95605部队气象台,重庆402361)
摘要:利用2008~2013年西北地区东部60个站点天气实况资料以及NCEP/NCAR 再分析资料计算出的对流参数,统计各站年均雷暴日数,在前期天气分型的基础上,通过事件概率回归方法,建立了60个站点4~10月24 h雷暴概率预报方程,并对2013年4~10月各站雷暴进行试预报。结果表明:(1)西北地区东部雷暴发生最多的站点位于青藏高原东北边坡地带,最少的站点位于北部戈壁荒漠地带与东部关中平原一带,45%的站点年均雷暴日数在5 ~10 d之间;(2)前期天气分型过程剔除了一部分未发生雷暴的样本,使得逐步回归建模的总样本数明显减少,有效地提高了预报准确率;(3)基于NCEP/NCAR再分析资料计算的物理量与雷暴有无事件相关性较好,对24 h概率回归方程方差贡献较大;(4)2008~2012年回代预报所有站点平均TS评分为24.2%;2013年试预报所有站点平均TS评分为23.3%,雷暴发生较多的站点预报效果更好。该预报结果较理想,可为西北地区东部雷暴研究提供参考。
关键词:雷暴;逐步回归;概率预报
引言
雷暴是一种夏季多发的局地灾害性天气,其出现常伴有剧烈的强对流天气现象。雷暴不仅会造成人员伤亡,而且也会引起严重的经济损失,因此引起各级气象部门的密切关注,并投入大量财力物力对其进行研究。随着我国社会经济不断向前发展,雷暴等强对流天气将会造成更巨大的危害,因此仍需要实用有效的短时预报方法对雷暴进行准确预报,进而提前防范,减少损失。
雷暴的预报方法很多,单站预报最常采用的是将天气学方法与指标判定法相结合的预报方法,而区域性雷暴预报主要有数值模式方法以及综合预报方法。近年来,在提高雷暴预报准确率的迫切要求下,国内很多学者对雷暴预报进行了有针对性的研究,其中一些成果被气象业务系统采用,成为雷暴预报常用的方法。单站预报方面,胡邦辉等[1]采用朴素贝叶斯分类器与贝叶斯判别准则建立了漳平、广州、湛江3个单站的雷暴预报模型;田琨等[2]分别建立了Bayes分类法和Logistic回归分析法对应的南京地区雷暴强度预报模型,并比较了2种方法的预报效果;熊亚军等[3]将北京雷暴天气进行分型,采用事件概率回归方法,建立了北京3~36 h雷电潜势预报系统;刘宸钊等[4]采用F-分值法和主分量旋转法,结合二元Logistic回归分析,建立了西昌北郊某站的雷暴释用预报模型;陈勇等[5]以WebGIS技术为依托,采用MED法、MOS法建立长沙市雷暴6 ~48 h潜势预报模型;陈勇伟等[6]采用BP神经网络模型分析方法,预报了南京2009年6~8月的雷暴活动潜势;冯民学等[7]使用二级逻辑回归法建立排空方程与预报方程,对洋口港雷暴进行了预报;秦春明等[8]在天气分型的基础上,将用数值预报产品计算的雷暴相关物理量作为判别指标,得出了葫芦岛1~10 d的雷暴预报方法;孙翠梅等[9]通过对1999~2008年镇江市地面观测资料的194个雷暴天气过程个例进行天气系统分型,在此基础上提出了预报镇江市雷暴天气的思路。以上各单站雷暴潜势预报已经有了较高的准确率,由于雷暴不只影响一个站点,因此区域性雷暴的预报也显得尤为重要。郝莹等[10]利用T213资料,用判别分析法和指标叠加法制作了安徽省雷暴潜势预报,结果表明指标叠加法优于判别分析法;王新敏等[11]采用ADTD地闪定位资料与利用T213/T639数值模式输出产品计算的对流参数,建立了河南省雷电潜势预报模型;陈秋萍等[12]采用中尺度模式MM5及探空资料计算的物理量,建立了福建省雷电潜势预报模型;赵培娟等[13]采用加权平均法,分别建立河南省区域性冰雹、雷暴大风和短时强降水的预报方程,并通过计算机技术实现了预报自动化,已应用到河南省强对流天气预报业务中;纪晓玲等[14]以宁夏雷暴、闪电观测资料和ECMWF、T213数值预报产品为基础,开发了基于相似预报法的宁夏雷电潜势预报系统;梁维亮等[15]统计常用对流参数满足阈值条件时广西省6个探空站出现雷暴天气的概率,定义了一个适用广西雷暴天气的经验预报指标;曾淑玲等[16]选取与雷暴发生关系密切的多个预报因子,应用事件概率回归方法建立了全国690个基本站4~9月的24 h雷暴潜势预报方程。
由于地域因素的影响,不同区域雷暴天气产生的条件也会有差异。西北地区东部具有多样的地形地貌,气候较干旱,相比全国其他气候湿润地区,雷暴发生频率较低,预报难度相应增加,因此探讨该地区雷暴的客观预报方法是十分必要的。本文在前期雷暴天气分型基础上,利用事件概率回归方法建立西北地区东部各站点的雷暴预报方案,为该地区雷暴预报提供参考。
1资料和方法
1.1资料
所用资料为:(1)西北地区东部(33°N~40°N、102°E~110°E)2008~2013年60个地面站点的雷暴实况观测资料;(2)2008~2013年4~10月NCEP/NCAR再分析资料,水平分辨率为1°×1°。图1为该区域站点分布图。
图1 西北地区东部站点分布
1.2方法
(1)单站雷暴日定义
由于08~11时发生的雷暴较少,大部分雷暴发生在14时之后,因此规定该区域每个站点每日14时至翌日14时24 h内发生雷暴作为该观测站点的一个雷暴日。
(2)天气分型消空过程
定义西北地区东部区域雷暴日概念,总结区域雷暴日发生的4种天气型:低涡型、低槽型、西北气流型、西南气流型。根据每种天气型不同的位势高度场分布特征分别设计各天气型自动识别方法。不同天气型同纬度格点自西向东位势高度变化趋势不同,据此编程分析所有样本当日20时32°N~40°N、100°E~110°E范围内500 hPa与700 hPa位势高度场,得出天气型归属,再结合物理量诊断分析,总结各天气型雷暴日对应的参数阈值。将自动识别方法与参数阈值结合对2008~2012年4~10月区域雷暴日进行回代预报,对2013年4~10月区域雷暴日进行试预报,剔除未入型样本,剩余样本用于回归建模。
(3)格点数据转换成站点数据
将2008~2013年4~10月西北地区东部33°N~40°N、102°E~110°E范围内通过NCEP/NCAR 再分析资料计算出的格点物理参数分别插值到每个观测站点上,插值公式如下:
(1)
式中Ri(i=1,4)分别为观测站点与其周围最邻近的4个格点之间的距离,a(xi,yi)为格点值,AS为插值得出的站点值。
(4)建立逐步回归预报模型
选取与雷暴发生关系较为密切的因子,建立各站2008~2012年4~10月所有入型样本与预报因子之间的概率回归预报方程,建立回归模型的过程采用双重检验逐步回归的方法。
(5)回代检验与试预报检验
将逐步回归得到的每个概率预报方程代入预报因子值进行回代验证,得出2008~2012年4~10月各站的回代概率。将2013年4~10月所有样本的预报因子代入概率回归方程,进行试预报。
(6)预报效果评估
利用TS评分最大原则确定各站雷暴发生的临
界概率。当回归估计概率≥临界概率时,预报雷暴发生。
(2)
式中A为报对次数,B为空报次数,C为漏报次数。
2西北地区东部雷暴的空间分布
西北地区东部地形地貌复杂多变,该区域西南部为青藏高原东北边坡地带,西部与北部主要为戈壁荒漠地带,中东部为黄土高原区,东南部为秦岭以南区。
统计2008~2013年西北地区东部60个地面站点的年平均雷暴日数,结果见表1。
表1 2008~2013年西北地区东部60站年平均雷暴日数
由表1可见,年均雷暴日数最多的站为合作站,为28.2 d;最少的站为武威站,只有2.3 d。60个地面站点中:4个站年平均雷暴日数<5 d,占6.7%;27个站在5~10 d 之间,占45.0%;22个站在10~15 d之间,占36.7%;4个站在15~20 d之间,占6.7%;3个站超过20 d,占5.0%。所有站点平均的年平均雷暴日数为10.4 d,这说明西北地区东部年平均雷暴日数普遍偏少。图2是该区域年平均雷暴日数的空间分布。
由图2可见,西北地区东部雷暴最频发的区域为青藏高原东北边坡地带,该区域所有站点年平均雷暴日数均在15 d 以上,其次为秦岭以南区、黄土高原区;雷暴发生最少的区域为北部戈壁荒漠地带以及东部关中平原一带,武威、民勤、武功、咸阳等站点年平均雷暴日数少于5 d。高原地区有利的地形因素更容易诱发雷暴,而戈壁荒漠地带由于水汽不足,雷暴发生最少,关中平原一带地形平坦,海拔最低,动力抬升条件较弱,雷暴也较少发生。
图2 西北地区东部年平均雷暴日数空间分布
3雷暴预报模型的建立及预报效果检验
3.1预报因子的选取
选取与雷暴发生关系较为密切的因子,综合考虑水汽、动力、不稳定能量、不稳定度以及各层温度平流、预报因子6 h、24 h变化量等因素。由于大部分站点都缺乏准确的探空观测资料,因此将每个观测站点周围4个格点值根据距离权重采用公式(1)进行线性插值处理得到站点数值。取每日20:00的值作为当日预报因子的基准值。本文选取42个因子如下:
(1)水汽因子:850 hPa、700 hPa水汽通量散度QVDIV850、QVDIV700,850 hPa、700 hPa温度露点差(T-Td)850、(T-Td)700,整层大气可降水量共5个因子;
(2)不稳定度因子:VT指数(T850-T500)、总指数TT(T850-T500+Td850-T500)、K指数KI(T850-T500+Td850-T500-T700+Td700)、最优抬升指数BLI、沙氏指数SI、500 hPa与850 hPa假相当位温差△θse85、500 hPa与700 hPa假相当位温差△θse75共7个因子;
(3)不稳定能量因子:对流有效位能CAPE、对流抑制能量CIN共2个因子;
(4)动力因子:500、700、850 hPa垂直速度V500、V700、V850,0~6 km风切变SR0~6 km、 0~3 km风切变SR0~3 km, 500、700、850 hPa涡度VOR500、VOR700、VOR850,500、700、850 hPa散度DIV500、DIV700、DIV850,500、700、850 hPa涡度平流VADV500、VADV700、VADV850,500 hPa与850 hPa涡度平流差△VADV85共15个因子;
(5)温度平流因子:500、700、850 hPa温度平流TADV500、TADV700、TADV850,500与850 hPa温度平流差△TADV85共4个因子;
3.2概率回归模型的建立
事件概率回归方法是将预报量与各预报因子之间的关系看成是当各预报因子发生时,预报量是否发生。首先将雷暴出现与否转化为0,1变量。本文建模的样本集合为2008~2012年4~10月经天气分型过程预报为区域雷暴日的所有637个样本。先将各预报因子进行标准化处理,再分别对各站进行逐步回归建模。每个站的概率预报方程为此站点最优预报因子的线性组合,对各因子总引入次数进行了统计。引入次数超过2次的物理量见表2。
表2 雷暴预报因子统计
由表2可以看出,引入次数排在前面的因子主要为表示不稳定能量与不稳定度的因子。△CAPE6 h因子的引入次数最多,达到39次,这说明20时与14时对流有效位能增加越大,发生雷暴的可能性就越大。此外,最优抬升指数BLI、对流有效位能CAPE也对雷暴有较好的指示意义,被超过一半的站点引入。水汽因子引入次数不多,说明该区域水汽因子与雷暴发生相关性较小。
3.3雷暴预报临界概率的确定
本文事件概率回归的预报判据是根据最优TS评分原则得出的。通过上面建立的预报模型,将方程中各因子的值代入相应的事件概率回归方程,求出回归估计值Y*,Y*即为雷暴发生的概率值。找出建模的样本和试预报的样本中Y*的最大值Ymax与最小值Ymin,然后取一个较小的步长△Y,本文将△Y取0.1。从Ymin到Ymax,第n步假设临界概率值为Yopt=Ymin+(n-1)△Y,求每一步对应的0,1化预报TS评分,将TS评分最大的假设临界概率值作为雷暴预报判据。
3.42008~2012年回代预报与2013年试预报
图3表示西北地区东部各站24 h雷暴预报流程。天气分型过程入型的样本认为其有发生雷暴的可能,未进入天气型的样本则预报无雷暴发生。因此各站漏报来自2部分,即未入型样本中的漏报与入型样本经临界概率判断后的漏报。
对2008~2012年各站进行回代检验。在天气分型过程中,2008~2012年4~10月共1 070个样本,入型637个,其余433个样本中均预报不发生雷暴。评估60个观测站的预报结果,各站回代预报最优TS评分见表3。
图3 雷暴预报流程图
表3 2008~2012年西北地区东部60站回代预报TS评分
对2013年西北地区东部各站进行试预报检验。在天气分型过程中,2013年4~10月共214个样本,入型129个,其余85个样本均预报不发生雷暴。评估60个观测站的预报结果,各站试预报最优TS评分见表4。
3.5预报效果分析
3.5.1回代预报效果
从2008~2012年4~10月西北地区各站24 h雷暴回代预报结果中得出:单站最高TS评分为38.1%,最低为12.6%,各站TS评分均在10%以上,10个站预报TS评分<20%,43个站预报TS评分≥20%且<30%,7个站预报TS评分≥30%。预报TS评分≥20%的站点共有50个,占83.3%,平均预报TS评分为24.2%。
表4 2013年西北地区东部60站试预报TS评分
3.5.2试预报效果
从2013年4~10月西北地区各站24 h雷暴试预报结果看出:单站最高TS评分为47.1%,最低为4.8%,3个站预报TS评分<10%,16个站预报TS评分≥10%且<20%,29个站预报TS评分≥20%且<30%,12个站预报TS评分≥30%。预报TS评分≥20%的站点共有41个,占68.3%,平均预报TS评分为23.3%。
总结雷暴存在空漏报的原因,首先是一些站点存在漏测缺测,使得回归建模样本中的雷暴样本数少于实际发生样本数,影响了预报效果;其次,天气分型过程中漏报的区域雷暴日致使单个站点上产生一部分漏报;再次,由于站点数据是通过格点数据插值得出的,其准确性不如实际探空资料,对预报效果也有较大的影响。因此在今后预报中,还需将更多与雷暴有密切关系的物理参数引入事件概率回归模型,提高准确率,最终集合西北地区东部所有站点的预报结果得到该区域雷暴落区预报。
4小结
(1)西北地区东部雷暴频发的区域为青藏高原东北边坡地带,最少的区域为北部荒漠地带与东部平原地带,45%的站点年均雷暴日数在5~10 d之间。
(2)前期天气分型过程剔除了一部分未发生雷暴的样本,使得逐步回归建模的总样本数明显减少,有效地提高了预报准确率。
(3)基于NCEP/NCAR 再分析资料计算的物理量与雷暴有无事件相关性较好,对24 h概率回归方程方差贡献较大,一些因子对雷暴发生具有较好的指示意义。
(4)2008~2012年回代预报平均TS评分为24.2%,83.3%的站点TS评分超过20%;2013年试预报平均TS评分为23.3%,68.3%的站点TS评分超过20%,雷暴发生较多的站点预报效果更好。
(5)先进行雷暴天气型判别,再通过事件概率回归建立单站雷暴预报模型,该方法简便、客观,实现了多个站点同时进行雷暴预测,能够有效地应用在气象台站的实际业务当中。
参考文献:
[1] 胡邦辉,袁野. 基于贝叶斯分类方法的雷暴预报[J]. 解放军理工大学学报:自然科学版,2010,11(5):578-584.
[2] 田琨,郭凤霞. 南京地区雷暴活动强度潜势预报[J]. 气象科技,2013,41(1):177-183.
[3] 熊亚军,廖晓农,于波,等. 基于天气分型的北京地区雷电潜势预报预警系统[J]. 灾害学, 2012, 27(2):67-71.
[4] 刘宸钊,裴军林,汪正林,等. 对流参数主分量旋转法在西昌地区雷暴预报中的应用[J]. 成都信息工程学院学报,2014,29(3):322-328.
[5] 陈勇,匡方毅,肖波. 基于Web GIS的长沙市雷暴天气短期预报模型的研究与应用[J]. 暴雨灾害,2008,27(3):258-263.
[6] 陈勇伟,郑涛,王汉堃,等. 基于BP神经网络模型的雷电潜势预报[J]. 干旱气象,2013,31(3):595-601.
[7] 冯民学,周俊驰,曾明剑,等. 基于对流参数的洋口港地区雷暴预报方法研究[J]. 气象,2012,38(12):1515-1522.
[8] 秦春明,尚可政,王式功. 辽宁葫芦岛1~10 d雷暴天气预报方法[J]. 干旱气象,2012,30(2):192-201.
[9] 孙翠梅,沈兴建,钱鹏,等. 镇江雷暴气候特征及天气学预报方法分析[J]. 气象与环境科学,2014,37(3):8-13.
[10] 郝莹,姚叶青. 基于对流参数的雷暴潜势预报研究[J]. 气象,2007,33(1):51-56.
[11] 王新敏,张霞. T213/T639数值产品在河南省雷电潜势预报中的释用[J]. 气象,2011,37(5):576-582.
[12] 陈秋萍,冯晋勤,李白良. 福建强天气短时潜势预报方法研究[J]. 气象,2010,36(2):28-32.
[13] 赵培娟,吴蓁,郑世林,等. 河南省强对流天气诊断分析预报系统[J]. 气象,2010,36(2):33-38.
[14] 纪晓玲,胡文东,穆建华,等. 基于相似预报法的宁夏雷电潜势预报业务系统[J]. 气象科技,2012,40(2):304-309.
[15] 梁维亮,屈梅芳. 广西雷暴天气预报指标研究[J]. 气象研究与应用,2014,35(3):15-19.
[16] 曾淑玲,巩崇水,赵中军,等. 动力—统计方法在24小时雷暴预报的应用[J].气象,2012,38(12):1508-1514.
Probability Forecast Method of Thunderstorm in East Region of Northwest China Based on Stepwise Regression Analysis
KONG Debing1,2, SHANG Kezheng1, WANG Shigong1, ZHAO Wenjing1, YE Wei2
(1.KeyLaboratoryofSemi-AridClimateChangeofMinistryofEducation,CollegeofAtmosphericSciences,LanzhouUniversity,Lanzhou730000,China;2.TheMeteorologicalObservatoryofPLA95605Unit,Chongqing402361,China)
Abstract:Based on the weather circumstances data of 60 meteorological sites in east region of Northwest China during 2008-2013 and convective parameters calculated from NCEP/NCAR data, the thunderstorm weather circumfluence types were classified, the samples that did not conform to the thunderstorm weather types were eliminated firstly, then the event probability regression method was used to set up the April-October 24 h thunderstorm potential forecast formulas, and on this basis, the thunderstorms occurring in 2013 were forecasted. The results are as follows: (1) Thunderstorms mostly occurred in the northeast slope of the Qingzang Plateau and rarely occurred in the Gobi Desert in the north and the Central Shaanxi Plain in the east, and the annual average thunderstorm days were five to ten days in 45% sites of all sites in east region of Northwest China. (2) In the thunderstorm weather circumfluence classification processes, a lot of samples in which thunderstorms did not happen were successfully reduced in order to improve forecast precision. (3) The meteorological convective parameters calculated from NCEP/NCAR data were highly related to the occurrence of thunderstorms and had a larger variance contribution to the thunderstorm potential formulas. (4) The average TS score for 60 sites during 2008-2012 was 24.2%, and the average TS score for 60 sites in 2013 was 23.3%. The thunderstorm potential formulas had better forecast effect on sites where more thunderstorms happened. The forecast result is reasonable and can provide reference for the study of thunderstorm in east region of Northwest China.
Key words:thunderstorm; stepwise regression; probability forecast
中图分类号:P446
文献标识码:A
文章编号:1006-7639(2016)-01-0181-07
doi:10.11755/j.issn.1006-7639(2016)-01-0181
作者简介:孔德兵(1990-),男,甘肃通渭人,硕士研究生,研究方向为现代天气预报技术和极端天气气候.E-mail: 540343856@qq.com通讯作者:尚可政(1960-),男,甘肃景泰人,博士,硕士生导师,主要从事干旱气候和现代天气预报技术和方法研究.E-mail:shangkz@lzu.edu.cn
基金项目:国家公益性(气象)行业专项项目(GYHY201206004、GYHY201306047)和兰州大学中央高校基本科研业务费专项(lzujbky-2013-m03)共同资助
收稿日期::2015-03-23;改回日期:2015-04-13
孔德兵,尚可政,王式功,等.基于逐步回归分析的西北地区东部雷暴概率预报方法研究[J].干旱气象,2016,34(1):181-187, [KONG Debing, SHANG Kezheng, WANG Shigong, et al. Probability Forecast Method of Thunderstorm in East Region of Northwest China Based on Stepwise Regression Analysis[J]. Journal of Arid Meteorology, 2016, 34(1):181-187], doi:10.11755/j.issn.1006-7639(2016)-01-0181