聚类算法在四个超级单体强对流过程雷电预警中的应用

2024-06-03 18:21:47黄毅候玉芳赵泽栖
现代信息科技 2024年6期

黄毅 候玉芳 赵泽栖

收稿日期:2023-08-01

基金项目:邢台市重点研发计划自筹项目(2021ZC038)

DOI:10.19850/j.cnki.2096-4706.2024.06.031

摘  要:选取2020年5月3日邢台出现四个超级单体的强对流过程,以6分钟的间隔对三维闪電数据进行划分,使用DBSCAN聚类算法删除离散点,使用K-means聚类算法对三维闪电数据进行聚类分析。选取轮廓系数最大的K值,并与雷达回波拼图数据进行对比,识别四个超级单体并计算聚类中心和聚类最大半径,使用趋势外推法对四个超级单体的运动轨迹进行预测。分析表明:DBSCAN聚类算法可以有效删除离散点,操作性强;四个超级单体的K-means算法聚类中心和30 dBZ以上的强回波区域一致性较好,可以获取聚类中心运动轨迹和聚类最大半径;使用临近三个时次数据进行趋势外推,MSE最小,该方法对雷电预警信号发布有参考价值。

关键词:DBSCAN;K-means;三维闪电;强回波区;趋势外推法

中图分类号:TP391    文献标识码:A  文章编号:2096-4706(2024)06-0145-04

Application of Clustering Algorithm in Lightning Early Warning for Four Supercell Strong Convective Processes

HUANG Yi, HOU Yufang, ZHAO Zexi

(Xingtai Meteorological Bureau, Xingtai  054099, China)

Abstract: It selects four supercell strong convective processes that occurred in Xingtai on May 3, 2020, the three-dimensional lightning data is divided at 6 minutes intervals. The DBSCAN clustering algorithm is used to remove discrete points, and the K-means clustering algorithm is used to perform clustering analysis on the three-dimensional lightning data. It selects the K value with the highest contour coefficient and compare it with the radar echo mosaic data to identify four supercells and calculate the clustering center and clustering maximum radius. Trend projection is used to predict the motion trajectories of the four supercells. Analysis shows that the DBSCAN clustering algorithm can effectively delete discrete points and has strong operability. The K-means algorithm for four supercells has good consistency in clustering centers and strong echo areas above 30 dBZ, and can obtain the movement trajectory of clustering centers and the maximum radius of clustering. Using data from nearly three time periods for trend projection, with the minimum MSE, this method has reference value for the release of lightning early warning signals.

Keywords: DBSCAN; K-means; three-dimensional lightning; strong echo area; trend projection

0  引  言

雷电预警在雷电灾害防范中发挥着重要作用。2022年,河北省突发事件预警信息发布平台发布预警信息38 117条,其中雷电预警信号发布量占27.95%,排名第二。目前,河北省已部署11台雷电观测设备,完成了覆盖全省的闪电定位仪监测网建设。为避免强对流天气中出现雷雨大风、冰雹、短时强降水等灾害,升级全闪电定位探测站,新建甚高频闪电测绘阵列。

于涵等[1]利用基于BLNet的全闪三维定位和多普勒天气雷达资料,分析了2015至2017年北京暖季7次强飑线过程的闪电活动与雷达回波强度之间的关系,分析结果表明,闪电主要发生在前部线状对流云区内,且集中分布在30 dBZ以上的强回波区域,小部分闪电分布在后部的层状云区域内。候荣涛等[2]使用IDBSCAN改进聚类算法进行闪电聚类分析。王力艳等[3]对一次飑线过程中闪电活动与雷达回波特征进行分析,地闪主要发生在大于30 dBZ的雷达回波内,在40 dBZ以上的强回波中心最为密集,且地闪密集区并不是发生在雷达回波最强盛的时期,而是紧随其后。阮悦等[4]对冰雹云三维闪电及双偏振雷达回波特征进行分析,分析结果表明,闪电频数、正地闪或正地闪占比率与回波强度、最强回波高度、强回波伸展高度呈正相关。

闪电定位数据分为三维闪电定位数据(VLF/LF)和二维闪电定位数据(ADTD),卜俊伟等[5]对四川省云地闪和三维闪电检测系统进行了对比,结果表明三维闪电检测系统所检测的数据量明显高于云地闪系统,三维闪电系统的检测数据量是云地闪观测系统的2倍多。余蓉等[6]对湖北省两套闪电定位网的地闪进行对比,三维闪电定位网的探测灵敏度和探测效率明显高于二维闪电定位网,前者探测到的闪击总数约为后者的2.3倍,且能够探测到更多偏弱的正闪击,闪电强度也更为集中。成勤等[7]通过一次特大暴雨过程对三维闪电系统和二维闪电系统的闪电特征进行对比分析,三维闪电系统的地闪密度大于二维闪电系统。马强[8]对VLF/LF型闪电定位仪的三维闪电数据和ADTD型闪电定位数据进行了对比,VLF/LF型闪电定位仪在低电流地闪观测精度、云闪观测精度等方面均优于ADTD型闪电定位仪。

考虑到雷暴中心和30 dBZ以上强回波区域对应关系的复杂性,本文利用三维闪电数据进行聚类分析和趋势外推,结合雷达回波拼图数据对雷暴中心运动轨迹进行研究。

1  雷电预警信号检验

雷电预警信号检验为不分级检验,即检验雷电预警信号的准确性和时效性。准确性为通过雷电预警信号的正确、空报、漏报次数计算TS评分、空报率、漏报率、命中率。时效性为通过预警信号的发布时间和预警信号对应的灾害性天气出现时间计算预警信号提前时间(分钟),评定统计准确预警的时间提前量(T1)、预警的时间提前量(T2)、有效预警的时间提前量(T3)。在实际工作中,发布雷电预警信号可以参考雷达回波、10分钟闪电分布数据和10分钟闪电密度数据,基本上是出现了雷电或者即将出现雷电时才发预警,所以时间提前量(T2)很小甚至没有。

2  天气实况及强对流过程分析

2020年5月3日18时至22时,邢台市大部分地区出现雷阵雨天气,降水区平均降水量达到7.5毫米,宁晋、清河、巨鹿、南宫、隆尧局地出现大雨;宁晋、巨鹿、南宫、新河、平乡、威县、广宗、清河、临西出现冰雹;清河、临西、邢台皇寺出现8级瞬时大风。

此次天气状况受低槽切变线的影响,地面有冷锋配合,3日08时,500 hPa我省北部受短波槽影响,温度场落后于高度场,天气系统向东南方向移动,并逐渐发展加强,南部有一短波槽快速划过;700 hPa和850 hPa邢台市受反气旋式环流控制,天气晴好,利于辐射增温;850 hPa吉林西部有一低涡,低涡的冷式切变从吉林、内蒙古、河北省西北部延伸到山西、陕西北部,河南省有一暖中心,邢台市受暖气团控制,回温明显,地面有一个热低压区,当日邢台市东部地面气温达到33~35 ℃,为强对流的发生提供能量条件,随着系统东移南压,触发强对流天气。

在强对流期间有四个超级单体生成,自东向西记为A、B、C、D。单体A在西北气流的引导下向东南传播,在对流天气发生前(3日白天8到19时),邢台市中部自北向南从宁晋、新河到南和、平乡一直有地面辐合线稳定维持。辐合线东侧为偏东风,西侧为偏北风。19:30时单体A中心位于辛集北部,随着引导气流流向邢台市宁晋,20时单体A在向东南移动的过程中,在其西南侧,单体出流与前期稳定维持的地面辐合线相遇,在辐合线上触发新的单体。多个被触发的新单体与单体A呈东北-西南向线状排列。

通过对邯郸雷达风廓线产品的分析得出,新单体触发阶段(20:00—21:30)在0.3~0.9 km高度维持着东北风到偏南风,在0.9~1.2 km高度维持着偏东风到东南风。由此可见,在此期间有新单体在老单体西南侧不断出现,但底层入流方向以偏东风为主,老单体的入流没有被新单体切断,使老单体维持较长时间。从0.3~3 km的垂直风随时间变化来看,此阶段0.3 km高度维持东北风4~6 m/s,3 km高度维持西南风且风速随时间逐渐增大,风速为10~24 m/s,说明0.3~3 km的垂直风切变不断增大,且维持较强的低层垂直风切变环境,垂直风切变矢量顺时针旋转,利于对流单体的组织和增强,最终在我市东部形成线状排列的4个超级单体。

在雷电预警信号发布中,临城与南和出现闪电定位数据,但未给出雷电预警,为漏报;其他县局发布预警时间晚于闪电定位数据出现时间,时间提前量(T2)为0。

3  超级单体运动轨迹分析

21:18时,在邢台东部出现4个超级单体,并持续5个体扫。19:48时单体A反射率因子在宁晋东北部超过65 dBZ,有回波悬垂,且55 dBZ以上的强回波伸展至-20℃等温线高度以上,存在弱回波区,回波前缘探测到中尺度气旋,即已达到超级单体风暴强度。19:56时宁晋四芝兰区域出现八级大风,20:00时左右宁晋东北部乡镇观测到冰雹,反射率因子随高度向入流一侧倾斜,持续时间(19:30—20:48)较长,表明单体发展旺盛,20:30时开始对新河造成影响,单体A移动过程中,其出流与辐合线的移动较为一致。20:00时单体B由单体A出流在宁晋县中部触发,先沿东北向移动再沿东南向移动,20:51时新河国家站降雹,南宫大范围降雹,持续时间大约10分钟。20:12时单体C由单体A出流在隆尧县北部触发,先沿东北向移动再沿东南向移动,20:54时巨鹿、广宗、威县、清河、临西先后降雹。20:42时单体D受地面辐合线影响,在任县中部生成并不断发展,先沿东北向移动再沿东南向移动,21:12时平乡、广宗、威縣、临西先后降雹。

4  DBSCAN聚类算法删除离散点

周明薇等[9]在利用闪电定位和雷达资料对邵阳地区雷电预报预警的研究中指出:一个雷达体扫时间内出现3次以上的地闪视为一个雷暴单体,其余则为非雷暴单体。在实际的数据处理中,采取这种方法删除离散点存在问题,因其没有给出删除3次及3次以下地闪数据的半径范围。DBSCAN是基于密度的聚类方法,具有2个参数,分别为邻域半径(Eps)和最少点数目(min_samples),合理设置这两个参数可以有效删除离散点。

如图1所示,从左到右分别为20200503111200(世界时)三维闪电定位数据散点及聚类中心图和经过DBSCAN聚类算法删除离散点后的聚类中心图。聚类中心以X点显示,在左图中东北方向出现2个离散点,如果直接使用K-means聚类算法进行聚类,轮廓系数最大值对应的聚类中心(X点)位于东北方向两个离散点的中间位置,在使用DBSCAN算法删除离散点后,K-means聚类算法获得两个聚类中心,两个聚类中心的位置关系和雷达回波拼图中大于30 dBZ的强回波区域一致。

(a)删除离散点前K-means聚类中心图

(b)删除离散点后K-means聚类中心图

图1  20200503111200(世界时)DBSCAN算法删除离散点比较图

5  K-means聚类算法提取超级单体运动轨迹

K-means聚类算法是一种迭代求解的聚类算法,具有1个表示簇个数的参数(n_clusters),模型效果评估可以通过使用样本离最近聚类中心的总和(inertias)、轮廓系数、兰德指数、同质化得分。K-means聚类算法适用于凸数据集,在此过程中,雷达回波呈现带状,即孤立的块状。

因为对流系统的生消演变规律非常复杂,使用K-means聚类算法可获取多个聚类中心位置,结合雷达回波拼图数据,识别出四个超级单体所对应的聚类中心,获得四个超级单体所对应聚类中心的运动轨迹和聚类最大半径,提取出5月3日21时12分至21时54分A、B、C、D四个超级单体对应的聚类中心和聚类最大半径,A、C超级单体对应的聚类中心为1312—1354(世界时)8组数据,D超级单体对应的聚类中心为1318—1354(世界时)7组数据,B超级单体对应的聚类中心为1324—1354(世界时)6组数据。

如图2所示,从左到右分别为1324-1330(世界时)删除离散点后的三维闪电数据K-means聚類中心图,聚类中心(X点)数量均为8个,对应的轮廓系数最大。在邢台地区,可以明显看出与ABCD四个超级单体对应的聚类中心,与雷达回波拼图中大于30 dBZ的强回波区域一致,且通过与雷达回波拼图数据的比较可以确定聚类中心的位置,计算聚类中心的经纬度和聚类最大半径。

(a)1324(世界时)K-means聚类中心图

(b)1330(世界时)聚类K-means中心图

图2  1324—1330(世界时)三维闪电数据K-means聚类中心图

如图3所示,自东向西依次为A、B、C、D四个超级单体对应的聚类中心轨迹,聚类中心以X点表示,四个超级单体主要影响的是邢台东部,A超级单体聚类中心轨迹中的前四个轨迹点呈现东南方向线性特征,第五个轨迹点呈现东北方向线性特征;B超级单体在1342—1348—1354(世界时)处呈现明显的分裂特征,选取运动方向前侧的聚类中心,B超级单体聚类中心轨迹中的前三个轨迹点呈现东南方向线性特征,第四、第五个轨迹点呈现东北方向和西北方向线性特征;C超级单体在1318—1324—1330(世界时)处呈现明显的分裂特征,同样选取运动方向前侧的聚类中心,C超级单体聚类中心轨迹点呈现东南方向线性特征;D超级单体对应的聚类中心轨迹呈现东南方向线性特征。

图3  A、B、C、D四个超级单体对应三维闪电数据聚类中心轨迹图

6  采用趋势外推法进行预测

A、B、C、D四个超级单体对应的聚类中心轨迹呈现明显的线性关系,使用趋势外推法预测下一个时次的聚类中心位置和聚类最大半径。禹振军等[10]利用趋势外推法对渔业养殖机械化水平进行趋势分析和预测。因ABCD四个超级单体的轨迹样本量较小,故采用趋势外推法对聚类中心经度、纬度和最大半径三个数据进行预测,以临近三个时次数据预测最后一个轨迹数据为例,采用sklearn的mean_squared_error方法计算MSE,计算结果如表1所示。

表1  预测结果MSE计算表

超级单体聚类轨迹 经度预测MSE 纬度预测MSE 聚类最大半径MSE

A 0.004 90 0.025 15 0.001 56

B 0.004 51 0.000 63 0.006 01

C 0.002 29 0.000 64 0.009 39

D 5.83E-09 0.000 23 0.001 39

从表1中可以看出,D超级单体对应的聚类轨迹约为直线,因此使用趋势外推法,三项MSE均为最小,A、B和C超级单体对应的聚类轨迹在最后四个轨迹点中均存在聚类轨迹的方向变化,因此经度预测MSE和纬度预测MSE较大,仅A超级单体聚类轨迹的纬度预测MSE超过0.01;ABCD超级单体聚类的最大半径序列呈现波动,因此最大半径MSE相差较大。

7  结  论

本文综合利用三维闪电定位数据和雷达回波拼图数据,对2020年5月3日邢台出现的四个超级单体的强对流过程进行分析,使用DBSCAN聚类算法,通过设定邻域半径和最少点数目两个参数来删除离散点,该方法的操作性较强;使用K-means聚类算法计算雷暴中心运动轨迹,与雷达回波拼图中30 dBZ以上的强回波区域较为一致;雷暴中心运动轨迹呈现明显的线性特征,采用趋势外推法对运动轨迹进行预测,仅A超级单体聚类轨迹的纬度预测MSE超过0.01;与10分钟闪电分布和10分钟闪电密度资料相比,减少了数据的间隔,更有利于发现雷暴中心运动轨迹的变化,后续将对更多雷暴事例,特别是弓形回波事例进行更为深入细致的研究。

参考文献:

[1] 于函,张鸿波,刘冬霞,等.飑线系统中的闪电活动与雷达回波特征的相关性研究[J].大气科学,2022,46(4):835-844.

[2] 侯荣涛,朱斌,冯民学,等.基于DBSCAN聚类算法的闪电临近预报模型 [J].计算机应用,2012,32(3):847-851.

[3] 王力艳,车向辉.一次飑线过程的闪电活动与雷达回波特征 [J].黑龙江气象,2016,33(2):13-15+21.

[4] 阮悦,黄慧琳,魏鸣,等.福建冰雹云三维闪电及双偏振雷达回波特征分析 [J].气象,2022,48(4):442-451.

[5] 卜俊伟,张琨.四川省云地闪和三维闪电监测系统对比分析 [J].农业灾害研究,2022,12(1):81-83.

[6] 余蓉,杜牧云,晏紫淙,等.湖北省两套闪电定位网地闪数据的对比分析 [J].暴雨灾害,2021,40(6):646-654.

[7] 成勤,张科杰,刘俊,等.一次特大暴雨过程三维和二维系统闪电特征对比分析 [J].热带气象学报,2021,37(3):396-408.

[8] 马强.ADTD型与VLF/LF型闪电定位数据的对比分析 [J].气象水文海洋仪器,2022,39(4):18-20.

[9] 周明薇,王道平,罗龙友,等.基于闪电定位和雷达资料的邵阳地区雷电预报预警研究 [J].气象与环境学报,2021,37(3):117-124.

[10] 禹振军,盛顺,胡浩,等.基于趋势外推法的北京市渔业机械化水平研究 [J].中国农机化学报,2023,44(6):217-223+238.

作者简介:黄毅(1983—),男,汉族,江西赣州人,工程师,本科,研究方向:大数据和机器学习。