基于聚类的时空轨迹特征挖掘
——以中尺度涡轨迹为例

2022-09-02 02:47杜艳玲刘江勇贺琪苏诚黄冬梅
海洋预报 2022年4期
关键词:中尺度旋涡涡旋

杜艳玲,刘江勇,贺琪,苏诚,黄冬梅,3

(1.上海海洋大学信息学院,上海 201306;2.自然资源部东海预报中心,上海 200136;3.上海电力大学,上海 200090)

1 引言

海洋中尺度涡流场以绕一中心点旋转为特征,呈现非规则的三维螺旋状结构,并保持快速的水平与垂向移动[1-4],空间尺度在50~300 km 之间,时间尺度一般在数周至数个月。中尺度涡在热量、动能、碳和营养盐等重要气候示踪物的水平运输和垂向交换中扮演着重要角色,因此,研究中尺度涡的时空分布特征和移动模式对于更好地理解全球物质和能量的收支具有重要意义。

当前,对于海洋中尺度涡的自动识别、轨迹追踪和时空特征分析已有较丰富的研究。海洋中尺度涡轨迹特征分析与移动模式研究大致可分为两类。一类是基于海洋物理要素场,如海表面温度、流场和海表面高度等数据分析中尺度涡轨迹的特征和移动模式[2-6]。Chelton 等[7-8]对全球大空间尺度和长生命周期的中尺度涡进行了较全面的分析,发现反气旋的生命周期更长,移动距离更远;Zhuang等[9]分析了南海海平面中尺度涡的年平均标准偏差、移动速度和季节变化,发现吕宋海峡西北部条带中的中尺度涡主要向西南方向移动,西南部的中尺度涡主要朝经线方向移动;杜云艳等[10]将海表面高度与海表面温度和表层海流场相结合,分析了中尺度涡的移动过程;郑聪聪等[11-12]探讨了北太平洋中尺度涡的高发区和高发季节;徐茗等[13]对短生命周期海洋中尺度涡进行时空特征分析,证明其与大洋环流系统密切相关。另一类是利用聚类方法对特定区域的中尺度涡轨迹模式进行挖掘分析。吴笛[14]将轨迹聚类方法引入海洋中尺度涡的研究中,探讨了中尺度涡的时空移动规律;Yang 等[15]使用模糊C 均值聚类(Fuzzy C-Means algorithm,FCM)的方法对南海热带气旋进行聚类,分析了中尺度涡对热带气旋的影响;莫洋等[16]提出了一种海洋中尺度涡移动特征的网格区域化方法,采用基于平均邻接的层次聚类和基于模块度的划分步骤,实现了南海中尺度涡移动模式的区域划分;孙勇等[17]对图同构算法VF2 进行改进,将空间信息融入图节点中,发现了南海复杂轨迹之间相似的聚集模式;Wang等[18]在文献[17]的基础上,提出了基于结构演化的周期性模式挖掘算法,探讨了不同区域中尺度涡的不同演化模式。

准确的海洋中尺度涡轨迹研究是分析其轨迹特征和时空模式的关键,是研究其对海洋资源分布和海洋生态环境变化影响的基础。对中尺度涡轨迹进行聚类分析,才能获得对影响南海的中尺度涡轨迹特征更全面的理解。然而,受限于遥感观测技术,目前中尺度涡轨迹研究主要存在两个局限:其一,对中长生命周期的中尺度涡时空轨迹挖掘研究较少;其二,针对不同类簇的中尺度涡轨迹之间的异同性探讨研究有限。本文采用轨迹密度聚类方法对南海中长生命周期的中尺度涡轨迹进行聚类,分析比较了正反中尺度涡轨迹时空特征,以及不同类簇之间的差异性。

经统计数据分析发现,生命周期大于27 d 的中尺度涡数量突增,因此,本文将中长生命周期中尺度涡轨迹定义为生命周期大于27 d 的中尺度涡轨迹,文中所提及的中尺度涡轨迹指的都是中长生命周期。

2 数据与方法

2.1 数据

实验数据来源于法国AVISO(Archiving,Validation,and Interpretation of Satellite Oceanog raphic)提供的资料。该资料由TOPEX/Poseidon、Jason-1、Jason-2 和Environment Satellite(Envisat)数据融合而成,时间分辨率为1 d,空间分辨率为0.25°×0.25°。数据包含了轨迹ID、经纬度、振幅、半径、速度和涡旋类型等特征,其中速度指的是旋转速度,具体定义见文献[7]附录。使用Mason 等[19]提出的算法,提取出1993 年1 月1 日—2019 年12 月31 日南海(0°~25°N,100°~122°E)的中尺度涡轨迹,并对不同长度生命周期的轨迹数量进行了统计(见表1)。

表1 不同生命周期涡旋轨迹的数量/条数Tab.1 Eddy trajectories numbers of different lifetime

根据对中尺度涡轨迹的统计分析,得到生命周期超过27 d 并且小于60 d 的中尺度涡涡旋轨迹的数量占比达到67.07%,生命周期超过60 d 的数量占比为30.54%。无论是气旋涡还是反气旋涡,中长生命周期的中尺度涡轨迹都占据了绝大部分比重,肯定了本文研究中长生命周期中尺度涡轨迹的价值。因此,我们选取南海海域1 630 条(气旋涡轨迹866条,反气旋涡轨迹764条)中长生命周期的中尺度涡轨迹开展研究。

2.2 轨迹密度聚类方法

轨迹密度聚类方法既考虑了多条轨迹的相似子轨迹,又显示了轨迹间的差异性,能够有效地挖掘出中尺度涡轨迹特征。本文将中尺度涡原始轨迹按照时间节点分割成若干子轨迹,然后在基于密度聚类的原理上对子轨迹进行聚类分析,从而挖掘出中尺度涡轨迹特征。

对于点与点之间距离的度量,最常用的距离函数是欧氏距离。为了衡量线段与线段间的相对位置关系,欧氏距离定义了垂直距离、平行距离和角距离,将三者按照不同的权重进行求和,得到线段与线段之间的距离。具体定义在文献[20]中已给出,本文不再赘述。

基于线段密度的轨迹聚类算法就是在轨迹集合T中找到每个类簇的最大集合,然后在集合中计算出一条轨迹代表该类簇的整体移动轨迹。计算类簇的代表轨迹要给出相应的参数半径ε和最少线段数MinLns。图1 给出了生成类簇代表轨迹的事例。代表轨迹为:

式中,pi点是由扫描线方法确定的。沿着类簇的主轴方向横扫垂直线并计算穿过横扫线的线段数,如果穿过的线段的个数等于或大于MinLns,则取这些点的平均值作为代表轨迹的点,小于MinLns的,选择跳过当前点(见图1 中5、6 位置),如果两个点位置比较近,则选择跳过比较近的点来生成代表轨迹点(见图1中3位置)。

图1 一个簇及其代表轨迹的例子Fig.1 An example of a cluster and its representative trajectory

2.3 类簇数量选择

确定最优类簇数量是聚类分析的核心问题。在轨迹密度聚类中,参数ε不宜过小,MinLns不宜过大,在选择参数ε时,使用信息熵(entropy)[20]来表示,利用启发式算法确定参数ε的范围。图2分别给出了气旋涡和反气旋涡的参数ε与信息熵的关系。

图2 参数ε和信息熵的变化关系Fig.2 The variation relationship between the parameter and information entropy

在信息熵相对较小的对应的参数ε范围内,调整参数MinLns确定最终的类簇数量,最终得到气旋涡轨迹和反气旋涡轨迹的参数ε和MinLns都为0.54和9。

中尺度涡轨迹密度聚类过程中存在噪声轨迹,即不属于气旋涡或反气旋涡的任何一类,在轨迹划分类别时,将该类轨迹不划分为任何一类。此外,由于中尺度涡在生命周期中变化剧烈,尤其是对于生命周期较长的中尺度涡,不同的轨迹段特征存在显著差异,此时,如果一条轨迹划分的段数在某一类中较多,则把整条轨迹划分到该类。

3 结果与讨论

3.1 中尺度涡轨迹聚类结果分析

图3展示了气旋涡轨迹和反气旋涡轨迹的轨迹密度聚类结果,其中,浅蓝色和浅红色的细线分别为气旋涡和反气旋涡原始轨迹,蓝色和红色的线段为每一类簇的代表轨迹。图3a 把南海气涡旋轨迹划分为5 类,分别标记为类A、类B、类C、类D 和类E,3个较大的类A、B、C分别位于南海西北部、南海中东部和越南东南部,另外两个较小的类D、E 分别位于马来西亚东北部和婆罗洲西北部。图3b 把南海反气旋涡轨迹划分为4类,分别标记为类A、类B、类C 和类D,其中类D 相对较小,位于马来西亚东北部。

图3 轨迹密度聚类结果Fig.3 The result of density clustering of trajectories

气旋涡和反气旋涡的类A、类B、类C和类D的空间分布大体一致,但是气旋涡轨迹中的类E与其他类有显著的不同。在空间范围内(3°~9°N,110°~115°E),反气旋涡轨迹杂乱,而气旋涡轨迹则较密集,尽管类E 占据的气旋涡轨迹的数量比重相对较小,但是该处的中尺度涡轨迹的平均长度较大,轨迹长度相对稳定。

表2 和表3 分别列出了两种中尺度涡轨迹长度和不同类簇中尺度涡轨迹的占比。表2 显示,随着纬度增加,不同类簇气旋涡轨迹的平均长度不断减小,尽管反气旋涡轨迹整体上也表现出这一特性,但是部分仍存在一定的差异。例如,反气旋涡轨迹类A 的平均长度大于类B。另外,空间上位于南海北部的类A 和越南东南部的类C,其气旋涡轨迹的平均长度都大于反气旋涡轨迹,但是整体可以看到反气旋涡轨迹的标准偏差更大,即反气旋涡轨迹的波动范围更大,轨迹长度的大小更易受地理位置影响。

表2 不同类中尺度涡轨迹的长度(单位:km)Tab.2 The length of trajectories of the mesoscale eddy in each category(unit:km)

从表3可以看出,不论是气旋涡还是反气旋涡,不同类簇轨迹数量都在类A 处达到峰值,在空间位置3°~8°N,104°~107°E 上的数量相对较少,分别占比1.49%和3.95%。另外,整个南海气旋涡轨迹的数量多于反气旋涡轨迹的数量。

表3 不同类中尺度涡轨迹的数量和相对于总中尺度涡轨迹数的比例Tab.3 Number of trajectories of mesoscale eddy in different classes and the proportion relative to the total trajectories number of mesoscale eddy

利用聚类结果,我们详细计算了特定区域的涡旋轨迹数量和平均长度,分析比较后得出结论:不同类簇轨迹的数量随着纬度的增加而不断增加,轨迹的平均长度随着纬度的增加而不断减小。尽管整体在空间位置的分布上呈现一致性,但是不同的类别也存在差异,这些差异性将在下面章节中进行讨论。

3.2 不同类中尺度涡轨迹特征

图4a 为不同类中尺度涡轨迹的振幅分布。从图中可以看出,气旋涡轨迹在越南东南部类C 的振幅分布范围更广泛,中位数和平均值相对较大,平均值达到0.08 m;类D 和类E 占据中尺度涡轨迹的数量较少,且振幅相对较小,类D 的振幅平均值为0.035 m;除了类C 外,气旋涡轨迹的振幅随着纬度的增加而递增,类A 的异常振幅数据最多,即在该处中尺度涡轨迹的振幅变化更大。反气旋涡轨迹也是越南东南部类C 的振幅分布范围较大,平均值达到0.07 m,而位于马来西亚东北部的类D 振幅相对较小。对比气旋涡轨迹和反气旋涡轨迹,两者的振幅都是随着纬度的增加而递增,纬度越高振幅变化越大。

图4 气旋涡轨迹特征(左列)和反气旋涡轨迹特征(右列)Fig.4 The trajectory characteristics of cyclonic(left)and anticyclonic(right)

图4b为不同类中尺度涡轨迹旋转速度的分布。从图中可以看出,位于越南东南部的反气旋涡轨迹类C 的速度分布范围更广,轨迹速度平均达到0.4 m/s,位于南海中部的类B 中尺度涡轨迹的旋转速度平均值最小。空间位置一致的反气旋涡轨迹的速度与气旋涡轨迹分析结果具有一致性。两种轨迹的旋转速度在南海中部都相对较小,从南海中部到北部,随着纬度的增加,开始出现一些旋转速度波动较大的中尺度涡轨迹,两种中尺度涡轨迹的旋转速度相差较小。

图4c 为不同类中尺度涡轨迹半径的分布。从图中可以看出,尽管位于马来西亚东北部的类D 的轨迹数量较少,但是该处轨迹的平均半径相对较大,而位于南海北部的类A 的平均半径最小,此外类C的平均半径分布范围较广泛。位于越南东南部的类C的轨迹平均半径较大,达到140 km,除了类C外,反气旋涡轨迹的平均半径随着纬度的增加而不断减小。整体而言,两种中尺度涡轨迹的平均半径都随着纬度的增加而不断减小,但两者存在一定的差异,在空间位置4°~7°N,104.5°~107°E 上,气旋涡轨迹的平均半径更大。

相较已有的研究,我们详细讨论了涡旋轨迹的特有属性,包括振幅、旋转速度和半径,并对其差异性进行了探讨。研究发现除了位于越南东南部的类C 外,南海两种中尺度涡轨迹随着纬度的增加振幅增大,而旋转速度和半径都呈现递减趋势,两种轨迹在振幅、旋转速度和半径上整体相差较小。而位于越南东南部的类C 的轨迹更复杂,振幅、旋转速度和半径都表现出显著的差异性,验证了文献[18]的结论。

3.3 不同类中尺度涡季节分布

经统计,我们给出了春(3—5月)、夏(6—8月)、秋(9—11 月)、冬(12 月—翌年2 月)四季的中尺度涡轨迹数量分布(见图5)。就气旋涡轨迹而言,位于马来西亚东北部的类D 轨迹主要分布在冬季,类E 与类D 则相反,在冬季的气旋涡轨迹的数量较少,位于越南东南部的类C 轨迹在夏季相对较少,类A和类B 四季分布较均匀,没有明显差异。图5 显示,反气旋涡轨迹的类D 在夏季更易出现,而位于越南东南部的类C 在冬季的轨迹数量较少,对于南海中部的类B,反气旋涡轨迹的数量从夏季到秋季递减,直到12月轨迹数量才增加,南海北部的类A 中尺度涡轨迹分布相对较均匀。

图5 不同类的中尺度涡轨迹数量Fig.5 Numbers of mesoscale eddy trajectories in each category

对比两种中尺度涡轨迹的季节分布结果,可以看出位于越南东南部的类C和位于马来西亚东北部的类D,气旋涡轨迹和反气旋涡轨迹呈现相反的表现,气旋涡易出现在春冬季,反气旋涡更易出现在夏秋季;类B的反气旋涡轨迹在夏秋季节递减,而气旋涡轨迹分布较均匀;处于南海北部的类A 由于距离台湾海峡和巴士海峡较近,处于半开放海洋区域,全年易受影响,所以气旋涡和反气旋涡的季节分布差异较小。

我们对气旋涡轨迹和反气旋涡轨迹的季节分布进行分析,比较两种类型的中尺度涡轨迹后发现,南海南部气涡旋轨迹在春冬季较多,反气旋涡轨迹在夏秋季较多,南海中部和北部中尺度涡轨迹的季节分布差异较小。

3.4 不同类中尺度涡生成和消亡位置分布

从图6 可以看出,中尺度涡轨迹的类D 生成位置集中在4.5°~6.5°N,105°~107°E;气旋涡轨迹和反气旋涡轨迹的类A和类B的生成位置表现出一致性,分别集中在台湾南部和吕宋岛西南部;越南东南部的类C轨迹的生成位置略有不同,气旋涡轨迹主要集中在9°~11°N,110°~111.5°E 和10°~11°N,113°~114°E,反气旋涡轨迹集中在8.5°~10°N,110°~111°E,气旋涡轨迹的类E 的生成位置位于婆罗洲海岸的西北部。整体上,两种中尺度涡轨迹的生成位置具有一致性。

图6 中尺度涡生成位置Fig.6 The locations of the mesoscale eddy generation

图7为两种中尺度涡轨迹的消亡位置。从图中可以发现,两种中尺度涡轨迹的类D 相对于生成位置都向西移动;类A 的两种轨迹集中在两个位置,分别为20°~22°N,117°~119°E 和海南岛的东南部;类C表现出一定的差异性,气旋涡轨迹的消亡位置主要位于9°~11°N,110°~112°E,反气旋涡轨迹主要集中在5°~9°N,109°~110°E;由于轨迹密度聚类在划分归属类簇阶段抛弃了部分噪声轨迹,导致两种轨迹的类B 的消亡位置表现出了差异性,但整体都是自东向西移动;气旋涡轨迹的类E 的消亡位置主要集中于6°~8°N,111°~113°E。整体上,两种中尺度涡轨迹的消亡位置表现出了一致性。

图7 中尺度涡消亡位置Fig.7 The locations of the mesoscale eddy decay

我们对气旋涡轨迹和反气旋涡轨迹的生成位置和消亡位置进行了分析比较,发现两者都表现出了一致性,位于南海中部的中尺度涡向西移动,南海北部即吕宋岛西北部存在着向西北移动的中尺度涡轨迹,而其余地区轨迹自东北向西南移动。

4 结语

本文对南海涡旋轨迹进行了统计分析,分析结果表明97%的涡旋轨迹属于本文所定义的中长生命周期涡旋轨迹,相较已有研究更具有全面性。现有研究[21-23]仅从数量和季节对涡旋进行讨论,而本文将完整的涡旋轨迹作为研究重点,详细探讨了涡旋轨迹不同生命阶段的特征。

本文采用轨迹密度聚类方法对1993年1月1日—2019 年12 月31 日南海中长生命周期中尺度涡轨迹进行分析,把气旋涡轨迹划分为5类,把反气旋涡轨迹划分为4 类。在特定分布区域上,两种中尺度涡轨迹呈现出一致性,主要分布在南海北部、南海中部、越南东南部以及马来西亚东北部,但区域性特征仍存在差异,我们对差异性原因进行了进一步探讨。结论如下:

(1)南海北部涡旋轨迹数量较多,平均长度较短,南海南部呈现与北部相反的现象。

(2)两种中尺度涡轨迹在越南东南部的类C 中表现出鲜明的差异性,该处中尺度涡轨迹更为复杂,进一步验证了文献[18]的分析结果。

(3)两种中尺度涡轨迹数量均在中国南海北部达到峰值,除位于越南东南部的类C外,随着纬度的增加,不同轨迹类别的平均振幅增大,而平均旋转速度和平均半径都呈现递减趋势。

(4)南海南部春冬季气旋涡较多,反气旋涡更易出现在夏秋季。但在南海北部,由于距离台湾海峡和巴士海峡较近,属于半开放区域,中尺度涡的季节分布差异较小。

(5)从生成位置和消亡位置上看,两种中尺度涡轨迹都产生于南海东部海岸附近,消亡于南海西部海岸附近,位于南海中部的中尺度涡向西移动,南海北部即吕宋岛西北部存在着向西北移动的中尺度涡轨迹。

本文采用密度轨迹聚类方法对南海中尺度涡轨迹进行分析,挖掘出该海域中尺度涡轨迹存在的显著的区域性特征,并分析比较了特定区域内特有的时空特性,为开展南海涡旋轨迹研究提供了参考。对于其在各区域的形成机制,则需要结合具体的海洋物理特性开展进一步的研究与探讨。

猜你喜欢
中尺度旋涡涡旋
简谐与光晶格复合势阱中旋转二维玻色-爱因斯坦凝聚体中的涡旋链*
基于热力学涡旋压缩机涡旋盘的结构设计优化
基于PM算法的涡旋电磁波引信超分辨测向方法
涡旋压缩机非对称变壁厚涡旋齿的设计与受力特性分析
四川盆地极端短时强降水中尺度对流系统组织类型
甘南高原一次副高外围型局地暴雨环流形势分析
基于高分辨ROMS模式的黑潮延伸体次中尺度涡各向异性析分
大班科学活动:神秘的旋涡
山间湖
2016年7月11至13日日喀则市一次强降水天气过程分析