李 杉,张 坤,水鹏朗
(西安电子科技大学 雷达信号处理国家重点实验室,陕西 西安 710071)
基于合成孔径雷达图像和逆合成孔径雷达图像的海面舰船的分类和识别已经被广泛研究,目前已有很多成熟的识别方法和技术[1-4]。由于成像需要较长的累积时间,并不适用于大片近海区域的广泛无缝监视,高分辨对海监视雷达需要对海面舰船具有“粗”分类的能力。所谓“粗”分类,就是把海面舰船按照其长度L分为大、中、小三类,常用的分类标准为:L≤69 m,为小型船;69 m
对于目标舰船,从其高分辨距离像中提取到的径向尺寸R为舰船长度L在雷达视线方向上的投影[5],航向角φ为雷达视线方向与船长方向之间的夹角,三者的关系为L=R/cosφ。文献[5-11]提供了多种雷达目标径向尺寸的估计方法,设径向尺寸估计误差为ε,则船长估计值为
(1)
对于我国近海舰船粗分类的应用,感兴趣的问题是径向尺寸估计误差在何种情况下,能够满足工程对正确分类概率的需求。该问题的解决与船长的先验概率分布密切相关,然而,公开数据中没有我国近海海域船长分布的数据和模型。针对这一问题,在两周的时间里通过中国船讯网采集了我国四大海域约30 000艘舰船的自动识别系统信息,从中提取了船长和航向角等数据;在该数据库的基础上,研究了各海域船长的统计建模问题。经对比发现,韦布尔分布模型能够很好地拟合我国近海船长分布,且各海域船长分布的参数具有明显差异。在船长分布的先验模型下,建立了基于高分辨距离像的舰船径向尺寸估计误差与舰船大、中、小正确分类概率之间的定量关系。结果表明,当舰船航向角介于±75°之间时,我国近海海域舰船的大、中、小正确分类概率达到90%的条件是,舰船径向尺寸估计误差在区间(-12.67 m,9.41 m)内。
中国近海按照地理位置自北向南分为渤海、黄海、东海、南海四大海域。渤海-黄海分界线为辽东半岛南端老铁山角至山东半岛北岸蓬莱角的连线,黄海-东海分界线为长江口北岸启东角至济州岛西南角的连线,东海-南海分界线为广东南澳岛至台湾南端鹅銮鼻之间的连线,如图1(a)所示。
图1 船讯网四大近海海域舰船信息采集示意图
数据采集基于中国船讯网的即时船舶自动识别系统(Automatic Identification System,AIS)信息[12]。采集范围为渤海整体,南海十段线以内,黄海、东海距离领海基线200海里以内的海域(即专属经济区)。由于海上舰船数量繁多,分布密集,为便于采集,将海域划分为若干网格,以网格为单位进行采集和统计,如图1(b)所示(以东海舟山群岛的一小片海域为例)。采集时间自2020年3月中旬至3月底。由于采集期间舰船的位置会动态更新,为防止重复统计,可以舰船首次出现所在的海域为准。删除重复条目,共采集了 30 584 艘舰船的AIS信息。AIS信息包括船长、船宽、类型等静态信息和吃水、经纬度等动态信息,如图1(c)所示。所采集的舰船长度范围在1~400 m。
表1列出了采集的各海域大、中、小型舰船的数目。如图2所示,东海舰船占比最高,其次是南海、黄海、渤海;小型船占73%,中型船占19%,大型船仅占8%。
图2 采集的舰船分布占比图
表1 采集的舰船数量统计 艘
将舰船AIS信息中的航向角数据映射到±90°的范围,绘制为图3所示的直方图。可以看出,φ在该区间内均匀分布。根据式(1),当φ→90°时,ε/cosφ→+∞,此时估计的值实际上是船宽,而并非为舰船的径向尺寸,船长的估计值会产生过大的绝对误差。因此,工程通常将航向角限制在±75°以内。
图3 我国近海舰船航向角分布直方图
为了能够直观地看出我国近海海域船长分布特征,以选取合适的分布模型,将采集到的船长样本数据经过处理,绘制为如图4所示的经验概率密度曲线。
图4 船长样本经验概率密度曲线
经观察,样本的经验概率密度曲线为正值的分布,具有单峰、右偏的特性,有较长拖尾,与瑞利分布、韦布尔分布、K-分布的概率密度函数曲线的特征相似。因此,拟采用这3种分布模型分别对我国近海船长分布进行拟合。此外,我国近海船长的分布可能会有一些季节性的变化,这种变化的掌握需要依靠更大量的不同时间区间的数据收集。
根据船长样本的经验概率密度曲线的特点,考虑了3种类型的常用分布:瑞利分布、韦布尔分布和K-分布。各分布的参数可以通过样本的k阶原点矩进行估计,即
(2)
(3)
其中,σ为尺度参数。随着σ的增大,f(x)曲线变得平缓,峰值变小,波峰右移,拖尾变长。该参数可以通过样本的一阶原点矩估计,其估计值的表达式为
(4)
韦布尔分布是指数分布的推广,通过尺度参数和形状参数联合控制概率密度的形状和拖尾,具有更强的数据拟合能力。其概率密度函数的表达式为
(5)
其中,σ为尺度参数,ν为形状参数。当ν=1时,其为指数分布;当ν=2时,为瑞利分布。两个参数可以通过样本的一、二阶原点矩求解非线性方程组而得到。参数估计的方程组为
(6)
其中,Γ(·)为伽马函数。非线性方程组难以获得两个参数的解析解,但可以通过数值计算方法快速求解。
另一种广泛使用的双参数分布是K-分布,其概率密度函数的表达式为
(7)
其中,σ为尺度参数,ν为形状参数,Kν-1(·)为ν-1阶的第二类修正贝塞尔函数。当ν→∞时,K-分布趋于瑞利分布。K-分布的两个参数可以通过2-4阶矩、1-2-3阶矩、分数阶矩等多种方法进行估计[13-14],其中最常用的2-4阶样本矩估计的表达式为
(8)
(9)
以渤海海域为例,使用参数估计拟合所得的3种分布的概率密度曲线与船长样本的经验概率密度曲线如图5所示。
图5 渤海海域3种分布模型的拟合效果
可以看出,韦布尔分布的拟合效果优于K-分布和瑞利分布。为了定量地对比3种分布模型对船长分布的拟合能力,采用拟合分布与经验分布之间的Kolmogorov-Smirnov(K-S)距离评价拟合的效果,K-S距离越小,则拟合质量越高。两者的K-S距离通过下式计算[15],即
(10)
其中,F0(xi)表示经参数估计拟合所得的累积分布函数,Fn(xi)为从样本得到的经验累积分布函数。
表2列出了3种分布对各海域船长进行拟合的K-S距离。可以看出,在所有情况下,韦布尔分布拟合的K-S距离都是最小的。因此,选用韦布尔分布模型对我国近海船长的分布进行拟合。
表2 K-S距离
表3列出了韦布尔分布模型对各海域船长拟合所得的形状参数及尺度参数,其拟合曲线如图6所示。
表3 韦布尔分布模型参数
图6 我国近海及四大海域船长韦布尔分布模型拟合曲线
由以上拟合结果可看出,我国近海和黄海、东海、南海海域船长分布差异较小,形状参数ν<1,分布曲线接近于指数分布。相比其他海域,渤海海域ν>1,大、中型船所占比重更大。基于不同海域的船长分布先验概率模型,能更精确地分析和评估不同海用雷达和舰船径向尺寸估计方法的舰船粗分类能力。
由于基于高分辨距离像的舰船粗分类主要依靠径向尺寸估计来完成[5-11],而径向尺寸估计通常是有偏差的,偏差的大小与雷达参数、雷达工作模式、航向角、估计方法的精度等多种因素有关。这里通过给出正确分类概率达到要求时容许的径向尺寸估计误差范围,对雷达舰船粗分类能力进行评估。
根据式(1)所表示的基于高分辨距离像的径向尺寸和航向角的船长估计,在航向角φ服从均匀分布,限制关注的角度范围在[-75°,75°](该范围之外,舰船相对于雷达接近切向航行,径向尺寸难以有效估计船长),并给定径向尺寸估计误差ε的情况下,某海域舰船的大、中、小正确分类概率可表示为
(11)
其中,fL(L)为该海域船长分布的概率密度函数;θS(L,ε)、θM(L,ε)和θL(L,ε)分别表示船长为L、径向尺寸估计误差为ε时,舰船被正确判决为小、中、大型船的条件概率,该概率仅与航向角可取值的范围相关。
首先分析小型船被正确判决的条件概率。显然,当径向尺寸欠估计(ε<0)时,小型船总是被正确分类;当径向尺寸过估计(ε>0)时,小型船的正确分类概率是船长的分段函数,函数θS(L,ε)的定义式为
(12)
(13)
对于大型船,情况正好相反。当径向尺寸过估计时,大型船总是被正确分类;当径向尺寸欠估计时,大型船的正确分类概率是船长的分段函数。同理,可推得函数θL(L,ε)的表达式为
(14)
对于中型船,需要分两种情况讨论。当径向尺寸欠估计时,会出现将中型船错判为小型船的情况,中型船的正确分类概率是船长的分段函数,函数θM(L,ε)的表达式为
(15)
当径向尺寸过估计时,会出现将中型船错判为大型船的情况,中型船的正确分类概率是船长的分段函数,函数θM(L,ε)的表达式为
(16)
根据式(13)~(16),对任意给定的径向尺寸估计误差,都能够根据船长的先验概率分布计算出舰船的大、中、小正确分类概率。基于该概率,能够对雷达或径向尺寸估计方法的舰船大、中、小分类能力进行评估。
给定径向尺寸估计误差ε,并代入式(13)~(16),再将表3中指定海域的形状参数、尺度参数代入式(5),最后代入式(11)进行积分计算,即可得出该海域在误差为ε时的正确分类概率。由此,绘制出了各海域舰船大、中、小正确分类概率与径向尺寸估计误差的依赖曲线,如图7所示。
图7 各近海海域正确分类概率和径向尺寸估计误差的依赖曲线
由图7可以看出,当ε=0时,PC=1,PC随着|ε|的增大而减小。图像关于ε=0左右不对称,且过估计对PC的影响略大于欠估计的影响,这是由于海上小型船所占比重或先验概率较大,而小型船的正确分类概率仅受到过估计影响的缘故。各海域的情况因船长先验概率分布参数的差异而有所不同:我国近海海域的ε在区间(-12.67 m,9.41 m)时,PC能够达到90%及以上;渤海PC达到90%的要求最高,ε需在区间(-8.14 m,7.34 m)内;而东海的要求最低,ε需在区间(-13.87 m,9.75 m)内;黄海和南海的ε需分别在区间(-11.52 m,8.96 m)和(-13.25 m,9.61 m)内。对于高分辨雷达,径向尺寸估计误差总是不小于其距离分辨率的一半。因此,舰船正确分类概率达到90%的必要条件之一是,雷达距离分辨率小于14.68 m(渤海)。
此外,由于径向尺寸估计中的距离副瓣扩展作用,径向尺寸估计误差的分布往往依赖于具体的估计方法[5]。一般来说,直接回波前后沿的估计会产生严重的船长过估计,难以满足正确分类概率达到90%的要求。文献[5]提出的基于线性规划的径向尺寸估计方法考虑了抑制距离旁瓣效应的影响的问题,目标舰船实测数据的平均估计误差在6.13 m以内(雷达距离分辨率为0.75 m)。按照本章的分类性能评价方法,其正确分类概率能够达到93%。
高分辨对海监视雷达通常通过对目标航迹进行拟合的方法得到航向角的估计[8,16-17],其估计误差是影响船长估计的因素之一。根据式(1)可得,船长的估计误差可以用径向尺寸和航向角估计误差近似表示为
(17)
即航向角误差对船长估计产生的最大误差为|Ltan 75° Δφ|。对于长时间稳定跟踪的舰船,其航向角精度很高。以其精度Δφ=0.2°为例,其对小型船产生的最大误差为0.9 m,对中型船产生的最大误差为 2.3 m,对 200 m 的大型船产生的最大误差为2.6 m。因此,航向角估计误差对分类性能有影响,但对稳定跟踪的舰船影响不明显。
对于工作在扫描状态下的高分辨海用雷达,舰船的大中小分类是其需要具备的基本功能之一。雷达舰船分类能力的评估依赖于海域内舰船长度的先验分布、雷达的距离分辨能力以及舰船径向尺寸估计的精度。笔者在统计我国近海四大海域舰船长度数据的基础上,建立了舰船长度的先验概率模型,基于该模型分析了舰船大、中、小正确分类概率和径向尺寸估计误差之间的定量关系,为海用雷达参数设置和不同船长估计方法的性能评估提供了重要参考和依据。