王晓彤,蔡志明
(海军工程大学 电子工程学院, 湖北 武汉 430033)
混响是主动声呐检测水下目标的主要背景干扰。动目标的检测可利用目标回波与混响在多普勒速度上的差异。当混响较强且目标运动较慢时,常规波束形成(BeamForming, BF)加频率搜索的匹配滤波(Matched Filtering, MF)方法(以下简称BF&MF)得到的单ping输出仍难以改善检测效果。在港口蛙人警戒场景中,发射信号、基阵、探测空间中的环境在相当大的时间尺度内均无明显变化,因此可以将多ping信息用于目标检测中。在蛙人警戒声呐中利用多ping输出之间的关系检测目标时,常用的序列图像帧差法检测虽计算简单,却极易出现“空洞”和“双影”现象[1],多ping输出序列包含的信息不能被充分利用。基于统计方法的时间序列检测[2]常利用高阶统计量,但一般地讲,只用单个高阶特征作为检验统计量是不能充分利用信号特征信息的,而且其检测门限选定也是个难题[3]。在混响和目标回波高阶统计特性差异的基础上构造特征核函数支持向量机,也是一种检测目标回波的方案[4],但需要大量目标回波的样本才能得到较为准确的高阶统计特性,实践中目标大样本量是无法满足的。但是,如果将统计分析对象改为混响背景干扰,利用多ping数据计算BF&MF输出的混响高阶统计量,这在某些应用场景中是现实可行的。由此可构成特征向量样本集,并将样本集与当前检测ping特征向量之间的马氏距离作为判据。马氏距离是计算特征向量间距离的一种度量[5-7],常用于信号分类中。
本文首先基于混响信号和目标信号在高阶统计特性上的差异,提出一种使用多ping样本统计特征向量的马氏距离门限检测方法。通过仿真数据和海上实验数据验证该方法相较于传统单ping检测的性能改进。最后利用蒙特卡洛仿真对新方法在不同信混比下的接收机工作特性曲线(Receiver Operating Characteristic curve, ROC)进行分析比较。
本文研究的混响背景下动目标检测是在主动声呐BF&MF处理输出的基础上进行的双择检测,两个假设分别为:
(1)
其中,H0、H1分别表示零假设和备择假设。s、r、n分别表示BF&MF后的输出回波、混响与噪声干扰,其包络均可视为一个服从某一概率密度分布的随机过程。目标回波的输出包络与混响输出包络的分布显然是不同的,然而由于概率密度函数未知,根据估计方法所得的概率密度因受到混响起伏的影响有时无法趋近真实值。当无法对检测问题进行完整的统计描述时,或者检测的似然比不易分析时,根据由数据的各阶矩组成的集合可以用于构造检测器。相比一阶、二阶统计量,高阶统计量往往可以反映不同种类随机过程更加细微的差别。
每个方位距离单元的输出功率可看作一个随机过程。当单元内无目标时,混响输出包络在一定范围内随机分布,符合某一概率密度分布。当目标经过某一方位距离单元时,此单元内的输出包络会出现远离平均值的极端值出现,统计数据的分布也会呈现非对称的特征,但一阶、二阶矩无法很好地将这些特性的差异表现出来,因为一阶矩只能反映单元内数据的平均,弱目标将被强混响掩盖,二阶矩虽能反映数据在平均值周围的起伏大小,但表现的只是起伏的平均水平,并不能区分是每个取值的起伏还是个别极端取值引起的方差增大。受到计算量的影响和某些高阶统计量难以获得的限制,只能选取有限个高阶统计量来描述问题中的非高斯过程。峰度和偏度是两个常用的高阶统计量。峰度是度量概率密度分布曲线在均值附近峰部的尖锐程度的统计量,峰度高代表该随机过程的方差增大是由以较小概率出现的大于或小于平均值的极端值造成的。一段长度为M的时间序列的峰度为:
偏度是衡量随机过程概率密度曲线偏斜方向和相对于平均值非对称程度的统计量,表现为概率密度函数曲线拖尾的相对长度。一段长度为M的时间序列的偏度为:
其中,m3是三阶样本中心矩,σ是样本标准差。将两个统计量组成一个二维的特征向量y=[K,S]T。在一段时间内,可以认为同一方位距离单元的混响输出包络具有相近的特征向量,因此取该单元连续输出的Nping混响包络的N个特征向量为一组,把这组向量作为样本集{y1,y2,…,yN}。当第N+1个观测ping经BF&MF输出后,计算特征向量yN+1,就可以通过与样本集的差异区分目标回波和混响。
根据观测ping和多个学习ping样本的特征向量差异实施判决可看作二值分类问题,是一种特殊的分类,可以运用分类的方法进行检测。通常可以直接计算欧式距离作为分类的度量标准。然而欧式距离没有考虑统计分布信息,它将不同特性之间的差别同等看待,没有反映特征分量之间的相关程度及各特征分量对距离的贡献差异,并且没有考虑各个特征分量的量纲对事物差异的影响,不能全面衡量类别间的差异。使用包含统计信息的距离测度来代替欧式距离测度可以提高系统性能。马氏距离就是一种更有效地计算两个未知样本集相似度的方法[8],通过计算样本之间的方差和协方差来反映样本集合分布的统计信息,考虑了总体样本信息,因此可将特征之间的联系融入分类判决中。二维特征向量y=[K,S]T的两个特征分量之间存在一定的相关性,通过将原特征向量的协方差矩阵转化为对角矩阵,可以将特征分量相关的原特征向量变换成与特征分量不相关的新特征向量,几何表现为将原坐标系旋转并伸缩为新的正交坐标系,分别指向沿坐标轴方差最大的方向和与之正交的方向。坐标轴的旋转使得马氏距离可以一定程度上反映两个分量之间的相关程度,相当于对两个分量依据方差大小及相关程度进行加权,坐标轴的伸缩可以将两个分量之间量纲的影响考虑进去,由此可见马氏距离刚好可以弥补欧式距离的不足。特征向量的协方差矩阵如果为单位矩阵,那么马氏距离就简化为欧式距离。当特征向量的维数过大时,可能会因样本不足导致协方差矩阵奇异,这将导致马氏距离计算误差迅速增大,因此本文选择由偏度、峰度组成二维特征向量,来提升检测器的稳健性。
用样本集{y1,y2, …,yN}构造一个训练矩阵
(2)
某一方位距离单元只存在混响时,可以假设被观测ping的特征向量与样本集的特征向量服从相同的分布,此时式(2)所定义的马氏距离以较大的概率低于一个小值,可以通过这个小值的取值确定检测门限η,大于门限的判定该单元存在目标。此时门限检测问题Tη可记为:
在样本有限的情况下,马氏距离的取值范围是难以确定的,需研究大样本下的渐进形式。当样本趋于无穷时,特征向量是渐进服从多维正态分布的,为避免有限样本下的分布函数与正态分布偏差引起虚警概率增加,在正态分布的基础上留出一个随机余量Θ。此时双择假设(见式(1))可重新表示为:
(3)
其中,Ξ0和Ξ1分别表示有、无目标时的随机余量,N为多维正态分布。为方便表达,记Θ=εΞ1+(1-ε)Ξ0,Θ、Ξ0、Ξ1均为二维随机参数空间里的元素,H1假设下ε=1,否则ε=0。式(3)表达的检测机理较式(1)更加深刻:由训练样本提炼的特征向量,因其主体的正态统计性,使其马氏距离有聚集性,在此基础上,因其随机性但非主体的贡献,使H0假设下的马氏距离在聚集核心附近的外延局限于某个小值τ,而在H1假设下的马氏距离在聚集核心附近的外延将达到超过τ的某个值。
(4)
给定γ∈(0,1)和ρ≥0,记满足1-R(ρ,η)=γ的η为λγ(ρ),由于R(ρ,η)是关于η的单调函数,因此λγ(ρ)是唯一解。下面证明Tλγ(τ)是式(3)假设下的γ-MCCP,且给定任意ρ>τ,检测功效为P[Tλγ(τ)(Θ+X)=1|Θ∈Υρ]=1-R(ρ,λγ(τ))。
2)对于假设
(5)
综上所述,Tλγ(τ)是式(3)假设下的γ-MCCP检测,最大检测功效为1-R(ρ,λγ(τ))。由R(ρ,η)关于ρ的单调递减性可知,最大检测概率的下限为1-R(τ′,λγ(τ))。通常实际检测概率要高于这个值。
根据1.3节所述,马氏距离不受量纲的影响,因此τ的选择不受单元内混响强度的影响。τ值确定后,设置门限
η=λγ(τ)
(6)
从而可以确定用于检测目标的最大一致条件功效检测Tη。特征向量间的马氏距离在门限η之内,判定无目标,反之判定为出现目标。
通过蛙人声呐的仿真数据验证本文方法的有效性。仿真试验的参数如下:发射信号中心频率10 kHz、带宽2 kHz、脉宽0.1 s;每次发射间隔1 s;接收水听器阵为16元等间距线阵,阵元间隔为0.06 m。目标初始位置在发射基阵前进方向外60°,水平距离300 m;目标运动径向速度为1 m/s。研究是在混响背景下进行,输入信混比和信噪比分别设置为-25 dB和-20 dB。为便于比较,输出均进行了归一化处理。
传统单ping处理的结果如图1所示,可以看出,传统单ping方法的输出结果中弱目标被强混响掩盖,完全无法观察到300 m处的目标。选择20 ping仿真混响的输出计算高阶统计量,形成特征向量集。当获得检测ping的BF&MF输出包络后,计算其特征向量与特征向量集之间的马氏距离,归一化马氏距离的输出如图2(a)所示。运动目标所处单元的马氏距离明显大于混响背景单元的马氏距离,表明目标所在单元与混响样本的统计特性差异较大。按照1.5节中式(6)设置门限,归一化后的门限为0.62。将归一化马氏距离通过门限,获得良好的目标检测效果,最终检测结果如图2(b)所示。
图1 单ping MF&BF检测的归一化输出包络Fig.1 Normalized output envelope of the MF&BF method
(a) 归一化马氏距离(a) Normalized Mahalanobis distance
(b) 门限判决后的输出结果(b) Output above the threshold图2 新方法的输出归一化检验统计量Fig.2 Normalized output using the new method
为进一步验证本文方法的有效性,选取海试混响数据进行处理。混响数据来源于中国东海海域试验,同一时段有20次发射并记录接收数据。所用阵列为固定32元阵,阵元间隔为1.5 m;发射线形调频(Linear Frequency Modulation, LFM)信号,中心频率为420 Hz,带宽为80 Hz,脉宽为2 s;接收信号的采样率为10 kHz。发射重复周期为10 s。运动目标为水声应答器发射的模拟目标,目标初始位置的舷角为60°,水平距离约为4500 m,深度约为20 m,径向速度为1 m/s。
传统单ping处理的结果如图3所示,可以看出,强混响下传统单ping处理目标完全被混响掩盖。选择海试中20次连续发射接收到的20 ping数据进行波束形成和匹配滤波,得到输出包络后构造特征向量集(即N=20),输出的归一化马氏距离如图4(a)所示。可以看出,使用新方法后目标被清晰地显示出来,虽然仍有背景干扰的残留,但已被抑制到了较低且均匀的水平。按照1.5节中式(6)设置门限,归一化后的门限为0.45。将图4(a)通过门限完成目标的自动检测(如图4(b)所示)。
图3 单ping MF&BF检测的归一化输出包络Fig.3 Normalized output envelope of the MF&BF method
(a) 归一化马氏距离(a) Normalized Mahalanobis distance
(b) 门限判决后的输出结果(b) Output above the threshold图4 新方法的归一化输出Fig.4 Normalized output using the new method
由于新方法检测器的形式较为复杂,无法将检测器的虚警概率和检测概率通过解析形式表达出来。为分析比较传统方法(BF&MF)和新方法在不同信混比条件下的检测性能,对传统方法和新方法均进行蒙特卡洛仿真测试。每次仿真数据通过同一检测器后的检测结果可以认为是该检测的一次实现,重复多次仿真实验,即可得到该检测的多次实现,从而统计检测概率和虚警概率。按照2.1节的仿真参数进行仿真。设置固定的输入信噪比-20 dB,输入信混比取-25~-16 dB,与之对应的BF&MF后的输出信混比约为0~9 dB。由于研究是在常规BF&MF处理后的后置检测方法,故以下的信混比都表示BF&MF后的输出信混比。在固定的仿真信混比条件下,用新方法和传统方法分别对各次仿真数据进行处理,在含有目标的方位距离单元,固定某一门限,如果处理结果大于门限则检测成功,统计各次仿真实验检测成功次数占总次数的比例即可得到此门限对应的检测概率估计值。对于只有混响的单元,相同门限下,如果检测结果大于门限则认为是虚警,同样地,可以得到此门限对应的虚警概率估计值。设置不同的门限就可以得到设定信混比下的ROC曲线。在进行1000次蒙特卡洛仿真后,由传统方法和新方法的ROC曲线(分别如图5、图6所示)可以看出,传统方法性能非常不理想,虚警概率高而检测概率低,且检测概率随信混比增大而增长的速度缓慢。而新方法检测器的检测性能明显高于传统检测器,随着信混比的提高,其检测概率增长较快,尤其是在低虚警概率条件下,检测概率仍随信混比的提高有较快的增长。主动声呐信号检测中,常以虚警概率不高于0.01且检测概率不低于0.5作为检测的标准。图5中圈出的点对应的虚警概率约为0.01,检测概率接近0.5;图6中圈出的点对应的虚警概率约为0.01,检测概率达到0.67。由此可以得出,在保证虚警概率不高于0.01且检测概率不低于0.5的条件下,本文方法可以将检测到目标所需的最低信混比近似由传统检测器的9 dB降至3 dB,降低约6 dB。
图5 单ping MF&BF检测的ROC曲线Fig.5 ROC curves of the MF&BF method using single ping
图6 新方法检测的ROC曲线Fig.6 ROC curves of the new method
本文基于混响信号和目标信号在高阶统计特性上的差异,使用多ping输出结果的高阶统计量构成特征向量,不需要假设目标和混响的概率密度先验知识,可以避免概率模型失配对检测的影响。计算检测背景特征向量训练样本集与观测ping特征向量之间的马氏距离,引入随机余量,采用最大一致条件功效准则构造新的自动门限检测方法,可解决主动声呐信号处理中真实目标样本无法获取的问题。仿真和海试数据检验结果均证实了新方法的有效性及优越性。
结合蒙特卡洛仿真所得ROC曲线可知,本文检测方法在低信混比下的检测性能要明显优于传统上广泛使用的BF&MF检测方法,相比较而言,在保证虚警概率小于0.01,检测概率不低于0.5的条件下,相同检测水平所需最小可检测信混比将降低约6 dB。
目前并未考虑混响背景在检测过程中有较大变化的情况,这涉及特征向量集的自动更新问题,将作为下一步研究的方向。