禚江浩 王玲 许可 马燕新 陈沛铂 万建伟
(1.国防科技大学电子科学学院,湖南长沙 410073;2.国防科技大学气象海洋学院,湖南长沙 410073)
被动声纳系统利用目标的辐射噪声进行目标检测、定位、识别,在发现目标的同时可以保持自身的隐蔽性,在现代海战,尤其是潜艇作战中发挥着重要的作用。被动声纳目标检测作为被动声纳系统的第一个处理环节,其准确度影响着后续处理模块的性能。然而,随着潜艇降噪技术的发展[1-2],传统的基于目标线谱的窄带处理方法[3-4]受到挑战,在低信噪比下的宽带目标检测方法越来越受到关注。
为了提高输出信号的信噪比,被动声纳系统采用水听器阵列作为接收端。用于处理阵列接收数据的方法是波束形成。按照信号传输模型的不同,波束形成可以分为常规波束形成和全波波束形成。常规波束形成适用于自由场条件下的远场传播问题,此时可以用平面波对阵列接收数据进行建模,用于常规波束形成的宽带检测方法有能量检测法、子带能量检测法以及子带峰值能量检测法[5]等。全波波束形成可以认为是常规波束形成在波导条件下的推广,水下声传播,尤其是浅海声传播问题,是典型的波导传播问题。在水声学中,利用匹配场处理的能量匹配思想,我们可以实现用于处理波导传播问题的全波波束形成。
匹配场处理根据声场模型对水下声传播进行建模,然后采用特定的代价函数衡量声场模型的数值预报结果(拷贝场)和阵列接收数据计算得到的声场(测量场)的匹配程度。匹配场处理目前主要作为参数反演方法用于求解水声学的反问题,在低信噪比下基于匹配场处理的思想对被动目标检测问题的研究相对较少。2000 年,Tolstoy 在关于匹配场处理的综述中提出,匹配场处理最适合的应用是作为一种反演方法,而不是作为检测方法[6]。
声源定位问题是人们非常感兴趣的参数反演问题,也是匹配场处理应用最广泛的领域。最初的匹配场处理的思想是由Clay 在1966 年提出的[7],虽然此时他没有提出匹配场处理的概念,也没有提及声源定位、环境参数反演等应用,但是他意识到了海洋环境、声传播和阵列接收数据之间的紧密联系,为后续匹配场处理的研究打下了基础。1973 年,Hinich 研究了垂直阵在声源定位中的应用[8],采用最大似然估计器,推导了简正模幅度系数和声源深度的Cramer-Rao 界,并在后续的研究中将深度的Cramer-Rao 界推广到距离的Cramer-Rao 界。Hinich首次提出了匹配场处理的概念,但是由于当时水下声场建模的局限性,没有一种公认的可信的建模方法,所以Hinich 的研究没有和具体的海洋环境结合起来,因此在当时看来在实际应用价值上存在一定的问题。Bucker 首次将匹配场处理用具体的数学公式表达出来[9],这也是目前所广泛使用的匹配场处理的形式。Bucker 首先提出了对多普勒效应敏感的线性处理器,之后为了降低这种敏感性,提出了能量检测器,也称为Bartlett 处理器,后文的线性处理器均指Bartlett 处理器。Bucker 在Hinich 工作的基础上,将匹配场处理应用于实际的海洋环境,提出了模糊表面这一目前广泛使用的概念,并且证明了水下声场具有足够的复杂性以用于求解水声学的反问题。
随着水下声场建模技术的发展,人们逐渐建立起了可信的声场数值计算模型,人们认识到匹配场处理在求解水声学的反问题上有着不可替代的作用,匹配场处理得到了快速的发展。Klemm等[10]在Bucker 的线性处理器的基础上,提出了最大熵法,超过了线性处理器的性能。在高分辨率波束形成[11]方面,最典型的应用是最小方差无失真(MVDR)处理器。周悦将匹配场处理建立在机器学习的框架下,基于信息理论准则对拷贝场和测量场进行距离度量[12],性能优于传统的匹配场估计方法。韦先声将传统的基于声压水听器的匹配场处理扩展到基于矢量水听器的匹配场处理[13],对比了不同匹配量下的相干处理器和非相干处理器的匹配性能。
Baggeroer 首次提出了对多个频点的模糊表面进行均值化处理的匹配场处理方法[14],这种方法称为宽带非相干处理方法,有效地降低了线性处理器或者MVDR 处理器的旁瓣。在宽带相干处理方面,最早的宽带相干处理方法是由Clay 提出的[15],通过计算测量得到的脉冲响应和建模得到的脉冲响应的匹配量,用于实现宽带声源定位,并且将该算法扩展到多阵元的互相关处理。但是这种方法需要声源频谱已知,不适合被动声纳的应用。Hursky 在研究高频段时域宽带匹配场处理时,将两个水听器的接收波形做互相关处理,从而实现了在声源频谱未知时的声源定位[16]。在频域处理方面,Westwood实现了频域的宽带相干匹配场处理[17],其输出结果为频域互相关的相干累加。相比于非相干处理方法,相干处理方法能得到更窄的主瓣和更低的旁瓣。在单个频点的接收数据的归一化问题上,Mi⁃chalopoulou 提出了以第一个阵元为参考量进行归一化的方法[18],称为相干归一化处理器。这种方法将归一化处理后的接收数据组成一个超级向量,这种处理方法也是目前频域相干匹配场处理所广泛采用的形式。但是以第一个阵元做归一化的处理方法,容易受到噪声的影响,尤其在低信噪比条件下,单个频点的数据不能有效地归一化,从而导致处理性能的下降。Soares提出了以每个频点的信噪比最高的阵元的接收数据作为参考量的归一化的方法[19]。虽然这种以最高信噪比阵元作为参考量的归一化方法相比于Michalopoulou 的归一化方法有所改进,但是仍然没有解决低信噪比下无法有效归一化的问题。孟华等在Michalopoulou 的归一化方法的基础上,提出了一种改进的阵元归一化方法[20],提高了宽带相干处理器的检测性能。
从线性处理器到MVDR 处理器,从非相干处理到相干处理,目前匹配场处理的发展趋势是在信噪比足够高的条件下达到更高的定位精度,即在模糊表面上产生更窄的主瓣和更低的旁瓣。与定位问题不同的是,检测问题关注的是低信噪比条件下有无目标两种情形下的模糊表面的可区分程度,此时研究的重点应该是如何利用匹配场处理的思想,设计出一种能够在一定带宽上达到更高输出信噪比的波束形成方法。
本文首先介绍了四种常用的匹配场处理方法,包括线性非相干处理、MVDR 非相干处理、线性相干处理以及MVDR 相干处理,以模糊表面最大值作为检测量,通过仿真计算,对比了四种处理方法在低信噪比条件下有无目标时检测量的可区分程度;其次本文分析推导了线性非相干处理器的输出信噪比和输出功率,分析了线性非相干处理器在声源频谱起伏增大时性能下降的原因;之后本文提出了在处理带宽上能达到理论上的最大输出信噪比的匹配场处理方法,后文简称最大信噪比处理器,并且分析了最大信噪比处理器的输出信噪比和输出功率,从数学上证明了最大信噪比处理器的检测能力优于线性非相干处理器;最后,本文通过仿真计算,验证了最大信噪比处理器相比于线性非相干处理器在低信噪比条件下有着更优的检测能力。
目前匹配场处理最常用的领域是参数反演,即通过测量得到的声场来估计海洋环境参数,即如下的参数估计问题,
其中θ为待估计的参数,比如声源位置、海深等,是估计值。在众多的参数反演问题中,人们最感兴趣的是声源位置的估计问题,对于二维建模,声源位置由声源深度和声源距离表示,此时P(θ)是随距离和深度变化的二维图像,称为模糊表面。根据计算P(θ)采用的代价函数的不同,可以将匹配场处理器分为线性处理器和MVDR 处理器;根据频点之间的处理方式的不同,可以将匹配场处理器分为非相干处理器和相干处理器。
对于宽带检测,接收数据为,
其中m=1,2…M,l=1,2…L,θ0是声源的真实位置,xm,l(θ0)表示第m个阵元在第l个频点的接收数据的频谱,hm,l(θ0)表示在第l个频点上从声源到第m个阵元的信道滤波器频率响应,sl是声源在第l个频点的频谱,nm,l表示第m个阵元在第l个频点的噪声频谱,M是阵元数量,L是参与运算的频点数量。
线性处理器的原理是将拷贝场和测量场做互相关处理,从而在搜索网格接近真实声源位置时达到峰值。以频点l为例,在频点l上的匹配量如下,
MVDR 处理器的基本原理是使输出噪声分量的功率最小,仍然以频点l为例,MVDR 处理器在频点l上的匹配量如下,
非相干处理是对单个频点的模糊表面Pl(θ)直接进行均值处理,得到宽带信号的模糊表面,即,
按照单个频点的代价函数的不同,非相干处理器又分为线性非相干处理器和MVDR 非相干处理器。线性非相干处理器为,
MVDR非相干处理器为,
非相干处理器以单个频点作为处理单元,单个频点的归一化处理消除了声源频谱的影响。但是直接对多个频点的模糊表面进行均值处理的方法,在声源频谱起伏过大时,会导致高信噪比的频点的模糊表面被其他的低信噪比频点的模糊表面“带偏”,反而会导致处理性能的下降。
相干处理器将匹配处理的范围扩展到整个带宽,即将各个频点的接收数据组合成一个M×L维的“超级向量”,如下式,
如果直接采用式(11)计算互谱矩阵,那么用于匹配的加权向量中需要包含声源频谱信息。对于被动检测问题,声源频谱是未知的。针对声源频谱未知的问题,Michalopoulou 和Porter 提出了用第一个阵元的接收数据做归一化处理的方案[17]。以第一个阵元的数据归一化之后的接收数据为,
从式(12)可以看出,以第一个频点归一化之后的接收数据向量中完全消除了声源频谱的影响。以第一个频点归一化之后,式(11)变为,
此时加权向量为,
其中,
此时互谱矩阵为,
线性相干处理器的模糊表面为,
MVDR相干处理器的模糊表面为,
相干处理器的优点是考虑了各个频点接收数据的相干信息,相比于非相干处理器有更高的定位精度和更低的旁瓣。但是相干处理器的归一化方法易受到噪声的影响,随着信噪比降低,处理性能会迅速下降。此外,类似于非相干处理器单个频点的归一化处理,相干处理器以第一个阵元数据的归一化方法也消除了声源频谱的影响,这也会导致在声源频谱起伏过大时,高信噪比的频点被其他的低信噪比频点“带偏”。
在本节我们将以与距离无关的浅海波导为例,对20阵元的垂直阵进行匹配场处理的仿真计算,比较基于线性非相干、MVDR 非相干、线性相干和MVDR 相干四种匹配场处理方法的宽带检测算法的性能。
与距离无关的浅海波导分为三层,后文将这个浅海波导简称为RI 波导。RI 波导的第一层是深度为150 m的海水层,密度为1000 kg/m3,无介质衰减,声速剖面如下式,
其中v是声速,单位为m/s,d是深度,单位为m。
第二层是厚度为100 m 的均匀沉积层,密度为1800 kg/m3,介质衰减系数为1dB/λ,声速为1800m/s;第三层是理想刚性海底。
声源深度为50 m,发射信号为一段时长为1 s的线性调频信号,如下式,
其中S(t)为声源发射信号,t的单位是s。
值得注意的是,本文采用的匹配场处理方法可以在声源频谱未知的情况下实现空间匹配滤波,因此匹配场处理的结果是不依赖于具体的声源波形的。本文采用公式(20)所示的主动发射波形,是为了获得信号的宽带频率响应,对公式(20)的参数进行简单的修改即可得到不同带宽的发射波形。
考虑一个20 阵元的垂直阵,阵列到声源的距离为4000 m,阵元的深度分别为25 m,30 m,35 m…120 m。用于计算拷贝场的声场模型为简正波模型[21],采用模式微扰理论[22]对沉积层的介质衰减进行建模。表1是匹配场处理的参数。
表1 匹配场处理参数Tab.1 Parameters of matched-field processing
在各个阵元的接收信号中加入高斯白噪声,以产生不同信噪比的接收信号。信噪比定义为各个阵元接收信噪比的平均值,即,
其中SNRm是第m个阵元的带限信噪比。
图1是信噪比为-24.6672 dB时,四种匹配场处理器的模糊表面。对比图1的四种匹配场处理器的模糊表面,可以发现,非相干处理器的模糊表面在真实声源位置处的主瓣明显比相干处理器的主瓣更加清晰,而且线性非相干处理器的主瓣清晰程度略优于MVDR 非相干处理器,这说明线性非相干处理器在低信噪比下的处理性能最优。为了进一步验证这个结论,我们重复进行40 次试验,以模糊表面的最大值作为检测量,画出检测量的分布。图2是信噪比为-24.6672 dB 时有无目标检测量的分布,其中方形是有目标,三角形是无目标。从图2中可以明显地看出,线性非相干处理器在低信噪比下的有无目标的检测量的可区分程度最佳,因此在低信噪比下的检测能力最佳。
因为基于线性非相干处理器的宽带检测方法在低信噪比条件下的检测能力最佳,因此我们将对线性非相干处理器的性能进行分析。在匹配场方法的应用中,由于环境误差、数据误差以及系统误差等因素[23],拷贝场与真实的声场之间会有一定的误差,称为声场失配。为了简化问题,在本文中假设声场失配是可以忽略的。将式(2)的接收数据简写为,
考虑到匹配场处理的目标是在真实声源位置处达到最大输出,而且检测量设计为模糊表面的最大值,因此这里只考虑线性非相干处理器在真实声源位置处的输出信号。按照式(3),在单个频点上,线性非相干处理器的处理流程可以分为两个步骤。第一步是计算各个阵元接收数据的加权后的输出信号,即,
在高斯白噪声假设下,噪声强度随频率和阵元位置是不变的,且各个噪声分量之间互不相关,记nm,l的二阶矩为σ2,式(23)的信噪比为,
对比单个水听器的接收信噪比,容易发现输出信号Xl的信噪比是各个阵元接收信号的信噪比的累加。考虑对频点l的任意的加权系数wl=[w1,w2…wm…wM]T,此时的输出信号为,
对式(27)的分子运用柯西不等式,得到,
因此线性非相干处理器的输出信号Xl在单个频点上在加权意义下达到了最高的信噪比。
输出功率为,
在无目标时,令式(33)中的xm,l=nm,l,此时输出功率为,
计算得到每个频点的归一化的输出功率后,线性非相干处理方法直接计算各个频点的平均值,那么线性非相干处理方法的输出功率为,
由于2MCl近似服从自由度为2 的卡方分布,易知2ML近似服从自由度为2L的卡方分布。
从式(37)可以看出,在信噪比恒定的情况下,当声源频谱起伏增大时,输出功率会降低。在相同的信噪比下,如果sl的能量只集中在某个窄带或者某几个单独的频点处,虽然在能量集中的频点处输出功率很高,但是其他的大量的频点由于几乎没有信号能量,会导致输出功率很低,计算得到的平均值也会很低。考虑一种极端情况,比如,声源的能量全部集中在一个频点上,在这个频点上的输出功率接近了理论的最大值1,但是其他的频点因为没有声源能量,输出功率都是仅噪声的输出功率,当参与运算的频点数足够多的时候,此时的输出功率将接近仅噪声的输出功率。
我们用一个对比试验来说明声源频谱起伏的影响。考虑2.2 节的仿真实验,我们把声源发射信号改为如下的更加不“平坦”的形式,
其中S(t)为声源发射信号,t的单位是s。
为了方便表述,我们将式(39)的声源称为“声源2”,将式(20)的声源称为“声源1”。采用线性非相干处理器,在信噪比为-23.6129 dB 时,分别对声源1 和声源2 做匹配场处理,图3 是两个声源的模糊表面,图4 是重复40 次实验的检测量的分布,其中红色是无目标,蓝色是有目标。从图3 可以看出,声源2 在真实声源位置处的主瓣比声源1更加模糊,从图4 可以看出,声源2 的检测量的可区分程度明显不如声源1的可区分程度。当声源频谱起伏增大时,基于线性非相干处理器的宽带检测方法的检测能力下降。检测能力降低的原因有两个:单个频点输出功率的归一化处理消除了声源频谱的影响,缺少频点间的信噪比的对比;后续的多频点处理将所有频点按照相同的权重计算均值,导致高信噪比的频点被低信噪比的频点带偏。
无论是非相干处理方法或是相干处理方法,都是考虑如何消除声源的影响,这是因为拷贝场建模只能计算声源频谱为1时的信道传输函数。非相干处理方法通过单个频点的归一化处理来消除声源的影响,相干处理方法采用式(12)的以第一个阵元的数据做归一化的方法,以消除声源的影响。然而,尝试从接收信号中得到声源频谱的估计值,根据估计值和拷贝场可以对接收数据直接进行匹配,最大信噪比处理器就是在这一想法的基础上设计的。
以两个阵元、两个频点为例,图5是最大信噪比处理器流程示意图。图5的第一行(最上方的一行)表示接收数据,虚线的部分表示信号分量,实线的部分表示噪声分量,线条的长度表示幅度,线条的方向表示相位。由于声源频谱不为1,声源频谱的幅度和相位导致拷贝场(图5第二行)与信号分量在幅度和相位上不一致。在拷贝场上乘以声源频谱,可以得到与信号分量在幅度和相位上保持一致的加权向量(图5第三行)。对加权向量和接收数据做匹配,可以得到方向一致的匹配结果(图5第四行)。而且,对于信噪比较高的频点(图5左侧),输出较大的值,对于信噪比较低的频点(图5右侧),输出较小的值。
线性非相干处理器在单个频点上的输出信号可以作为声源频谱的估计值,由式(23),可以得出,
nm,l是0均值的高斯噪声,因此无偏估计为,
由线性非相干处理器的信噪比分析的结果可知,式(44)是最大信噪比下的无偏估计。
根据式(40),可以认为最大信噪比处理器的输出是如下的输出信号的归一化功率,
值得注意的是,虽然X的量纲为功率,但是这里考虑到X是直接对接收数据加权的结果,为了与后文的归一化功率区分,这里将X称为输出信号。
因此在加权意义下,随着信噪比的提升,X的信噪比将趋近于在整个处理带宽上能达到的最大信噪比,这也是最大信噪比处理器这个名称的由来。
将式(44)代入式(45),整理得到,
命题1:
通过对比最大信噪比处理器和线性非相干处理器在真实声源位置处的输出功率,我们可以得出,最大信噪比处理器在保持无目标的输出功率与线性非相干处理器无目标输出功率一致的情况下,提升了有目标时的输出功率,因此对有无目标两种情况可以达到更好的可区分度,基于最大信噪比处理器的宽带检测方法的检测能力优于线性非相干处理器。
从信噪比上来看,最大信噪比处理器在整个处理带宽上实现了所有接收数据的信噪比的累加,以估计得到的声源频谱和拷贝场相乘的加权方式,实现了对高信噪比接收数据的“放大”和对低信噪比接收数据的“衰减”。相比于线性非相干处理器对各个频点的输出功率直接求均值的无差别处理方式,最大信噪比处理器能突出高信噪比数据对处理结果的影响和抑制低信噪比数据对处理结果的不利影响,因此基于最大信噪比处理器的宽带检测方法的检测能力优于线性非相干处理器。
考虑2.2节中的RI波导的匹配场处理问题,匹配场处理的参数仍然采用表1的参数,分别采用最大信噪比处理器和线性非相干处理器对声源1和声源2进行匹配场处理,在不同信噪比下重复500次实验得到有无目标时的检测量,根据检测量得到ROC曲线、AUC(Area under curve)以及恒虚警率下的检测概率。图6是在信噪比为-26.6054 dB时的ROC曲线,图7是在不同信噪比下的AUC,图8是在虚警率为0.08时的检测率随信噪比的变化曲线。从图6可以直观地看出,基于最大信噪比处理器的宽带检测方法的ROC曲线位于线性非相干处理器的上方,这说明在RI波导下,基于最大信噪比处理器的宽带检测方法的检测能力优于线性非相干处理器;从两条曲线的分离程度来看,声源2的分离程度大于声源1,在声源频谱起伏变大时,基于最大信噪比处理器的宽带检测方法的检测能力将进一步优于线性非相干处理器。从图7和图8中可以看出,以AUC值和恒虚警率的检测概率作为指标,基于最大信噪比处理器的宽带检测方法的曲线位于线性非相干处理器的上方,而且声源2的曲线的分离程度大于声源1。
本文首先对比了基于线性非相干、MVDR 非相干、线性相干以及MVDR 相干四种宽带匹配场处理器的检测方法在低信噪比下的检测性能,在四种处理方法中,基于线性非相干处理器的检测方法在低信噪比下的检测能力最好。之后推导了线性非相干处理器的输出信噪比和输出功率。线性非相干处理器在单个频点上能达到最高的输出信噪比,输出功率与噪声分量和拷贝场分量之间的匹配程度有关,在此基础上得出了基于线性非相干处理器的宽带检测方法在声源频谱起伏增大时检测性能会下降的推论,通过声源1 和声源2 的匹配场处理的对比实验验证了这个推论。
在上述的四种匹配场处理方法的对比实验和线性非相干处理器的分析的基础上,本文提出了最大信噪比处理器。最大信噪比处理器与现有的非相干处理或者相干处理最大的区别是,最大信噪比处理器没有通过归一化处理去消除声源的影响,而是利用声源频谱的估计值和拷贝场分量直接对接收数据进行匹配。本文分析了最大信噪比处理器的输出信噪比和输出功率。在理想情况下,最大信噪比处理器可以在处理带宽上达到最大输出信噪比;从输出功率的对比上,本文证明了基于最大信噪比处理器的宽带检测方法的检测能力优于线性非相干处理器。通过仿真实验,计算了不同信噪比下的基于最大信噪比处理器和线性非相干处理器的宽带检测方法对声源1 和声源2 的检测量,通过二者的ROC 曲线、不同信噪比的AUC 和检测概率,可以进一步验证基于最大信噪比处理器的宽带检测方法的检测能力优于线性非相干处理器,并且在声源频谱起伏增大时,二者性能的差异会更加明显。