郑 超,左炜亮
(1.延安九德安全应急科技有限公司 总经办,陕西 延安 716099;2.西安交通大学 人工智能学院,陕西 西安 710049)
信号源定位是阵列信号处理的重要研究内容,而其内容主要有波达距离和方向。对于远场信号,由于可以近似看成平面波,待估计的参量只有波达方向;但是对于近场信号,只能以球面波进行表征,待估计的参量则同时包含波达距离和波达方向两个。由于参量维数的增加,对于近场信号源的定位研究难度要高于远场波。除此之外,由于阵元的排布形式也存在多样性,使得信号源定位的研究工作任重而道远。
在DOA(Direction of Arrival)估计领域中,最经典的算法便是MUSIC 算法以及凸优化方法。
MUSIC 算法核心在于空间矩阵分解,精度受限于观测数据是否充足,这会制约在实际中的应用,降低对观测数据量的依赖性,常用的解决方法是利用源信号在空间内的稀疏性,依照稀疏贝叶斯学习理论将其表示为压缩感知,但是这种处理模式的计算复杂度依然很高。
包括凸优化在内的各种连续数学优化方法也可以用于DOA 估计中,角度向量的变化是连续性的,连续空间导致计算量巨大,为此可将连续变化的角度网格化,而网格数量远远多于真实信号源的数量,是稀疏化的,同样可以利用稀疏贝叶斯学习等方式进行快速估计,但是由于固定化的网格无法避免信号源不在其内的情况,为了保证高的识别率,往往需要非常精细化的离散网格,这又会导致计算复杂度和运算量的急剧增加,这与初衷是背道而驰的。
因此,探索新的解决方法思路无论在理论层面还是在现实层面都具有很大的意义。远场信号与近场信号有着延伸的关系,待估计参数由远场的一维增至近场的二维,依照流形学习的观点,近场源观测到的数据是相较于远场源,实际是信号本质特征由低维至高维的映射,是有冗余的。而边缘似然的理念可以通过消除隐变量的方式实现参数估计的降维来大大降低算法的计算量和复杂度。两者理论有着天然的契合度。本文方法以此为理论基础,改进现有参数估计算法并探索设计新的目标识别算法。
本文涉及的主要符号如表1 所示。
考虑以下信号模型:阵元阵列为一维并列非均匀线性排布,信源为远场信号,有M个阵元、K个信号源,如图1 所示。
图1 远场源信号模型
于是得到接收信号y(t)和发射信号s(t)之间的关系为:
式中:n(t)为噪音信号;A(θ)为转向向量;D为波程差。
边缘似然估计的思想一部分来自于最大似然估计理论,而最大似然估计理论的核心就是构建概率模型。根据接收信号模型的可知性,最大似然估计算法一般分为确定性最大似然(Deterministic Maximum Likelihood,DML)和随机性最大似然(Stochastic Maximum Likelihood, SML)两大类。本文方法研究探索的是未知的接收信号,故其基于后者。
1.2.1 边缘似然函数
根据经验和基本假设,噪声信号基本符合高斯分布规律,且均值为零,噪声方差设为σ-2,则对于每次快照可以得到其概率分布函数如下:
式中:y表示单个快照下传感器接收的信号;s表示信号源发射的信号;M为传感器个数。对所有单次快照的累积就可以得到P( |Y S,θ)。
应用边缘似然将S这一隐变量从似然函数中去除,引入先验参数α,于是有:
式中:Y表示接收信号矩阵;S表示发射信号矩阵。由对数似然的求和性,可以通过先单一再求和的思路求解,即L(α,θ) =∑L(α),于是对于每一个α,有:
式中:C=σ2E+A(θ)Λ-1AT(θ),E为单位矩阵。
于是,利用求和得到模型的边缘似然函数为:
为求该边缘似然L(α,θ)最大化的和,继续利用上述求和思维对模型整体边缘似然函数先进行单一参数对的优化再进行叠加(此处为加权叠加)。这么做的好处在于:一方面,充分利用对数似然的求和性降低算法的复杂性;另一方面,也可以借助学习算法通过可行域搜索迭代自适应学习模型的真实大小,实际作用的意义便是算法不需要预先知道信号源个数K,这相较于很多基于空间谱估计的算法有着极大的优势。于是,观察L(α,θ)的表达式,需要将其中的C进行分解:
C-i是中剔除掉第i项以后的剩余项,代回式(7)有:
式中L(α-i,θ-i)表示L(α,θ)中剔除后的对数似然函数。自此得到关于单个参数对所对应的对数似然函数L(αi,θi),这便是单一参数对的优化对象函数。
式中:p是当前θi所对应的转动向量a(θi)在整体y(t)中影响度的表征量;s是当前θi所对应的转动向量a(θi)在整体中其他a(θj)相似度的表征量。同时发现,即使已经将L(α,θ)“碎片化”成L(αi,θi),但是由于每计算一对p和s就需要计算一次不同的C,整体计算量会随着快拍数量的增加而急剧增大,为了解决这一问题,用后验协方差矩阵Σ对其做统一化处理:
对于先前引入的先验参数αi,由N(s(t) |0,αi)可知,αi决定了分布幅度及离散程度,若αi在0→∞范围内取的值在一定程度上反映了其所对应的θi的a(θi)相较于真实模型的可信度(成反比),也即αi值越大可信度越低,αi值越小可信度越高,这说明在引入先验参数时的赋值(正的有限值)对于优化估计过程有着监督的作用。如此以来,对边缘似然函数L(αi,θi)的各个参量及中间变量均有了清晰的认识。
1.2.2 优化函数
优化的任务就是寻找能够使得L(αi,θi)最大化的参数对:
该似然函数中有两个参量αi、θi,由于在算法中搜索到的或者初始化模型中的θ是已知的常量,将L(α,θ)对α进行求导,可以得到L(α,θ) 关于α的梯度函数(α>0):
由梯度函数式(13)可以得到:当p≤s时,L(α,θ)对于α>0 是恒单调递增的,若需要达到L(α,θ)的最大值,α需要达到无穷大,而此时的θ可信度趋近于0,不可取;而当p>s时,函数在α=s2(p-s)时取得最大值,将α=s2(p-s)代入到式(9)中,则函数成为只包含参量θ的函数形式,并通过化简得到:
新的对数似然函数此时关于中间量x在其定义域内为单调递增的状态。故得到最终所需要的优化函数为:
算法设计遵循流行学习的理念,基于边缘似然最大化的理论,步骤如图2 所示。
图2 远场源参数估计流程图
1)新建模型
①选取任意个角度值θi∈[-π/2,π/2],将a(θi)加入模型,并给先验参数αi赋初值:
②通过后验的方式初始化信号的均值向量:
式中Σ为后验协方差矩阵,可由式(11)计算得到。利用信号后验均值信息,每当模型内部出现向量的变动时(包括初始化),需要对噪声方差进行同步更新:
式中:M为阵列阵元个数;K为模型当前估计的信号源个数。
2)模型优化判别准则
①算法过程包括三项操作——增、删和改;
②计算每一个pj/sj>1 的搜索结果βj的对数似然函数值:ΔLj= L(αj,βj);
③保留ΔLj值最大的一项βj,并以ΔLj作为βj项加入模型对当前模型的对数似然函数引起的变化值;
④模型内部的θ值,当pi/si≤1 时,所对应的θi为待删项,其对当前模型的对数似然函数引起的变化值为ΔL =- L(αi,θi);当pi/si>1 时,θi为保留项,αi的后验估计值为α*i,则其对当前模型对数似然函数的影响为:ΔL*= L(α*i,θi) - L(αi,θi);
⑤比较在对每一个角度值(βj及模型内部模型所有θi)进行单独操作时引起的对数似然函数的变化情况,并选择执行能够令模型整体对数似然函数最大化的一项进行执行。
2.2.1 解向量搜索
在实验验证过程中,发现模型更新迭代会因出现的局部极大值而发生不可逆的偏离现象,经过分析,这是由于原先算法只会一直选择当前搜索到的所有网格中使优化函数最大的唯一一个向量,实际中往往是多极值情况,就会出现一直趋向于该极值点而背离其他极值点的情况,最终导致出现算法结果相比真实情况遗漏的情况。
为此,将搜寻解向量的方法做了以下改进:增加待选组,将搜索到的所有网格以优化函数的大小为依据进行正序排列,每次在序列的前30%项中随机抽取作为该次搜寻得到的最终解向量,这么做的目的可以避免迭代运算对于单极值点的一致粘黏性。
2.2.2 模型自检
实验中发现,在每次循环中都增加一次模型自检过程,可以大幅度减少运算次数,这与算法的执行依据和运算过程是吻合的,搜寻解向量的目的是为了用搜索到的偏差更小的向量更新、替换、删除现有模型中偏差大的向量,原始算法中明显缺少对于模型已有向量的滤除机制,如果不增加模型自检,模型自身向量的筛除将依赖于外部搜索向量,这无疑是不合理、不高效的。
2.2.3 模型优化判别准则
在对实验迭代过程的追溯分析中发现,屡次出现即使搜索到结果βj与现有模型中的角度极度相似,也出现冗余性重复替换,为此,为了提高算法效率,将相似度加入判别准则。于是得到:
1)优化后的判别准则
①算法过程包括三项操作——增、删和改;
②计算每一个pj sj>1 的搜索结果βj的对数似然函数值L(αj,βj);
③计算每一个搜索结果a(βj)与模型内部所有a(θi)的相似度,并取最大值项φmax作为a(βj)与模型的相似度值φj;
④以Lj与φj比值的大小按正序排列βj,自前30%项中随机抽取一项βk,并以其ΔLk作为βk加入模型对当前模型的对数似然函数引起的变化值;
⑤模型内部的θ值,当pi si≤1 时,所对应的θi为待删项,其对当前模型的对数似然函数引起的变化值为ΔL=- L(αi,θi);当pi si>1 时,θi为保留项,αi的后验估计值为α*i,则其对当前模型对数似然函数的影响为ΔL*=L(α*i,θi) - L(αi,θi);
⑥比较在对每一个角度值(βk及模型内部模型所有θi)进行单独操作时引起的对数似然函数的变化情况,并选择执行能够令模型整体对数似然函数最大化的一项进行执行。
2)改进后的算法步骤
改进后远场源参数估计流程图如图3 所示。
图3 改进后远场源参数估计流程图
2.3.1 近场信号模型
近场信号(本文将其限制在近场信号源与阵元阵列距离处于菲涅耳区域内)估计问题当中,一般是用极坐标系(θ,r)来表征的,参考远场信号的边缘似然最大化估计的推导,可以发现近场信号的优化函数会出现两个参量(θ,r)的情况,这不仅会在优化过程中出现梯度函数,同时由于各参量间的物理意义的不同而导致具体数值会存在高量级程度的差异(即使将弧度制转变为角度制,相较于r的可能数值也常常不在一个数量级上)。这就导致在优化过程中需要研究两者的搭配要素或者规律,这无疑严重影响了边缘似然最大化算法的效率。经过分析研究,考虑将极坐标表征方式转换为笛卡尔坐标系,二维坐标x和y具有对等性,利用距离公式:
可得波程差,这样做的好处在于优化的参数恢复为单个d,基于该思路,在远场信号算法的基础上设计近场信号的估计算法。
2.3.2 模型优化判别准则
在近场做边缘似然最大化估计,首先遇到的问题便是与平面波不同,球面波在与不同阵元不同距离上呈非线性变化特性,且距离差距产生的影响不仅不能忽略反而还很显著。因此,可以预料到原本用于远场信号的筛选判定阈值的数值1 会失效,但是基于在远场中的推导,不可否认的是即使在近场情况,该判定原函数在客观上是具备有效性的,因此只是具体的判定阈值或许不再是1,而不是全面否决该判定方法。另外,根据近场的特点,极坐标转换笛卡尔坐标实现了对等性的同时也将距离差距Δr上的不可忽略的非线性变化特性以相较于θ高量级的加权值融合于d,再考虑到要与噪音信号比对过滤,转换的结果无疑于给接收信号增加了很大的个性因素,从而导致模型向量与噪音向量的统计差异性显著增大,而似然函数也是从统计中导出的。因此在实验中通过尝试将信源和噪音分别单独随机变化以及同时随机变化来探索规律,最终发现在信源数较少的情况下,模型向量与噪音向量二者之间的确存在二分集群现象。
通过以上的研究和探索,确定了以模型向量与噪音向量二者差异性为判定依据的思路。
2.3.3 算法过程
近场源算法过程继承于远场源算法,主要做了两方面修改:
1)修改了优化函数最大化判别算法,这是基于上述探索及实验验证。同时,由于初始值设定的随机性可能会造成糟糕的算法起点,故近场源的判别算法是基于统计差异性而不是如同远场情况的确定值,因此需要差异化的样本。为此在每次的算法迭代过程中,都会统计本次在更新模型、模型自检这一步的所有转向向量(包括模型内部及解搜索)更、删、改的操作所对应的p、s及其比值,建立本次循环分组性数据字典,计算各组统计数据,并将其加入总循环分组性数据字典,当循环次数≥n时,将当前循环(记为m次)的统计数据与前(m- 1)次的统计数据做收敛性判别,如果达到收敛条件,则更新近场源优化算法中的判定阈值。
2)将每次迭代后判断为非收敛的结果模型以新建模型步骤重新进行建模后参与下次迭代。如此不仅能提高算法样本的更新速度,提高样本的真实覆盖率,保证算法的准确性,也有利于消除累计误差,保证算法具有一定的纠偏性,同时也能提高提取优化模型向量与噪音向量的二分集群现象的统计差异特征的效率,并更好地生成更新模型优化判别准则的参考依据。
2.3.4 算法步骤
相较于远场算法,有以下新增步骤及改动:
1)增加分类算法用以区分噪音向量与模型向量;
2)提取、识别和建立噪音向量与模型向量的特征值样本库,在迭代过程中不断更新;
3)判定噪音向量、模型向量各自特征值样本收敛情况,并更新模型优化函数判别准则阈值;
4)将每次迭代后判断为非收敛的结果模型作为新的比对模型参与下次迭代。
近场源参数估计流程图如图4 所示。
图4 近场源参数估计流程图
实验基本情况:包含12 个传感器的线性均匀分布阵列,仿真平台来自于https://github.com/morriswmz。其中传感器之间的距离固定为信号波长的一半。同时,在不同信噪比情况下利用均方误差将本文算法与MUSIC对比,来验证本文算法的有效性。
从图5a)中可以看出,优化函数的极值分布与真实信号源的分布情况几乎一致,说明了算法是正确的。另外,从图5b)、图5c)中可以看出验证算法在信号源数量较少的情况下避免了迭代运算对于单极值点的一致粘黏性,没有出现极点遗漏情况。
为了进一步测试针对解向量搜索的改进效果(改进的本质过程是由固定性转为随机性),以改进机制的有无进行三源估计,重复实验共计100 次,并在两种情况下分别计算均方误差,实验结果如图6 所示。可以看出,有改进机制的均方误差明显低于无改进的情况,故而该项改进措施对于提高模型性能有着明显的积极作用。
图6 解向量搜索的改进措施对算法的影响
最后,对边缘似然最大化估计算法和MUSIC 算法进行比对,实验设定信源个数为2,信噪比(SNR)范围为[-5,5],共重复300 次,计算两种方法的均方误差,实验结果如图7 所示。
图7 MSE-SNR 结果
从实验结果中可以看出,本文算法均方误差与信噪比成反比,且随着信噪比的增大而明显下降,说明了算法的正确性。同时也可以看出,边缘似然最大化估计算法比传统的MUSIC 算法有着更低的均方误差数,在精度上有一定的优越性。
近场信号源估计实验基本情况:除了将信号源设定为互不相干且处在菲涅耳区域内以外,其他条件全部与远场实验保持一致。
为了验证远场信号算法的判定函数在近场情况下仍然具备客观有效性,以及以模型向量与噪音向量二者差异性为判定依据的合理性,将近场算法无限循环,每一次循环过程中加入不同的随机噪声信号,然后计算真实模型向量与噪声向量在优化函数p s的变化情况。从表2 可以看出,p/s函数值确实已经不等于1,而且模型向量与噪声向量之间存在较为明显的差值,这也佐证了二者差异性显著增大的猜想,同样也验证了以二者差异性为判断依据的合理性和可行性。
表2 迭代过程中模型向量优化函数统计
此外,以[9,5]和[0,7]作为两个信号源的位置,进一步观察模型优化函数峰值的变化,最终的实验结果如图8 所示。
图8 优化函数分布图
从以上实验结果可以看出,在信号源个数不多的情况下,成功找到了真实解向量,并且在将真实解向量提前导入的情况下,算法也成功避免了迭代运算对于单极值点的一致粘黏性。以上的实验结论进一步证实了将远场拓展至近场算法的成功性。
最后实验也对近场信源定位算法进行了评估。信号源数量为2,共计500次重复实验,取其中初始化质量最高的300次作为估计样本求取均方误差,测试了在不同信噪比(范围为[-10,10])情况下的估计结果,如图9所示。
图9 近场源估计MSE-SNR 对比图
可以看出,算法在不同信噪比状况下均有很好的效果,且均方误差随着信噪比的提高而明显下降。
本文将边缘似然最大化估计算法在远场应用改进优化的基础上,对近场估计问题进行了更加深入的探索与设计。初步分析了将算法延伸至近场的影响因素和可行性,并与其他理论相结合提出了一种新的设计方法和思路,希望能够有助于接下来更进一步的研究工作。本文虽然在现有的知识体系上对近场源的边缘似然最大化估计算法做了一定的全新探索和设计,但是还有很多需要探讨和完善的地方,下一步将在场源阵元的分布、数量、相干信号以及由二维空间扩展至三维等方面做进一步的研究。
注:本文通讯作者为左炜亮。