石超宇,王志强
(上海大学 通信与信息工程学院,上海 200444)
到达方向(Direction of Arrival,DOA)估计是声学应用中非常重要的部分。高效、准确的DOA估计有助于在声学场景特别是实时场景进行信号的分析和处理。声矢量传感器可以同时测量某处的声压和粒子速度,且凭借其体积小、适用范围广等优点逐渐成为研究人员和市场青睐的产品,使得针对传统全向麦克风阵列信号的DOA 估计方法也扩展到了矢量信号。Hawkes 将最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)应用于矢量声信号[1],并且也扩展到在多个声矢量传感器构建成的线性阵列中使用MVDR[2];适用于矢量信号的多重信号分类(Multiple Signal Classification,MUSIC)算法[3]和基于旋转不变技术的信号参数估计(Estimating Signal Parameter via Rotational Invariance Techniques,ESPRIT)算法[4]等超分辨率算法在估计精度方面明显优于MVDR 和到达时间差(Time Difference of Arrival,TDOA)等方法;针对单声源场景对矢量声信号可以使用声密度矢量区分直达声和漫射声,并估计直达声方向[5]。为了在时间敏感的应用场景中保证一定估计精度的情况下及时获取DOA 信息,本文提出了适用于矢量声信号的实值EB-ESPRIT 算法。
以Ylm(φ,θ)表示复值球谐函数:
其中l≥0 和|m|≤l分别表示阶数和模,Plm表示阶数和模分别为l和m的勒让德函数。定义球麦克风阵列的接收声压信号:
其中,k表示波数,r为球阵列半径,模式强度bl(kr)=il·ρl(kr),ρl(kr)是l阶球贝塞尔函数。考虑球谐函数与AVS 通道的相关性,如图1 所示,将l的最大值限定为一阶,在限定阶数与模的条件下,对AVS 信号转化为球谐域信号,从而使用适用于球麦克风阵列的DOA 估计方法[6]。
实值球谐函数Rlm(φ,θ)可以表示为:
其中i2=-1。令Ω=(φ,θ),定义:
L表示球谐域最高阶数,则:
UL为(L+1)2阶酉矩阵。将信号空间展为{y*(Ω1),y*(Ω2),…,y*(ΩM)},则M个最大的特征值满足条件:
Q为M×M可逆矩阵。对于每个声源所对应的DOA 向量Γ(Ωm),有:
使用以下递推关系[7]:
其中:
定义实值矢量信号Xℜ和实值功率谱密度
Qℜ为M×M实数矩阵。通过式(10)及递推关系(11),可以得到:
将实验场景分为单声源场景和双声源场景,混响时长分别设置为0 ms、300 ms、600 ms,接收信噪比为5 dB,每组实验选取10组不同方位取平均值。实验中将MUSIC 算法与实值EB-ESPRIT 算法的性能进行比较,另外在双声源场景中加入了与Habets算法[8]的比较,实验结果如图2~图5 所示。
实验结果表明,在单声源场景下,相比于MUSIC 算法,R-EB-ESPRIT 算法可以在估计精度基本一致的情况下降低计算开销,计算开销的降幅达到20%左右。在双声源场景下,R-EB-ESPRIT算法的估计精度相比于MUSIC 算法有所下降,但在计算开销上仍有一定的降低。此外,相比于Habets算法,R-EB-ESPRIT 算法虽然在计算开销上超过前者,但在估计精度上远高于Habets 算法。
针对特征空间算法的计算复杂度较高的问题,结合声矢量传感器的阵列特性,将球谐域DOA 估计方法EB-ESPRIT 应用于矢量声信号。实验结果显示,该方法可以在保证一定估计精度的情况下,相比于MUSIC 算法降低约20%的计算开销。