王元昊,王宏强,杨 琪,邓 彬,罗成高
(国防科技大学 电子科学学院, 湖南 长沙 410073)
太赫兹指的是频率在0.1~10 THz之间的电磁波,太赫兹雷达就是指工作在太赫兹频段下的雷达。相比于传统微波频段雷达,太赫兹雷达在精度方面具有天然的优势,使其在拓展传统雷达应用领域上具有巨大的潜力。声音活动检测(Voice Activity Detection,VAD)指从包含声音的信号中确定出声音的起点及终点,即确定待处理信号是否为有效声音信号,是声音信号预处理的重要一环。对于后续的声音增强,声音识别等处理具有重要意义。目前的VAD算法多采取基于信号特征的形式进行声音或非声音的判别,常用的特征有能量、频域、倒谱、谐波等。但这些特征都依赖于所获得信号中的噪声分量具有和声音分量显著的特征差异,基于深度学习的VAD方法也基本建立在特征值的提取上[1-2],显著的特征差异对于识别算法起着至关重要的作用,获取声音信号的方式对于特征值的获取也有着至关重要的作用。
目前,麦克风方式是发展最为成熟[3]、应用最为广泛的一种声音信号获取方式,但是利用麦克风存在一些弊端,导致其应用受限:一是抗干扰能力差,即面对所期望得到的声音湮没在噪声中或传输路径中存在干扰声源时该方法难以取得良好的性能。二是作用距离近,因为声音信号在空气中的衰减较大,所以一般都会放置在声源米量级内的位置来获得最佳的效果。但若在麦克风接收路径上存在其他声源的声音干扰,则即便是信道噪声不强,在进行VAD时也会存在较大的误差。因此,探索一种新的VAD手段具有重要意义。探测声波本质上是探测物体的振动信息,而雷达天然地具有测距能力。王健琪团队在2016年提出基于94 GHz雷达的生物声音获取系统[3-4],利用毫米波雷达对人声带振动信号进行远程检测从而得到声音信号。Khanna等在2019年提出基于多普勒雷达的声音识别系统[5],该系统放置在离人咽喉很近的地方。相比于麦克风,雷达获取声音信号的方式可以认为是远程直接探测声源表面的振动,可以有效地避免传输路径上其余声音干扰带来的影响。但是上述对于雷达声音获取技术的研究仍然存在不具备目标选择能力以及多目标同时获取能力不足的问题。
为此,本文提出一种基于载波频率为120 GHz的宽带太赫兹雷达的VAD技术,综合利用太赫兹雷达频段高和带宽大的特性,实现多声音信号活动检测,同时通过谱减-小波联合去噪方法提升雷达获取声音信号的质量。
声音信号本质上是由物体振动产生的机械波。假设一个无向声源,该声源的振动方程为f(x,t)|x=0。根据傅里叶变换原理,声音信号可以分解为不同频率、幅度的正弦信号的线性叠加,因此,f(x,t)|x=0可以重写为:
(1)
式中,Aω是频率分量为ω的谐波所对应的振幅,φω是其相应的相位值。
考虑M个主要频率分量以及因路径传播所带来的延迟,式(1)可以重写为:
(2)
式中,Aωi是频率分量为ωi的谐波所对应的振幅,φωi是对应的相位,λ表示波长。
当声波传递到硬质介质表面时,会引发该介质的振动,考虑振动方程:
(3)
式中,δ为阻尼系数,ω0表示物体本振频率,m表示该物体质量。
假设M=1,求解式 (3) 可得:
(4)
分析式(4)可得,含有e-δt的前两个振动项为自由振动,会随着时间迅速衰减,而只有最后一项为受迫振动,该受迫振动项将以与声源频率相同的频率振动且振幅与声源振幅A呈线性关系。
设太赫兹雷达发射调频连续波,记发射信号为:
(5)
式中,f0是中心频率,γ是调频率。
假设目标有N个散射中心,可以得到回波信号表达式为:
(6)
设参考信号为:
(7)
式中,c为光速,Rref为参考距离。
将回波信号r(t)和参考信号sref(t)相乘,得到去斜后信号:
(8)
进一步利用相位测距[6-7]原理可得到目标位移如下:
Δφ=angle[r′(t+Δt)-r′(t)]
(9)
(10)
在得到位移变化序列后进一步通过联合谱减算法[8-9]以及小波去噪[10]提升信号质量。
谱减法是从含噪信号功率谱中减去噪声功率谱,要求噪声与纯净声音信号不相关。纯净声音信号与噪声的相关性决定了去噪后声音信号的质量。然而,由于有色噪声的分布特点,去除噪声的效果并不理想。但是有色噪声的功率很低,可以采用小波去噪的方法。因为小波去噪的基本思想是对信号进行小波变换,通过选择合适的阈值来保留较大的小波系数,从而保留了信号的主要分量。
记通过相位测距处理得到的位移序列y[n]={R(t),R(t+T),…,R(t+mT)},其可以认为是含噪信号,假设纯净声音信号和噪声是不相关的。
含噪信号可以表示为:
(11)
其中,x(n)表示干净信号,dcgn(n)表示有色噪声,dwgn(n)表示白噪声。
将式(11)转换到频域,可以表示为:
(12)
其中,Y[k]、X[k]、Dcgn[k]和Dwgn[k]分别是y[n]、x[n]、dcgn(n)和dwgn[n]的傅里叶变换。
进一步转换成功率谱可得:
(13)
通过选择不含声音信号的一部分来估计纯净信号:
(14)
最后,通过小波降噪的方法进一步去除dcgn[n],从而得到干净声音信号x[n]。信号处理框图如图1所示。
图1 太赫兹雷达声音活动检测信号处理框图Fig.1 Signal processing flow of VAD system for terahertz radar
本文所设计太赫兹雷达声音活动检测系统主要由原始数据获取前端和数据精细化处理后端组成。其结构框图如图2所示。原始数据获取前端主要是一部太赫兹雷达,其发射波形为调频连续波,中心频率为120 GHz,带宽为0.1~4 GHz(可调节),扫频周期为0.1~1 ms(可调节)。数据精细化处理后端主要由一台上位机组成,其作用是控制雷达参数、接收雷达数据并处理。
因为雷达的距离分辨率为Rres=c/(2B),带宽B选择为500 MHz可以区分目标声源与干扰声源。扫频周期选择为0.5 ms,扫频周期的倒数对应于实际对声源信号的采样率,0.5 ms对应采样率为2 000 Hz,可以基本满足对于检测声音活动的需求。
图2 太赫兹雷达声音活动检测系统框图Fig.2 Block diagram of VAD system for terahertz radar
设计实验场景如图3所示,实验环境为微波暗室和户外,选取两个蓝牙音箱分别作为目标声源和干扰声源,目标声源播放声音“电子科学学院”,声音信号获取系统选择麦克风和太赫兹雷达,麦克风系统主要用来与太赫兹雷达对比所获得声音信号的VAD性能。
(a) 实验室环境(a) Laboratory environment
(b) 户外环境(b) Outdoor environment图3 实验场景Fig.3 Experimental environment
实验室环境下太赫兹雷达测得的声音信号如图4所示。对于目标声源,雷达通过相位测距方式得到的原始信号、经过谱减法降噪后的声音信号、谱减法与小波去噪结合降噪后的声音信号的信噪比分别为7.53 dB、20.69 dB和36.55 dB。 对于干扰声源,该数值分别为9.69 dB、20.10 dB和29.38 dB。从图4和计算的信噪比可以看出,谱减-小波联合降噪算法具有明显的信噪比改善。
(a) 目标声源(a) Desired speech signal
(b) 干扰声源(b) Interference speech signal图4 实验室环境下的太赫兹雷达探测声音信号结果Fig.4 Results of acoustic signal acquired by terahertz radar in laboratory environment
同样给出户外测试的结果,如图5所示。从图5中可以看出,相比于实验室环境,户外环境下原始提取信号的幅度抖动十分剧烈,通过所提谱减-小波联合降噪方法可以有效抑制噪声,保留声音信号。
(a) 目标声源(a) Desired speech signal
(b) 干扰声源(b) Interference speech signal图5 户外环境下的太赫兹雷达探测声音信号结果Fig.5 Results of acoustic signal acquired by terahertz radar in outdoor environment
麦克风在实验室环境中采集的声音信号的结果如图6所示。由于麦克风不能区分不同位置处的声源,采集到的声音信号存在严重混叠现象。
图6 麦克风采集声音信号VAD结果Fig.6 VAD result of microphone
从图6中可以看出,麦克风所采集声音信号无法区分声音信号来源是目标物体还是干扰物体;当在传输信道中施加干扰声源后,麦克风采集声音信号难以正确判断目标物体是否进行声音活动。
图7展示了基于太赫兹雷达所采集声音信号的VAD结果。因为雷达天然地具有距离分辨的能力,所以首先通过距离分辨选择目标所在的距离单元数据进行进一步分析,可以有效地避免采集到来自干扰声源的信号。通过对比图6可以明显看出,基于太赫兹雷达采集的声音信号的VAD效果明显优于麦克风方式。
图7 雷达采集声音信号VAD结果Fig.7 VAD result of terahertz radar
进一步,通过声源与雷达的距离来对该系统的应用场景进行评估,以信噪比作为评判标准,捕捉最初无声音信号播放时的雷达数据作为噪声样本,得到结果如图8所示。
图8 探测声音信号信噪比与作用距离的关系Fig.8 Relationship between signal to noise ratio and operating distance of sound signal
从图8中可以看出,该系统的探测性能随距离下降十分明显,但该性能的下降可以通过提升雷达功率的方式来得以改善。
本文提出了一种太赫兹雷达多声音检测方法。太赫兹雷达凭借其频率高、 波长短的特点,在相位测距精度上有着显著的优势。本文采用太赫兹雷达进行声音信号获取并进行声音活动检测,同时在相同环境下也设置了麦克风进行声音信号获取来进行对比。实验结果表明,太赫兹雷达声音检测方法在面临传输路径上存在声源干扰时,对目标声源的声音活动仍然有良好的判断性能,在一定程度上可以弥补基于麦克风的声音信号采集系统的不足,该方法为在复杂环境下声音信号的探测提供了一种新的思路。