董晓红 康平
摘 要:声源定位技术是当今人们研究的热门问题,广泛应用于医疗、交通、雷达、远程会议、航天、机器人等先进领域。其原理是通过麦克风来获取语音信号,分析并处理数字信号,来确定声源的位置。本文用麦克风树时延估计声源定位法确定声源的位置。先介绍麦克风树的原理,按照麦克风树离声源的远近,将模型分类。
关键词:麦克风树;近场模型;远场模型
1 问题分析
语音信号通过麦克风拾取,然后通过数字信号处理技术把拾取出的语言信号进行处理和分析,来确定声源的位置。通常使用单个麦克风来识取,但其拾音范围很有限,拾取信号的效果不是很好,如果我们把若干(≥1)只同样型号的麦克风固定安装在一个刚性的枝形架子上(可水平移动),组成一个麦克风树,不同的麦克风所处位置的不同,录制到的声音也有细微的不同,进而通过对数个麦克风识取的声音进行对比分析,得到许多有关声源的信息,就可以确定声源的位置。
2 问题的求解
2.1 麦克风树语音信号处理模型概述
将一组不同位置的声学传感器(麦克风),按一定规则或形状,排成一个阵列,采集声音的空间特性叫做麦克风树。
用来采集声音信号,来获取声源的位置信息。按照麦克风树离声源的远近,将模型分类,通常分为进场和远场。
声波由发声体(声源)产生振动,借助空气等各种介质向四面八方传播,是一种纵波。也属于是球面波。
根据麦克风树距声源的不同,将声场模型分为两类:近场和远场。近场模型将声波归类为球面波,因此需要考虑不同阵元间的相位差;而另一种远场模型,则是把声波发出的近似为平面波,相反的是不考虑麦克风不同阵元间接收信号时产生的相位差,而把不同阵元接收信号看成时延关系。因此远场模型可看做被简化的实际模型,这样就可以最大限度的简化处理不同信号的难度,一些语音增强法就是在此基础上产生的。
一般来说远场模型,即麦克风树距声源较远,声源传导至麦克风树各不同阵元件的幅度差较小,可以不做考虑,看做平面波模型;近场模型,即麦克风树距声源的较近,不同阵元间接收信号时产生的幅度差无法忽略,此时看作球面波模型。
远场模式和远场近场通常使用下面这个公式对近场远场进行区别:
r是参考阵元与声源距离,λ为声波波长,L为阵列长度。在现实运用时,式中的r与参考阵元与声源距离r0相比,确定近远场:若r0
2.2 近场模型的实际运用
假设本次模型试验对象处于近场位,和远场位有所不同的是,近场位模型需要考虑到声音发出的位置与每个麦克风之间的相位差,声音发出位置和各个麦克风的距离不再是等距,定位的空间从原来的一维拓展的二维。声音发出位置到每个麦克风的声波幅度减弱也相当重要,不可被忽略。根据声波传播特性可以知道:声波随着传播距离的增高,声波的声压也会随之降低,故声波传播距离与其幅度的变化成反比。
图2引入了任意一个发声源Si(t)和各个麦克风的距离的参数rji,以阵列中心為参照点,Si(t)到参照点的距离为ri其他的参照数与图2一样,只要将rji求出,便可以得到型号传输方向矢量A,因此得出一个结构关系式图1:
近场的均匀线阵接收到的信号可以如图2:
在这条假设中使用的近场均匀线阵模型用时延估计法是无法研究,所以这条近场均匀线阵模型不在继续进行研究。
2.3 求解远场模型
若声源处于远场,则麦克风树成直线排列,且每个麦克风间隔为半个信号波长。通常来讲,语言信号的频率往往在101~3401HZ间,在空气中传播的波长一般都在100~340cm,由此可得,每个麦克风的距离一般在6~15cm之间。
因为远场模型中麦克风收集到的声波为平面波,所以每个麦克风接受到的信号相对相位相同。声源s(θ,r),麦克风接受到的信号与信号的入射角和信号的频率都有关系,因此远场模型还能表示为均匀线阵:
在该式中,ω为角频率,公式中的τji是第i个信号传导第j个麦克风,与第i个信号传导第1个麦克风达的延时参数。τji可表示为:
假设知道在该模型中声音在空气中的传播速度为v,时延TDOA为s,因此l=s*v,根据这些从而求出θ2=arcsin*l/2d,θ1=π/2-θ2。可确定该模型中发声源人的位置,并用广义互相关时延估计算法算出。
该方法的阵列由两个麦克风构成,并接收信号,可列函数为:
2.4 麦克风声源定位的研究与设计
流程设计。本文算法简易,计算量小,应用广泛。广义互相关函数的原理是:首先是求出x1(w)和x2(w)之间的互功率谱函数,通过一些考虑权重的计算,然后经傅里叶反变换法,变换到时域,这样我们就能求出x1(w)和x2(w)的互相关函数,求出极大值,然后两个极大值相减后的绝对值,求出两组信号的时延。
广义互相关时延的估计法相对其他时延估计法简单很多,该方法方法先估计时延,再通过一简单运算就即可确定声源位置。本文的麦克风声源定位是远场定位在二维平面上实现的,只需要把声源与麦克风树的角度求出即可,然而这个角度需要测出两个时延估计值,三维空间要求测出三个时延估计值,这里不做过多讲解。本文研究二维只需要测量两个独立的时间延迟估计值。每个时间延迟估计值对应于一二个方程,把这些方程求出来就可以求出时延估计,所以进行麦克风树声源定位只需要求出时延估计,再进行一些数学计算,就可以确定声源的位置。根据上面的描述,基于时延估的计算法的运算量比较小,在实际应用中很广泛。
3 结论
本文研究的方法“远场定位法”,以及“广义互相关时延估计法”来确定声源的位置。“远场定位法”,只需测出声音信号到达各个麦克风的时延(TDOA),然后完成简单的数学公式推导即可。该方法计算量小,易于实现,实际应用性强。
参考文献:
[1]吴俣.基于麦克风阵列的声源定位技术的研究.百度文库,2008-5-1.
[2]王君培.基于麦克风阵列的进场声源定位与跟踪.百度文库,2014-6.
[3]孙韶杰,孙绍俊,李国辉,李红梅.一种改进的声测定位时延估计算法[J].计算机应用,2006,(11).
基金项目:内蒙古自治区教育科学“十三五规划课题”数学建模推进高职院校数学课程教学改革的研究NZJGH2019159
作者简介:董晓红(1983—),女,内蒙古包头人,理学硕士,讲师,主要从事高等数学的教学与研究工作。