多声源下基于耳蜗基底膜的声源定位

2015-07-26 08:50许方煜重庆邮电大学重庆400065
山东工业技术 2015年1期
关键词:声源滤波器精度

许方煜(重庆邮电大学,重庆 400065)

多声源下基于耳蜗基底膜的声源定位

许方煜
(重庆邮电大学,重庆400065)

摘要:传统麦克风声源定位在噪声环境下无法精确的定位出声源,而人耳却能准确的辨别出来。根据人耳这一特性,提出一种在多声源环境下基于耳蜗基底膜的声源定位。该方法利用多麦克风进行声音信号的采集[1-2],然后采用基底膜滤波器对声源信号进行滤波,这里采用GC-4滤波器进行滤波,最后再进行声源定位。实验结果证明在多声源情况下基于耳蜗基底膜的声源定位能提高定位精度。

关键词:声源;耳蜗基底膜;滤波器;精度

人耳听到声音的过程是:首先通过听觉系统的外耳,实现对声音信号的收集和放大!然后经由耳道传输至耳膜,经过中耳的阻抗匹配后传导至内耳的耳蜗[3]。耳蜗基底膜对声音信号具有频率选择特性,即不同频率会在基底膜的不同位置产生不同幅度的调谐峰,基底膜的这种频率选择特性相当于一个带通滤波的过程,人耳听觉系统以此实现对声音信号的滤波.经过基底膜滤波之后的声波信号传递到内毛细胞.内毛细胞接受耳蜗传来的振动信号,经过半波整流之后将其转换成神经电信号由听觉神经纤维实现对声音信号的脉冲编码。

1 耳蜗基底膜特性

声音信号在耳蜗中传输时,耳蜗对声音信号进行滤波处理,此时耳蜗相当于一组带通滤波器。而耳蜗基底膜贯穿了耳蜗的底部到顶部,是耳蜗内对声音信号滤波的主要执行者。耳蜗基底膜主要有以下几个特性:(1)频率选择;(2)频谱分析特性;(3)滤波器频率响应的非对称;(4)滤波器频率响应的强度相关。

耳蜗基底膜上的每一个点都在一个特定的频率下响应出现峰值。对高频声学信号,耳蜗基底膜的峰值出现在基底膜的底端附近,相反对低频声学信号,耳蜗基底膜的峰值出现在基底膜的顶端附近。耳蜗基底膜纵向位置上,存在频率部位的转化关系。在耳蜗基地膜的顶端开始,500Hz以上声音信号,相对带宽基本为恒量,其最大方位的包络的线性距离与频率的对数基本上呈线性关系,耳蜗基底膜的与频率的这种联系如(1)式所示:

BF的单位是kHz;x表示的是基底膜某处离基底膜顶部的长度和基底膜的全长的比值,一般数值在0~1范围内;表示的是常数参量(=2.1);k表示的也是常数参量(k=0.85)。A表示的也是常数参量(这里取值为A=0.1654)。

耳蜗基底膜的特性明显可以看出耳蜗基底膜具有滤波的作用,由此可建立滤波模型。

2 GC滤波器的设计改进及实现

基底膜特性可以建立一个更加符合人耳听觉特性的滤波器,使其具有更好的频率选择性能,本文选用GC滤波器,并对其进行改进。GC滤波器是一种标准的耳蜗听觉滤波器,该滤波器组的冲激响应的典型模式为(2)式所示:

a表示幅度;n和b用来调整伽马函数的分布;fr表示GC滤波器的中心频率;ERB(fr)表示当频率为fr时,听力正常的人平均听力的等效矩形带宽;表示初始相位;lnt表示时间的自然对数;u(t)表示单位阶跃函数;c表示啁啾因子。当c=0时,上式可以简化为GT滤波器的时域表达。

通过傅里叶变换,上式可变为GC滤波器的幅频响应,如式(3)式所示:

由上述可以知道,GC滤波器是由GT滤波器级联一个非对称补偿滤波器得到,所以,其改进实质上是在GT-4上级联一个非对称补偿滤波器。而文章的非对称补偿滤波器没有冲激响应函数,需要从补偿滤波器的设计方法实现。

由式(9)分析可以得到,将GT-4滤波器级联一个低通滤波器,然后再级联高通滤波器后,最终形成GC-4滤波器。

然后利用改进后的GC-4滤波器进行滤波,最后利用内毛细胞模型,耳蜗核模型以及神经纤维模型获取脉冲发放率。最后采用映射求和互相关算法求得双耳对应频率通道的互相关函数。这里的加权函数采用相位变化加权函数。具体表达式如公式(10)所示:

相对于空间坐标中的新函数,将其定义为映射GCC函数(mGCC)。通过映射函数,便可以得到左右两个相同频率通道求得的空间坐标。然后求得各频率通道中目标声源分量的空间坐标。然后将保留下来的空间坐标进行相加,如式(5.35)所示各信号源的位置。该式定义为求和GCC函数(sGCC)。

3 声源定位估计通过找到在全局坐标式最大的峰值位置来确定

如公式(14)所示。在一个声源的时候,值存在一个最大的峰值。而且,当存在多个声源的时候,求和GCC的结果不仅仅是唯一的峰值,还存在第二个或者多个峰值,这是因为空间坐标相加得到的峰值位置表示的声源的位置。在多声源下基于耳蜗基底膜的声源定位角度误差明显小于其他两种方法。由此证明:在多声源环境下,基于耳蜗基底膜的声源定位系统比基于麦克风阵列的定位系统和基于过零点的声源定位系统具有更高的定位精度。

参考文献:

[1]赵秀粉.基于麦克风阵列的声源定位技术研究[D].电子科技大学,2013.

[2]基于小型麦克风阵列的声源定位技术[J].华中科技大学学报,2013,(41):1671-4512.

[3]曲天书,曹松潍.双耳时间差和强度差与声源距离线索关系的研究[J].北京大学学报,2010,46(06):0479-8023.

[4]罗元,陈君.基于耳蜗基底膜特性的语音特征提取方法及在智能轮椅上的应用[J].计算机应用,2012,29(10):1001-3695.

作者简介:许方煜(1989-),男,福建福鼎人,硕士研究生,研究方向:语音识别。

猜你喜欢
声源滤波器精度
基于圆柱绕流的气动声源识别方法
基于不同快速星历的GAMIT解算精度分析
虚拟声源定位的等效源近场声全息算法
浅谈有源滤波器分析及仿真
基于多模谐振器的超宽带滤波器设计
热连轧机组粗轧机精度控制
计算辐射噪声的面声源和点声源结合方法
从滤波器理解卷积
基于GCC-nearest时延估计的室内声源定位
以工匠精神凸显“中国精度”