掩蔽效应在扬声器异常音检测中的应用

2015-02-16 06:03李云红李小英周静雷
关键词:凯撒扬声器频谱

李云红,李小英,周静雷,潘 杨

(西安工程大学 电子信息学院, 陕西 西安 710048)



·信息科学·

掩蔽效应在扬声器异常音检测中的应用

李云红,李小英,周静雷,潘 杨

(西安工程大学 电子信息学院, 陕西 西安 710048)

传统的扬声器异常音检测方法(纯音检测)受主观因素影响会出现漏检、误判等状况,针对虚拟仪器的异常音检测技术效率低、精度低、成本高等问题,提出一种基于掩蔽效应的扬声器异常音检测方法,将异常音功率谱和掩蔽阈值比较,提取掩蔽阈值曲线以上的可闻异常音,再用相关系数进行算法有效性验证,结果表明,(0.0,0.7]参数区间的凯撒窗使激励和噪音的相关系数分别达到0.992 6和0.992 1,可实现扬声器异常音高效、高精度、易操作的检测要求。

扬声器异常音检测;掩蔽效应;心理声学模型

异常音检测对扬声器的品质保障至关重要,对于刚制造出的扬声器,首要的工序就是纯音检测。目前,形成的一些基于声学仪器并按照扬声器主要性能测试标准对其进行基本的常规测量,包括:频响、频率特性、阻抗特性、有效频率范围、输入电功率等扬声器特性参数[1-2]。还有基于一些模拟仪器的扬声器异常音检测技术,但其价格昂贵、检测效率低、操作复杂不能满足在线检测的要求[3]。而纯音检测是完全依靠人耳进行的音质优劣的判断,这很容易受主观因素及各种环境条件等等影响,比如:听音员技术娴熟程度不一、主观感受不一等等[4]。

随后,希尔伯特黄算法(HHT)[5]于1998年问世,韦峻峰等[6]通过希尔伯特黄变换研究异常音信号包含的异常振动模态函数,进行扬声器异常音判决,取得较好的效果。卢学军等[7]通过分析扬声器响应信号的时域特征,利用模式识别技术进行了异常音检测。黄海[8]利用Hilbert-Huang变换研究扬声器纸盆位移信号非线性特性。而信号分析处理方法不可避免地受到其自身局限的影响。比如:小波变换不能实现对信号各分量的瞬时特性的分析等[9-10]。

针对目前扬声器异常音检测技术存在的不足,提出基于掩蔽效应的扬声器异常音检测方法,通过窗函数,可有效改善心理声学模型在异常音检测中的精度,从而提高了扬声器异常音检测系统的效率,非常适合以扬声器为代表的电声器件在线检测。

1 掩蔽效应及心理声学模型

1.1 掩蔽效应

当人耳听觉系统同时接受到两个或多个激励时,由于某些频谱能量的存在掩蔽了另一些频谱能量,即其他声音干扰致使另一种声音被淹没而人耳无法听见,这种现象称为掩蔽效应,被掩蔽掉的声音称为被掩蔽信号,掩蔽较弱的声音称为掩蔽信号[11]。掩蔽效应一般包括同时掩蔽和异时掩蔽。同时掩蔽也称为频域掩蔽,是被掩蔽信号和掩蔽信号同时作用产生的效应,属于一种较明显的掩蔽效应,能持续200ms。通常情况下,频域中,一个能量较大的信号会将其附近能量较弱的信号掩蔽掉,人耳听觉系统就不会感知到较弱的声音。而且,弱音频率离强音越近,越容易被掩蔽,频率距离越远,则被掩蔽的可能性越小[12]。

当掩蔽信号和被掩蔽信号不在同一时间发生而产生的掩蔽效应,叫作异时掩蔽,又称为时域掩蔽。时域掩蔽效应分为超前掩蔽和滞后掩蔽,前者是指掩蔽效应发生在掩蔽信号出现之前的时间段,后者是指掩蔽效应发生在掩蔽信号结束后的一段时间。由人耳听觉感音机理不难理解,到达人耳的信号需经过听觉系统的处理才能将其中携带的信息传到大脑进行分析处理,所以才会产生异时掩蔽效应。

在掩蔽情况下,如果当被掩蔽音的能量达到一定的强度,而刚好可以被人耳听到,这个阈值称为掩蔽阈值或者掩蔽门限。掩蔽门限以下的声音将会被掩蔽掉,声音的能量在该频点掩蔽门限值上方的信号才能被人耳感知到。

研究中,以人耳的生理结构和感知模式为基础,并结合人耳感音机理及人耳听觉掩蔽效应原理,将复杂抽象的人耳听觉感音机理通过建立有效模型来模拟人耳听觉系统掩蔽特征,通过该模型可以求出输入的仿真信号的掩蔽阈值曲线,利用掩蔽效应去除可以掩蔽掉的声音,以下主要围绕心理声学模型I展开异常音检测研究和分析。

1.2 心理声学模型I

心理声学模型I先将音频信号经FFT变换到频域,再映射到临界频带,划分出有调和无调成份,依据所在频率位置及强度大小分别计算单独掩蔽阈值,最后与静音掩蔽阈值结合,得到信号的全局掩蔽阈值。心理声学模型I的仿真流程图如图1所示。

图1 心理声学模型I仿真流程框图Fig.1 Psychoacoustics model I simulation diagram of the process

1)功率谱密度计算:首先对输入的样本语音信号进行分帧处理,再对分帧后的信号进行加窗处理,这里选用汉宁窗,然后进行FFT变换以求取功率谱密度。图2和图3分别为仿真的语音信号及其功率谱归一化到96dB声压级的功率谱密度。

图2 样本语音信号Fig.2 Samples of voice signal

图3 样本语音信号功率谱密度Fig.3 Sample voice signal power spectral density

2)频谱成分划分:有调和无调成分的掩蔽特征不同,需分别计算它们的掩蔽阈值。根据信号功率谱密度的局部最大值来确定频谱中的有调成份,剩下的临界频带频谱值组成无调成分。仿真中求出的有调成分和无调成分结果分别如图4和图5所示。

图4 有调成分抽取结果Fig.4 Tonal component extraction results

图5 无调成分抽取结果Fig.5 Nontonal component extraction results

3)全局掩蔽阈值计算:根据心理声学模型 I,分别计算有调和无调成分的掩蔽阈值,计算公式如公式(1)和公式(2)。

LTtm[z(j),z(I)]=Xtm[z(j)]+avtm[z(j)]+vf[z(j),z(I)]

(1)

LTnm[z(j),z(I)]=Xnm[z(j)]+avnm[z(j)]+vf[z(j),z(I)]

(2)

式中:LTtm[z(j),z(I)]表示在频谱中的频率I处的有调掩蔽分量的掩蔽阈值,LTnm[z(j),z(I)]表示在频谱中的频率I处的无调掩蔽分量的掩蔽阈值。有调和无调成分的掩蔽系数如公式(3)和公式(4)。

avtm[z(j)]=

[-1.525-0.275z(j)-4.5];

(3)

avnm[z(j)]=

[-1.525-0.175z(j)-0.5]。

(4)

z(I)表示功率谱线的临界带率。Xtm[z(j)]和Xnm[z(j)]分别表示有调和无调成分的声压级电平,vf[z(j),z(I)]是掩蔽函数。

将有调和无调成分掩蔽阈值与静音掩蔽阈值按照公式(5)计算全局掩蔽阈值,最后得到的全局掩蔽阈值曲线如图6所示。

LTg(i)=

(5)

图6 全局掩蔽阈值曲线Fig.6 The global masking threshold curve

2 掩蔽效应验证

对图2的样本语音信号加入3个频率分别为40Hz,200Hz,400Hz的正弦信号,用心理声学模型求得的掩蔽结果如图7所示。再给其加入3个频率分别为40Hz,45Hz,400Hz正弦信号,结果如图8所示。

图7 不同频率信号掩蔽效应图一Fig.7 Chart one of different frequency signal masking effect

图8 不同频率信号掩蔽效应图二Fig.8 Chart two of different frequency signal masking effect

对比图7和图8,不难发现,同样是给样本语音信号中加入了3个不同频率的信号,图7出现了3个较明显的波峰,而图8只出现了两波峰,说明第一种频率组合下,三者之间没有发生掩蔽,第二种情况,是40Hz将45Hz的信号掩蔽掉了,并未与400Hz的信号发生干扰现象。

总之,较强的低频信号可以掩蔽较弱的高频信号,而且当信号所处的频段距离较远时,那么信号彼此之间很难形成掩蔽。

3 掩蔽效应的扬声器异常音检测

3.1 异常音检测流程

通过心理声学模型可以求出信号掩蔽阈值曲线,掩蔽阈值曲线以下的异常音信号将会被掩蔽掉而不被人耳所感知,掩蔽阈值曲线以上的异常音将会被人耳听到。由此,提出一种异常音检测算法,具体流程如图9所示。

图9 异常音检测及提取算法流程图Fig.9 Abnormal sound detection and extraction algorithm flowchart

仿真中,选取chirp信号作为激励信号并给其加入正弦信号后的混合信号作为异常音信号进行算法仿真。运用心理声学模型,将全局掩蔽阈值曲线以上的信号的功率成分提取出,初步判为噪音,并和仿真前的噪音求取相关系数。同理,从混合信号中减去提取出的噪音信号作为去噪后的激励信号,将其与原激励信号求取相关系数,通过两组相关系数就可验证该算法是否有效。

3.2 算法仿真结果

按照图9的仿真流程,在心理声学模型仿真中选用凯撒窗函数,进行仿真信号功率谱密度的计算,得到掩蔽阈值曲线如图10所示。

图10 基于凯撒窗的掩蔽阈值曲线Fig.10 The masking threshold curve based on Kaiser window

图10是基于心理声学模型求出的掩蔽阈值曲线,不难发现功率谱的最大幅值位于掩蔽阈值曲线之上,该部分不能被掩蔽掉,提取阈值曲线以上的异常音功率谱并进行傅里叶逆变换求取其时域波形图。并与原噪音信号进行比较,最终得到图11。

图11 基于凯撒窗的异常音提取结果Fig.11 The abnormal sound extraction result based on Kaiser window

图11为去噪后的信号及其与原激励信号的差值信号、提出的噪音信号时域波形。

3.3 有效性验证

由于不同窗函数频谱特性不同,而且不同参数下的凯撒窗也具有不同的频谱特征,运用不同参数下的凯撒窗及其他几种窗函数进行仿真分析,并分别求取两组相关系数进行算法有效性验证,仿真中得到的相关数据如表1所示。

表1 基于不同参数的凯撒窗求取的相关系数Tab.1 Based on the different parameters of Kaiser window to calculate the correlation coefficient

表1中,通过得到的3个区段参数下的相关系数,不难发现其变化规律类似于一个分段的减函数,a在(0.0,0.7]半开半闭区间时的相关系数为恒定值,也是最大的一组相关系数,说明凯撒窗取该区间内的参数值时,算法的去噪效果最好。

下一步,我们将按照中发〔2010〕11号文件、2011年中央1号文件和2012年2月份国务院批复的西部大开发“十二五”规划等要求,继续把西部地区的水利建设摆在优先和突出重要的位置,着力围绕解决西南地区的工程性缺水和西北地区的资源性缺水问题,以这两个问题为重点全面推进西部地区水利建设和水资源综合管理。重点做好以下五个方面的工作:

4 结 语

以掩蔽效应原理为基础,对心理声学模型I

及掩蔽效应进行了仿真研究,并提出了基于掩蔽效应的异常音检测算法,通过在Matlab环境下仿真,运用不同参数的凯撒窗函数进行算法有效性验证,得到了一组最大的相关系数,其中,噪音的最大相关系数为0.992 1;激励的最大相关系数0.992 6,不仅验证了该算法的有效性,也说明了在(0.0,0.7]参数区间的凯撒窗,对基于心理声学模型的扬声器异常音检测最为有效,可以有效提高异常音检测系统的精度。

[1] 王琳娜,景妮琴,吴国乔,等.通过扬声器振膜位移测试频响曲线[J].中国测试, 2013, 39(5):31-33.

[2] 周杨.基于虚拟仪器技术的混合信号电路自动测试系统研究[D].长春:吉林大学,2013.

[3] 马牧.基于虚拟仪器的分布式测试系统的设计与实现[D].西安:西安电子科技大学,2012.

[4] 李宏斌,徐楚林,温周斌,等. 基于短时傅里叶变换的异常音检测方法[J].声学技术,2014,33(2):145-149.

[5] 胡海翔. 基于Hilbert-Huang变换的情感语音特征提取研究[D].长沙:长沙理工大学,2013.

[6] 韦峻峰,杨益,温周斌,等. 一种扬声器异常音的时域特征检测方法[J].振动与冲击,2011,30(10):122-128.

[8] 黄海.扬声器非线性特性的Hilbert-Huang变换分析[J].浙江大学学报:工学版,2005,39(3):385-391.

[9] 汪辉.分数阶小波变换理论及其应用研究[D].西南交通大学, 2014.

[10] 张晓娜.基于Hilbert-Huang变换的局部场电位响应调谐特性研究[D].郑州:郑州大学,2013.

[11] 颜利君. 基于噪声估计和掩蔽效应的语音增强[D].成都:西南交通大学, 2014.

[12] 张冠军,郁梅,廖义,等. 基于立体掩蔽效应的非对称立体视频编码算法[J]. 宁波大学学报:理工版,2014,27(1):44-47.

(编 辑曹大刚)

The application of masking effect in the speaker abnormal sounds detection

LI Yun-hong, LI Xiao-ying, ZHOU Jing-lei, PAN Yang

(School of Electronics and information, Xi′an Polytechnic University, Xi′an 710048, China)

Pure sound detection is the traditional abnormal sound detection method of loudspeaker, which is affected by many subjective factors, leading to listening leakage, misjudgment.The abnormal sound detection technologies based on the virtual instrument have shortcomings of low efficiency, low precision, high cost and so on. Given all of this, based on masking effect, this paper puts forward an abnormal sound detection method of loudspeaker, which extracts the audible abnormal sound above the masking threshold value curve, by comparing the abnormal sound power spectrum with the masking threshold, and uses the correlation coefficient to carry on the algorithm validity confirmation. The results shows the Caesar window in the (0.0,0.7] parameter interval makes the correlation coefficient of the incentive and noise reach 0.992 6 and 0.992 1 respectively, which achieves the detection requirements of high performance, high precision and easy operation effectively.

the abnormal sound detection of the loudspeakers; masking effect; the psychoacoustic model I

2014-12-23

西安市科技局技术转移促进工程基金资助项目(CXY1431(4));国家级大学生创新创业训练计划基金资助项目(201410709024);西安工程大学大学生创新创业训练计划基金资助项目(201403018);陕西高等教育教学改革研究基金资助项目(13BZ60);陕西省教育厅科研计划基金资助项目(14JK1319);陕西省科技厅自然科学基础研究计划基金资助项目(2013JC2-15)

李云红,女,辽宁锦州人,副教授,博士,从事红外热像测温技术、图像处理、信号与信息处理技术研究。

TB52+3;TB54

:ADOI:10.16152/j.cnki.xdxbzr.2015-02-009

猜你喜欢
凯撒扬声器频谱
Focal&Naim同框发布1000系列嵌入式扬声器及全新Uniti Atmos流媒体一体机
一种用于深空探测的Chirp变换频谱分析仪设计与实现
像乐高一样的扬声器,还能为手机无线充电!
大地震 正式发布Cinenova系列扬声器
泉州大剧院选用L-ACOUStiCS、DiGiCo
浅论《裘力斯凯撒》中的凯撒形象及其意义
频谱大师谈“频谱音乐”——法国作曲家缪哈伊访谈记
法医出手凯撒瞑目
遥感卫星动力学频谱规划
基于频谱分析法的注水泵故障诊断