李 国,韩学良+,段 钢
(1.中国民航大学 计算机科学与技术学院,天津300300;2.北京首都国际机场股份有限公司,北京100621)
实时识别飞机噪声可以避免因存储和发送大量的非飞机噪声数据造成的资源浪费,为准确评价飞机噪声对周边居民的影响奠定了基础,对于民航机场噪声监测与评价具有重要意义。目前,飞机噪声识别研究主要集中在特征提取方面,国外如线性预测模型算法[1]、匹配搜索算法[2],国内如经验模态分解法[3]、小波包分析和Mel倒谱分析结合法[4]等,这些方法固然取得了一定的成果,但是由于算法本身过于庞杂,硬件实现难度大,仍局限于学术研究,况且特征提取仅是噪声识别的一部分,所以研究成果应用较少。当前尚没有一套便捷有效的方案解决飞机噪声识别问题,现有的机场噪声监测系统只能通过检测声压是否超过某个指定的阈值来判段飞机噪声事件,有些则通过噪声事件持续的时间来判别,错误率高。本文在前人工作的基础上,从噪声特征提取、特征精简、分类器设计到FPGA固化均作了有效尝试,提出了一套简易可靠的飞机噪声识别方案,并用FPGA 予以实现。
噪声特征提取的好坏直接影响着整体识别效果[5],为了获取足够的频谱信息,借助于1/3倍频程滤波算法,用声压级谱分析法从噪声主频分布的角度对噪声提取特征,实现流程如图1所示。
由于人耳的听觉范围在20Hz~20kHz之间,结合飞机噪声中低频突出的固有特性,选取飞机噪声影响人们生活最为严重的频段8.91Hz~22.4kHz作为特征域[6,7],用1/3倍频程分析法将其从低频到高频划分成34个频带,见表1。斜体是分配的频带标号,下边为对应的带宽。
按照图1流程对一个持续10秒钟的飞机噪声事件处理后产生的34个1/3倍频带声压级如图2所示,上图为该噪声事件归一化为[-1,1]后幅值特性曲线,下图为其对应的一组1/3倍频程声压级谱,横坐标频带序号与表1对应。由图2中可以看出特征之间差异明显,十分利于分类器的识别。
图1 1/3倍频程声压级谱分析方法流程
表1 1/3倍频程带宽划分
图2 单个飞机噪声事件及其对应的一组1/3倍频程声压级谱
针对上节提取的飞机噪声特征信息,构建合适的分类器可以使噪声识别效果更加显著。本节先采用改进的均方根法[8]检验噪声识别效果,得出了不同的特征信息应当区别看待这一结论,进而引出噪声特征精简的可能性与必要性。噪声特征信息优化处理后,经支持向量机、BP神经网络和改进的均方根法等[9,10]算法进行识别并比较其分类效果,最后分析了这些算法在飞机噪声识别中的优势与不足之处。
2.1.1 加入特征分散程度参数Rate
将提取的每一组特征值看作一个多维向量,找出训练集中同一类样本每一维特征的最大值和最小值:Max(i)、Min(i)(i≥1,i∈N),设Rate为[0,1]内的实数,为第i维特征的均值,若一条测试样本(x1,x2…xn)的第i维方差记作Qi,令
图3 参数Rate的变化对样本错分数目的影响
2.1.2 加入权重参数C
图4 参数C的变化对样本错分数目的影响
由这两种方法的识别效果可以分析出:①改进的均方根法在飞机噪声识别中效果显著;②噪声样本分布曲线应接近于钟形,不然Rate的变化对识别准确率的影响不会很大,同时也说明了加入参数Rate的必要性;③噪声特征信息应当区别看待,否则加入参数C 之后识别准确率应当下降,实验结果也表明了精简噪声特征是很有可能的。
如果噪声特征维数太大,硬件实现将占用大量的存储、组合逻辑资源,给噪声识别带来过高的复杂度,剔除冗余特征[11,12]可以使噪声识别更加高效便捷。图5给出了9组包含3个特征的样本,在特征①、②、③中,特征①与③的浮动方向和浮动幅值基本保持一致,可以仅保留特征①和③中的一个,这样就有效降低了特征向量的维数,同时保存了特征对信息的表达能力。
图5 特征之间相似性示意
为了进一步说明精简噪声特征的必要性,下面引入相关系数的概念。在统计学领域中,相关系数显示了两个随机变量之间线性关系的强度和方向,是衡量两个随机变量间线性相关程度的指标[13]。最常用的相关系数是皮尔逊积差相关系数,定义为
式中:Cov(X,Y)——随机变量X、Y 之间的协方差;——变量X、Y 的标准差。
设X、Y 为n(n≥1)维向量,F(xi)为n 维向量映射的数据函数,两组向量X、Y 的线性相关系数可由式(5)—式(7)获得
为了进一步说明所提取的特征之间线性相关的程度,绘制训练集内任意两个特征的相关系数及其等值线,如图6所示。由图中可以看出xy 平面正对角线附近相关系数明显很大,紧邻特征的相关系数基本都大于0.9,由此说明相邻的特征线性相似度高,剔除相关性强的冗余特征显得尤为必要。
剔除冗余特征流程如图7所示。在R=0.9时,将34维特征按所述流程处理后,仅保留了第1、4、10、13、16、17、18、20、23、25、29、32、33、34维共14个特征,大幅度降低了特征维数。
图6 34个特征之间线性相关程度
图7 特征优化流程
特征优化前后用改进的均方根法进行识别比较,效果见表2。由表中可以看出虽然去除了部分特征,噪声识别准确率有所下降,但是剩余特征的信息表达能力依然强健,再者精简后的特征子集不足原来的一半,有效节约了硬件实现算法所需资源,这符合噪声识别模型FPGA 固化的需要。
表2 特征优化前后改进的均方根法识别效果
用保留下来的特征组成精简训练集和测试集进行识别测试,支持向量机选取不同核函数时与BP神经网络、改进的均方根法相比较,比较结果见表3。
在以上几种分类方法中,支持向量机的Linear核函数和RBF核函数取得了较好的效果,因此分类器的固化优先选用支持向量机分类器。同BP神经网络、改进的均方根法相比,在实际应用中支持向量机除了具有较好的识别效果外,还具有表4 所示特性[14,15],所以在飞机噪声识别中,支持向量机更适合于作为分类器。
由于支持向量机在多种方面都优于BP神经网络、改进的均方根法,考虑到实时分类的要求,下面以支持向量机线性分类器为例介绍其FPGA 固化方法[16]。线性支持向量机最优分类函数
改写后为
图8 SVM 线性分类器时序仿真结果
由图中容易分析出,当do 为 “1”,时钟上升沿到来时,开始分类,分类过程在一个时钟周期内完成,判定结果 “10”表示飞机噪声,同时分类完成标志c_done 置“1”,间隔一个周期测试样本完成数据变更后再次分类,判定结果 “01”表示非飞机噪声。当异步清零信号clr来临,分类结果result信号和分类完成指示信号c_done均被清零。分类结果同预期的目标一致,表明所设计的分类器固化模型是正确的;分类过程在一个时钟周期内就可以完成,说明分类器在FPGA 上的固化具有强实时性的特点,能够满足噪声实时分类的需要。
本文通过借鉴1/3倍频程分析法、均方根法、相关系数分析法、BP神经网络、支持向量机等算法思想,从噪声特征提取、分类器构建、特征优化到最终的分类器固化,详细介绍了一套飞机噪声识别方案,并结合Altera公司的QuartusII软件,最终在FPGA 上实现了噪声实时分类。在目前国内还没有一套公开认可的飞机噪声识别方案这一背景下,得出如下结论:①在飞机噪声识别中,改进的均方根法具有显著的识别效果;②用1/3倍频程频谱分析法提取噪声特征,经相关系数分析法精简特征信息后再结合支持向量机进行识别是一套稳定可靠的飞机噪声识别方案;③支持向量机分类过程可以高速运行在FPGA 上,能够满足飞机噪声实时识别的需要。
当然上述方案也存在一些有待改进和值得进一步研究的问题,以噪声事件识别飞机噪声仅能够区分单声源噪声事件,若多个声源糅合在一起时如何区分声源还需要进一步研究。
[1]Mohajeri R,Fricke FR.Acoustical feature extraction from aircraft and traffic noise[J].Annual Australian Acoustical Society,1996,24 (10):5-10.
[2]Chu Selina,Shrikanth Narayanan,Jay Kuo C-C.Environmental sound recognition using MP-based features[C]//IEEE International Conference on Acoustics,Speech and Signal Processing,2008:1-4.
[3]LV Yanxin,SUN Shuxue,GU Xiaohui.Battlefield acoustic target classification and recognition based on EMD and power ratio[J].Journal of Vibration and Shock,2011,27 (11):51-55 (in Chinese). [吕艳新,孙书学,顾晓辉.基于EMD和能量比的战场声目标分类与识别 [J].振动与冲击,2011,27 (11):51-55.]
[4]ZENG Fan,LU Guang,LI Guohong.The feature extraction from Battlefield passive acoustic targets based on wavelet packet analysis.Journal of projectiles [J].Rockets,Missiles and Guidance,2010,30 (2):240-242 (in Chinese). [曾番,鹿光,李国宏.基于小波包分析的战场被动声目标特征提取[J].弹箭与制导学报,2010,30 (2):240-242.]
[5]Barbo Bertranda,Rosin Christopheb,Machet Jean-Mariec.A pattern recognition approach for aircraft noise detection [J].INTER-NOISE,2011,24 (1):1-10.
[6]WU Yaozhen,YANG Yixin,WANG Xiaoyu.One-third octave masking spectrum method for recognition of underwater targets[J].Technical Acoustics,2011,30 (6):538-541(in Chinese). [吴姚振,杨益新,王晓宇.水下目标识别的1/3倍频程掩蔽谱方法 [J].声学技术,2011,30 (6):538-541.]
[7]Karen Safaryan,Reinoud Maex,Rod Adams.Non-specific LTD at parallel fibre-Purkinje cell synapses in cerebellar cortex provides robustness against local spatial noise during pattern recognition [J].BMC Neuroscience,2011,12 (1):314-321.
[8]CHEN Xiangtao,LI Mingliang,CHEN Yujuan.Summaly of application research based on clustering of time series similarity[J].Computer Engineering and Design,2010,31 (3):577-580 (in Chinese).[陈湘涛,李明亮,陈玉娟.局基于时间序列相似性聚类的应用研究综述 [J].计算机工程与设计,2010,31 (3):577-580.]
[9]Hamed Ghodrati, Mohammad Javad Dehghani, Habibolah Danyali.A new accurate noise-removing approach for non-cooperative iris recognition [J].SIVIP,2012,57 (5):2824-2832.
[10]SU Tengrong,WU Ji,WANG Zuoying.Spatial correlation transformation for speech recognition [J].J Tsinghua Univ(Sci &Tch),2009,49 (10):1655-1659 (in Chinese).[苏腾荣,吴及,王作英.用于语音识别的空间相关性变换 [J].清华大学学报 (自然科学版),2009,49 (10):1655-1659.]
[11]CHEN Hong,LIU Guangyuan,LAI Xiangwei.Affective Recognition from pulse signal using correlation analysis and max-min ant colony algorithm [J].Computer Science,2012,39 (4):250-253 (in Chinese). [陈 红,刘光远,赖祥伟.相关性分析和最大最小蚁群算法用于脉搏信号的情感识别[J].计算机科学,2012,39 (4):250-253.]
[12]Chu Yuming,Hou Shouwei,Shen Zhonghua.Sharp bounds for Seiffert mean in terms of root mean square[J].Journal of Inequalities and Applications,2012,201 (11):6-13.
[13]ZHOU Yong,LU Xiaowei,CHENG Chuntian.Parallel computer method of canonical correlation analysis for high-dimentional data streams in irregular streams[J].Journal of Software,2012,23 (5):1062-1063 (in Chinese). [周勇,卢晓伟,程春田.非规则流中高维数据流典型相关性分析并行计算方法 [J].软件学报,2012,23 (5):1062-1063.]
[14]QI Ruihua,YANG Deli,HU Runbo.Weighted naive credal classification model based on correlation coefficients [J].Computer Engineering and Design,2010,31 (22):4824-4826 (in Chinese).[祁瑞华,杨德礼,胡润波.基于相关系数加权朴素信念分类模型 [J].计算机工程与设计,2010,31 (22):4824-4826.]
[15]CHU Yuming,WANG Miaokun,QIU Songliang.Optimal combinations of root-square and arithmetic means for Toader mean [J].Proc.Indian Acad Sci(Math Sci),2012,122(1):41-42.
[16]WANG Guangling,HE Bin,LI Jinling.Application of FPGA in data receive storage and transmission [J].Computer Engineering and Design,2012,33 (9):3402-3406 (in Chinese).[王纲领,何宾,李金玲.FPGA 在数据接收存储及传输中的应用 [J].计算机工程与设计,2012,33 (9):3402-3406.]