, ,
(1.西北工业大学航空学院,陕西 西安 710072;2.西安计量技术研究院,陕西 西安 710068)
飞机驾驶舱特定声音信号提取
杨恒1,陆宇1,白文虎2
(1.西北工业大学航空学院,陕西 西安 710072;2.西安计量技术研究院,陕西 西安 710068)
针对现阶段国内对舱音记录仪(CVR),所记录声音的辨别和分析方法没有充分利用机舱内声音的定源特性,不能准确地分辨出飞机上特定声音,提出了一种基于独立成分分析(ICA)对舱音信号进行分离的方法,用Matlab软件进行了仿真,并通过蒙特卡洛方法(MCM)计算多组实验数据的性能指标,以验证算法的稳定性。结果表明,该方法可以比较高效地提取出飞机机舱中特定语音信号。
舱音记录仪;独立成分分析;蒙特卡洛方法
舱音记录仪(CVR)是飞机上记录驾驶舱内的音频信号的设备,它所记录的声音主要包括机组人员的对话声、警报声、开关声以及环境噪声等。舱音记录仪所记录的声音对于空难的调查有着指导性的作用,它记录着飞机失事前驾驶舱内一切与事故有关的声响。因此,对舱音信号的准确分析是极其重要的。
目前,国内在分析CVR所采用的主要方法是,首先,通过计算机译码系统对舱音信号译码,然后,通过音频软件处理后通过人耳辨听来识别[1-2]。这样的话,没有充分体现舱音信号的一些显著特点,比如,驾驶舱内大多数声源都是不动的。根据信号的定源性,就可以通过独立成分分析(ICA)来处理舱音信号。
独立成分分析是一种基于统计学的混合信号分离方法。这种方法的显著优点是无需任何源信号的先验条件,只需要通过分析多路混合信号便可以还原源信号[3]。独立成分分析的前提是源信号的独立性与非高斯性,这在驾驶舱内显然是完全满足的。独立成分分析的一个优点是对源信号的频率、振幅都没有严格的要求,这意味着在嘈杂且夹杂高频的环境中也可以进行有效分离。
在此,系统将独立成分分析方法用于舱音信号的分离,使用Matlab软件进行了仿真与分析,并用蒙特卡洛方法验证了算法稳定性。
1.1 盲源分离的数学模型
盲源分离的数学模型表示为:
x(t)=As(t)
(1)
s(t)=[s1(t),s2(t),…,sN(t)]T为一组未知且独立的源信号矢量;x(t)=[x1(t),x2(t),…,xM(t)]T为一组观测信号矢量;A∈RM×N为未知混合矩阵。每个信号xi(t)都是N个未知源信号si(t)的线性组合。
盲源分离的目的就是求解一个分离矩阵B,仅仅通过观测信号矢量x(t)的值,便可以还原出源信号矢量s(t)。分离过程可用数学模型表示,即
y(t)=Bx(t)
(2)
y(t)=[y1(t),y2(t),…,yN(t)]是一组估计信号矢量。在仅考虑加性噪声的情况下,由于其独立性,加性噪声也可以看作源信号矢量来处理。令s1(t)=[s1(t),s2(t),…,sN(t)]为非噪声信号的源信号矢量;s2(t)=[si+1(t),s2(t),…,sN(t)]为加性噪声源信号矢量,则盲源分离的系统如图1所示。
图1 盲源分离系统
1.2 独立成分分析[4-7]
1.2.1 梯度法
(3)
α(t)可控制每一次迭代的步长。不断重复上式直到收敛,即直到2个相邻解之间的欧氏距离‖B(t)-B(t-1)‖<ε,ε为所要求的最大误差。
代价函数的选取可以参考度量系统非高斯的物理量,如峭度(累计矩)、负熵、互信息和极大似然估计等。
1.2.2 基于负熵的快速不动点算法(FastICA)
熵是非高斯性的度量,变量非高斯型越大,熵就越大,高斯变量的熵为0。负熵的定义为:
J(x)=H(xgauss)-H(x)
(4)
H为变量熵的函数;xgauss和x为有相同协方差矩阵的某个高斯随机变量。计算负熵非常困难,通常用一个非二次函数G近似为:
J(x)≅[E{G(x)}-E{G(v)}]2
(5)
G一般选择的格式为:
(6)
基于负熵的快速不动点算法的计算流程[3]为:
a.对数据中心化使其均值为0。
b.白化数据。
c.选择一个具有单位范数的初始化向量ω。
d.ω←E{zg(ωTz)}-E{g(ωTz)}ω,g通常选取函数G的导数。
e.标准化ω,ω←ω/‖ω‖。
f.若收敛,结束;若不收敛,返回步骤d。
2.1 无噪声混合信号分离实验
将算法首先应用于无噪声混合信号的分离,在相对理想的情况下验证算法分离效果的好坏。算法分离效果的好坏可以参考性能指标PI。若A为混合矩阵,B为解混矩阵,令G=BA,则PI的计算公式为:
(7)
在几乎无噪声的情况下,环境中有2个通道人说话的声音,1个通道MP3播放的声音。采集到的3声源3通道混合信号如图2所示。在使用FastICA算法分离后,生成3组分离信号如图3所示。
由图2,图3可以看出,分离后的1、2通道为人说话的波形,在不发声的阶段,波形无噪点无振荡。这也证明,在完全没有噪声的情况下分离效果非常好。
图2 无噪声混合信号
图3 分离后的信号
2.2 含噪声混合信号分离
大部分环境中都少不了噪声的存在,根据独立成分分析的原理,对于信号中的非高斯加性定源噪声,可以通过算法来分离。为了能够体现出独立成分分析在对定源噪声去噪中的优势,在所要分离的4个通道中,混入了1个通道高频信号和1个通道低频信号,剩下的2个通道是所要提取的有用信息。
图4是4个含噪混合波形,在使用FastICA算法分离后的时域图如图5所示。从图5可看出,2组语音信号,2组噪声信号被分离出来。对分离后的波形进行频谱分析的结果如图6所示。从 图6可以看出,高频信号和低频信号都被有效地分离了出来,并且提取到了比较高质量的有用信号。
图4 含噪混合信号
与传统的去噪方法相比,文中的方法优点是,在麦克风能接收到的频率范围内,无需考虑噪声的频率,对噪声振幅的要求也不是非常严格。这意味着可以在噪声信号振幅比较大的情况下,提取出有用的信号,噪声信号的频率也可以是多变的。另外,对于多个定源噪声,也可以对目标信号进行有效的分离。
图5 分离后的信号
图6 频谱分析
飞机驾驶舱内声音信息复杂,定源声音主要是人对话的声音、麦克风讲话的声音、警报声和按钮声等。传统的舱音记录仪有接收来自4个麦克风通道的声音,分别是机长、副机长、第三机组人员的麦克风捕捉说话声以及驾驶舱中间某处的麦克风捕捉的环境声音。要利用ICA算法对舱音记录仪进行信息提取,需要满足麦克风的数目大于或者等于环境中定源的声源数。
驾驶舱内除去要提取的一些定源声音信号外,还存在复杂的环境声音,包括气流摩擦机身的声音、电气设备产生的交流噪声等。这些声音信号通常无规则且无突变性,本文仅讨论了定源信号的分离性能,将非定源声音信号用一个飞机起飞时的轰鸣声近似。
图7~图10是驾驶舱内的一些样本声音,通过对这些样本声音进行随机混合之后,就可以得到各个混合通道接收到的信号。
图7 警报和按钮的声音实验样本
图8 驾驶员说话声音实验样本
图9 麦克风通话声音实验样本
图10 环境声音实验样本
在matlab下生成随机混合矩阵,即
混合后的信号如图11所示。分析计算源信号数目对性能指标的影响,性能指标如图12所示,随着源信号与混合通道数目的增多,FastICA算法的性能指标有比较小的增幅,事实上,性能指标处于10-1量级就可以说明分离效果是比较好的,分离信号如图13所示。
由于性能指标的计算是通过仅给出1组混合矩阵计算出来的,为了证明算法的稳定性,图14给出了使用蒙特卡罗算法[8]得出的1 000组随机矩阵模拟仿真过程以及结果。图14中,在对1 000组数据进行计算后,性能指标处于10-1量级,分离效果是比较好的。
图11 混合通道
图12 性能指标
图13 分离信号
图14 性能指标PI蒙特卡洛仿真
采用独立成分分析对无噪语音信号、定源噪声语音信号与舱音信号进行了盲分离仿真。其中,对带噪语音分离后作了频谱分析,说明了独立成分分析对于嘈杂的高频环境也可以有效地分离,唯一的缺点就是噪声信号与目标信号必须是定源的,因此,在大部分定源情况下是可以应用的。对分离后的模拟舱音信号,计算了FastICA算法的性能指标,并通过蒙特卡洛仿真计算1 000组实验数据的性能指标,从而验证了算法的稳定性。通过计算结果可以得出,对于舱音信号,独立成分分析可以充分利用信号之间的独立性与信号的非高斯型,取得比较好的处理结果。
[1] 舒平,钟民主,杨琳.舱音记录器译码系统的改进方法[R] .银川:中国航空学会,2006.
[2] 舒平,钟民主,杨琳.舱音记录器译码系统的改进[C]//探索创新交流-中国航空学会青年科技论坛文集,2004.
[3] 赵彩花.带噪混叠语音信号盲分离方法研究[D].济南:山东大学,2006.
[4] AapoHyvärinen,JuhaKarhunen,ErkkiOja.独立成分分析[M].周宗潭,董国华,徐昕,等译.北京:电子工业出版社,2007.
[5] Hyvärinen A,Oja E.A fast fixed-point algorithm for independent component analysis[J].Neural Computation,1997,9(6):1483-1492.
[6] Hyvärinen A,Karhunen J,Oja E.Independent component analysis [M].New York: John Wiley & Sons,Inc,2001.
[7] Hyvärinen A.Fast and robust fixed-point algorithms for independent component analysis[J].IEEE Trans.On Neural Networks,1999,10(3):626-634.
[8] 尹增谦,管景峰,张晓宏,等.蒙特卡罗方法及应用[J].物理与工程,2002 ,12 (3):45-49.
Extraction of Specific Voice in Aircraft Cabin
YANGHeng1,LUYu1,BAIWenhu2
(1.School of Aeronautics,Northwestern Polytechnical University,Xi’an 710072,China;2.Xi’an Institute
of Measurement and Testing Technology,Xi’an 710068,China)
At the present stage,the identification and analysis of the acoustic signals in Cockpit Voice Recorder (CVR) cannot identify the specific voice in airplane efficiently which ignore the characteristic of the fixed acoustic source in cabin.A method based on Independent Component Analysis (ICA) is proposed to separate acoustic signals in this paper.The simulation is done by Matlab,many groups of experiment data are analyzed by Monte Carlo Method (MCM) to confirm the stability of this algorithm,and the results show that the specific voice is extracted efficiently.
CVR; ICA; MCM
2014-09-16
国家自然科学基金资助项目(61003137);国家大学生创新创业训练项目(201210699024)
A
TN911.72
1001-2257(2014)12-0016-04
杨恒(1992-),男,陕西榆林人,硕士研究生,研究方向为模式识别,图形图像处理,多媒体与虚拟现实,飞行器电系统故障与预测的智能方法;陆宇(1992-),男,内蒙古呼和浩特人,硕士研究生,研究方向为模式识别,基于视觉的无人机自主飞行以及飞行器虚拟维修;白文虎(1975-),男,陕西渭南人,技术员,研究方向为电子工程应用。