宋金泽(上海飞机设计研究院,上海 201210)
语音识别系统在民机驾驶舱的应用
宋金泽
(上海飞机设计研究院,上海 201210)
在飞机驾驶舱引入语音识别系统,是时代与科技发展的必然结果,减轻驾驶员负荷,并符合新一代飞行员对智能科技的追求。语音识别系统的核心在于特性提取、模式匹配和噪声滤除,该领域的研究都比较成熟,使得语音识别系统在飞机驾驶舱应用成为可能。本文结合飞机驾驶舱使用环境与民机设计特点,对民用飞机驾驶舱内贯彻语音识别系统进行了探讨。
民机 驾驶舱 语音识别
民航系统出于安全考虑,对技术的成熟度要求较高,因此不论机载还是地面系统,并不总是急于第一时间尝试新技术。然而在飞机驾驶舱引入语音识别系统,是技术进步带来的一种必然[1],可以减轻飞行员负荷,并符合新一代飞行员对智能科技的追求。
语音识别系统的核心在于特性提取、模式匹配和噪声滤除,这些领域的研究目前都已比较成熟。
参数提取的算法主要有LPCC(线性预测倒谱系数)和MFCC (Mel频率倒谱)。MFCC具有更强的抗干扰能力等特点,更适合与噪声较多、发话人不能离输入设备很近的环境。模式匹配通过计算现有语音模式与语音模板库中的模板的距离,来获得最佳的匹配模式。主要有DTW(动态时间规整)、HMM(隐马尔科夫模型)和ANN(人工神经元网络)法。ANN与HMM需要大量的计算,DTW更适合用于孤立词、小词汇量的语音识别[2]。噪声是影响识别准确率的重要因素,但是汽车领域里已经有了较好的实践,可以做到即使车内环境很嘈杂(副驾驶座上的乘客在说话, 或者车载音响被打开),也不影响驾驶者操控语音系统[3]。
某些航空设备制造商已经推出了语音识别产品,但是只局限于个别厂家的单个产品,功能有限。相比单一设备供应商,主制造商具有无以伦比的综合集成优势:(1)在机上选用性能更强的机载硬件,富余的计算资源可以支持复杂的运算;(2)采用集成度高的航电系统,语音识别的结果可以有效输出到各系统。以下给出一种设想的实施架构。
(1)在飞机上增加专用设备——“语音处理单元”用于处理飞行员的语音输入并产生指令输出;或不增加专用设备,而将该部分功能——“语音处理功能”驻留在综合航电系统中。(2)通过各系统的设计保障等级与系统安全性分析,制定控制飞机的语音指令集,分别对应不同安全级别系统的响应。可以通过航电软件升级对语音指令集进行修改。对于不影响安全的一些语音指令,允许航空公司通过USB等方式快速更新。(3)飞机驾驶舱处于持续噪声环境中,而且随着飞行阶段的不同,噪声水平也不同。因此除了选用良好的麦克风输入设备,还需要精准的噪声滤除。可根据不同飞行阶段的环境噪声建立数据库,比较合适的方式是在飞机型号研制试飞时,随着对飞机包线的摸索一并完成。(4)飞行员通过打开指令接收通道来激活语音处理单元/功能,激活指令的方式可选(以下选项互不排斥):1)在飞机上加装专用的激活按钮;2)使用现有的PTT内话按钮;3)关键词激活HOT MIC。(5)语音处理单元/功能激活后,将按照事先规定的标准句法识别飞行员的意图。飞行员可以随时中断语音输入。语音输入成功后根据命令等级不同对应不同的确认程序,如音响或机器人声的语音回放。该声音的大小可调。语音输入的同时系统将会监视对应的设备有无被手动操作,如有将取消语音输入指令并提示飞行员。
下面结合4条实例说明在驾驶舱实装语音识别系统的优势。
(1)飞行员注意到EICAS上有一条故障信息,通过语音助手打开对应的CMS显示页面,这些页面在没有语音识别的情况往往需要飞行员多步导航才能到达;(2)飞机正在飞越一片严重湍流区,飞行员忙于稳住飞机的姿态,通过语音助手打开系紧安全带指示灯,并实时下传湍流报,提醒地面规划好后续飞机的航线;(3)恶劣天气下,飞行员通过语音助手发出气象请求,并显示收到的回复。当管制员要求飞机复飞转场时,飞行员通过语音助手更改飞行计划到备用机场。 (4)延时提醒,管制员要求飞行员在某高度报告,飞行员告知语音助手,当系统检测到飞机达到指定高度时提醒飞行员。
语音识别技术在国内外均有大量研究,技术的成熟度日渐提高,普及领域呈现拓展趋势,如苹果的”SIRI”、电脑平台的“Saybot”、百度语音搜索等。许多汽车也具有语音识别功能,作为高端产品的飞机更不应当落后于潮流。
如果说当前还没有广泛使用是因为可靠性尚待提高,那么当技术水平进步到以前的劣势,如可靠性,已经不再是制约瓶颈的时候,就是新技术一马平川的应用之时。在飞机驾驶舱应用语音识别系统前景广阔,技术储备逐渐成熟,国外嗅觉敏锐的航电系统集成商已经开始建立专利壁垒,如HONEYWELL公司就在2010年申请了一项美国专利Methods and systems for utilizing voice commands onboard an aircraft[4]。波音梦想飞机的梦幻灯光争取了乘客的好奇心,语音识别系统也同样会争取到飞行员的好奇心,行业内应当引起重视。
[1]凯文 凯利.必然[M].北京:电子工业出版社,2016:29.
[2]石可箴.车载多媒体系统中语音识别技术研究[J].数字技术与应用.2012(2):82-82.
[3]朱敏会.Nuance 的创新语音技术[J].汽车与配件.2012(1):30-31.
[4]DONG X Q,QIN X L.Methods and systems for utilizing voice commands onboard an aircraft[P].USA.2011.
宋金泽(1986—)男,汉族,黑龙江哈尔滨人,上海交通大学硕士,工程师,研究方向:民机甚高频通信、数据链、静电放电。