摘 要:陆空通话是空中交通管制员从业上岗的基础,也是在日常工作中时刻使用的标准语言。其使用是否标准将直接影响空中交通安全,因此各类专业人员需要不断训练,提高陆空通话能力。文章在陆空通话英语标准发音的基础上,设计发音模板,并进行语音识别,辅助专业人员进行陆空通话英语练习。
关键词:空中交通管理;陸空通话;语音识别;教学辅助
陆空通话具有标准的发音规则,区别于日常用语[1-2]。本文提取陆空通话数据并进行整理,通过MATLAB制作成标准的陆空通话模板。同时针对个体发音需要进行语音比对,测量其标准性,进而可以实现语音识别功能。
1 模板设计的意义
进行语音识别的关键是设计合适的发音模板,依据此模板对个别发音进行评价,评定出发音所代表的含义。空管陆空通话不同于普通的英语,其发音具有明显的行业特点,如字母A的发音不是/ei/而是/a:lf/、B的发音不是/bi:/而是/|brɑ:|v?藜?尬/,因此由于针对性非常强,因此需要根据标准单独制作发音模板,在行业内推广使用。
2 模板提取方法
本文采用陆空通话标准用语教材中的发音作为标准进行参考,一般的录音频率为44k Hz,如字母A的发音振幅如图1(a)所示。虽然原始语音信号精度较高,但是后期实现语音识别的时候,需要对上百句模板进行一一对比,判定最相似的一个为其识别出来的语音,这样算法运行时会耗费大量的时间,实时性难以保证,因此我们对语音模板进行离散取点,通过实验,将其频率降为2000Hz时,依然可以保证识别的准确性,如图1(b)所示。这样,我们对经常使用的字母、数字以及一些常用的陆空通话用语提取了发音模板,其形式为双精度的数字序列。
3 语音识别方法实现
由于所设计的语音模板标准性非常强,其应用就是为了避免日常英语中发音的混淆,因此我们采用最为简单有效的DTW(Dynamic Time Warping,动态时间归整)算法进行语音识别[3-4]。DTW算法是一种衡量两个长度不同的时间序列的相似度的方法,模板的设计便不需要考虑时间的长短,即采样序列的数量,可以有效提高应用的效率。
本文使用MATLAB中DTW工具箱进行模拟仿真,同样以字母A为例输入的语音波形如图2所示。经过DTW算法,其发音与部分字母模板的对照如表1所示,可以看到此发音与模板A的距离最短,为7.1926,识别正确。
4 结束语
本文对陆空通话的标准语音数据进行了整理,提取出发音模板用语课堂辅助训练,通过语音识别方法准确识别具体的发音。项目进一步的研究目标是将模板应用于Android系统中,实现移动端的训练软件开发。
参考文献
[1]刘万凤,胡军,袁伟伟.陆空通话标准用语(英语)的语音指令识别技术研究[J].计算机科学,2013,40(7):131-137.
[2]王博,李振宇.无线电陆空通话英语特点与教学策略[J].沈阳航空航天大学学报,2010,27(6):61-64.
[3]韦春丽,霍春宝.基于DTW的语音识别在MATLAB中的实现方法浅析[J].数字技术与应用,2011(12):184-185.
[4]肖利君.基于DTW模型的孤立词语音识别算法实现研究[D].中南大学,2010.
作者简介:孙禾(1988-),男,助理实验师,研究方向:空中交通管理。