空管陆空通话英语发音模板设计与应用

2017-02-18 15:47孙禾
科技创新与应用 2017年3期
关键词:语音识别

摘 要:陆空通话是空中交通管制员从业上岗的基础,也是在日常工作中时刻使用的标准语言。其使用是否标准将直接影响空中交通安全,因此各类专业人员需要不断训练,提高陆空通话能力。文章在陆空通话英语标准发音的基础上,设计发音模板,并进行语音识别,辅助专业人员进行陆空通话英语练习。

关键词:空中交通管理;陸空通话;语音识别;教学辅助

陆空通话具有标准的发音规则,区别于日常用语[1-2]。本文提取陆空通话数据并进行整理,通过MATLAB制作成标准的陆空通话模板。同时针对个体发音需要进行语音比对,测量其标准性,进而可以实现语音识别功能。

1 模板设计的意义

进行语音识别的关键是设计合适的发音模板,依据此模板对个别发音进行评价,评定出发音所代表的含义。空管陆空通话不同于普通的英语,其发音具有明显的行业特点,如字母A的发音不是/ei/而是/a:lf/、B的发音不是/bi:/而是/|brɑ:|v?藜?尬/,因此由于针对性非常强,因此需要根据标准单独制作发音模板,在行业内推广使用。

2 模板提取方法

本文采用陆空通话标准用语教材中的发音作为标准进行参考,一般的录音频率为44k Hz,如字母A的发音振幅如图1(a)所示。虽然原始语音信号精度较高,但是后期实现语音识别的时候,需要对上百句模板进行一一对比,判定最相似的一个为其识别出来的语音,这样算法运行时会耗费大量的时间,实时性难以保证,因此我们对语音模板进行离散取点,通过实验,将其频率降为2000Hz时,依然可以保证识别的准确性,如图1(b)所示。这样,我们对经常使用的字母、数字以及一些常用的陆空通话用语提取了发音模板,其形式为双精度的数字序列。

3 语音识别方法实现

由于所设计的语音模板标准性非常强,其应用就是为了避免日常英语中发音的混淆,因此我们采用最为简单有效的DTW(Dynamic Time Warping,动态时间归整)算法进行语音识别[3-4]。DTW算法是一种衡量两个长度不同的时间序列的相似度的方法,模板的设计便不需要考虑时间的长短,即采样序列的数量,可以有效提高应用的效率。

本文使用MATLAB中DTW工具箱进行模拟仿真,同样以字母A为例输入的语音波形如图2所示。经过DTW算法,其发音与部分字母模板的对照如表1所示,可以看到此发音与模板A的距离最短,为7.1926,识别正确。

4 结束语

本文对陆空通话的标准语音数据进行了整理,提取出发音模板用语课堂辅助训练,通过语音识别方法准确识别具体的发音。项目进一步的研究目标是将模板应用于Android系统中,实现移动端的训练软件开发。

参考文献

[1]刘万凤,胡军,袁伟伟.陆空通话标准用语(英语)的语音指令识别技术研究[J].计算机科学,2013,40(7):131-137.

[2]王博,李振宇.无线电陆空通话英语特点与教学策略[J].沈阳航空航天大学学报,2010,27(6):61-64.

[3]韦春丽,霍春宝.基于DTW的语音识别在MATLAB中的实现方法浅析[J].数字技术与应用,2011(12):184-185.

[4]肖利君.基于DTW模型的孤立词语音识别算法实现研究[D].中南大学,2010.

作者简介:孙禾(1988-),男,助理实验师,研究方向:空中交通管理。

猜你喜欢
语音识别
通话中的语音识别技术
面向移动终端的语音签到系统
农业物联网平台手机秘书功能分析与实现
基于LD3320的非特定人识别声控灯系统设计
航天三维可视化系统中语音控制技术的研究与应用
基于语音识别的万能遥控器的设计
基于语音技术的商务英语移动学习平台设计与实现
基于Android手机语音和Arduino控制板的机器人控制系统
支持向量机在语音识别中的应用