语音识别技术在语言实验室中的应用分析

2013-04-29 05:11任宁宁李连民
都市家教·下半月 2013年6期
关键词:识别率发音外语

任宁宁 李连民

【摘 要】随着语音识别技术的发展,其识别能力和纠错能力的提高,语音识别技术已经成为提高外语教学的一种途径。本文就语音识别技术在语言实验室中的应用及发展趋势做了分析,以供大家借鉴。

【关键词】语音识别技术;语言实验室

语音识别技术是使用计算机能识别和理解的语言,把语音信号转变为相应的文本或命令的过程。语音识别是一门涉及到语音语言学、信号处理、模式识别、人工智能的多学科交叉技术,也是2000年至2010年间信息技术领域十大重要的科技发展技术之一。随着语音识别技术的发展,在传统的数字化语言实验室中其可以作为一种新的外语辅助教学的手段,完善现有的数字化语音室的功能。

一、语音识别技术

语音识别技术是一种让计算机能够听懂人的语音命令的技术。对使用者来说,这种人机交互的途径是最自然的一种方式。早在三四十年前,美国的一些大学和实验室就开始了语音识别技术的研究,50年代的AT&T Bell实验室研发的Audry系统第一个实现了可识别十个英文数字。60和70年代,提出了线性预测分析技术(LP)等相关理论并深入研究,创造出可以实现特定人孤立语音识别系统;80 年代和90年代是语音识别技术应用研究方向的高潮,HMM 模型和人工神经元网络(ANN)的成功应用,使得语音识别系统的性能比以往更优异;伴随着多媒体时代的来临,微软,Apple 等著名公司都研发出相当成功的商业应用语音识别系统,比如,Apple的Siri系统,微软的Phone Query(电话语音识别)引擎等。近二三十年来,语音识别在交通、军事、工业、医学等诸多方面,特别是在计算机、通信与电子系统、信息处理、自动控制等领域中有着非常广泛的应用。目前,语音识别技术产品在人机交互应用中己经占到越来越大的比例。例如,在声控应用中,计算机可识别输入的语音内容,并根据内容来执行相应的动作,这包括了声控语音拨号系统、声控智能玩具、医疗服务、宾馆服务、家庭服务、股票查询服务和工业控制等。也可用于基于微型机的办公、教学、娱乐等智能多媒体软件,如语言学习、教学软件、语音玩具、语音书籍等。语音识别技术作为语音控制的主体,在应用领域中正成为一个具有竞争力的技术。

语音识别的开发平台现已逐步成熟,在windows下有微软的SAPI语音识别开发平台,在Unix/Linux下有IBM的ViaVoice和开源的Xvoice开发平台。它们都是相当优秀音识别开发系统,提供了良好的开发接口,使语音识别应用程序开发能够不需要对现有系统做大规模的修改,以较少投入、较短周期、以组件方式加入到当前的语言实验室中。

二、语音识别技术在语言实验室中的应用

1.有声图书

可以将一些由外籍专家录制的有声图书加入到语言实验室的资料库中。标准的美式或英式发音,结合文本,逐字逐句的朗读,让学生可以在阅读英语图书的同时聆听到原汁原味的英语。所有图书都支持自动播放,可以一次听完整本书,学生也可以选择单独播放某个句子,并鼓励学生模仿标准的语音语调朗读图书。从而对学生的阅读、听力、口语进行全方位的提高。

2.口述作文

影响语音识别系统辅助学生口述作文的最为关键技术是识别率和纠错能力,从某种意义上说,只要这两个关键的技术得到了提高,则其辅助写作的有效性就会得到较大提高。近几年,随着多媒体技术和人工智能技术的进步,不仅语音识别系统的识别率得到很大提高,而且多语言的语音识别产品也大为丰富。目前国际商业机器(IBM)公司推出的语音识别软件具有非特定人,无限词汇量,连续语音识别,高识别率,专业文章智能分析、理解等强大的语音功能。该软件通过对个人话语进行测试与分析来适应说话者,适应后的语音识别正确率可以达到95%以上。与过去相比,其识别率提高了很多,已经完全可以接受。语音识别系统除了识别率目前已有很大提高,其智能纠错能力也大为提高。一是纠错的操作更加方便和容易,目前的语音识别系统,可以有三种纠错方式:①通过键盘输入方式;②系统智化地产生错误词的相近词列出,供修改者选择;③还可以通过重读来纠错。二是通过纠错,可让语音识别系统更进一步地熟悉说话者的声音,而非常有效地提高系统识别率。随着信息技术的迅速发展,今后的语音识别系统必将是功能更加强大,智能化程度更高,兼容性更强,抗噪音能力更强的系统,其辅助口述作文的有效性也会更强。

3.英语口语纠正系统

语音识别技术的应用使得软件可以具有发音评测的功能,能够帮助学习者及时发现和纠正发音的错误,避免重复错误形成习惯,从而极大提高了学习者的学习效率。英语口语学习中语音识别技术遇到的难点主要有:①语音识别选取基元的问题。一般地,欲识别的词汇量比较多时,所用基元应该越小越好;②端点检测。语音信号的端点检测是语音识别的关键。据研究表明,即便是在安静的环境下,语音识别系统也会有一半以上的识别错误源自端点检测器。提高端点检测技术的关键所在是寻找稳定的语音参数;③找出反映发音质量的性能指标。主要是对发音段(指一段发音的语速、韵律、语调以及重音等)的研究;④对给定的发音进行错误检测和纠正,寻找合理的评分机制。

由于语音识别在理论与技术方面的复杂性,现有的口语纠正软件仍有很大限制范围,但随着语音技术的发展相信其在外语语言学习中的应用会越来越广泛。

三、结束语

语音识别技术作为一种逐渐成熟的计算机技术,是计算机辅助外语教学中的一种重要虚拟现实手段。而人机交互是数字语音室的一个发展方向,也是外语网络教学的核心内容。所以,语音识别技术会是未来语言实验室的建设中的一个重要方向。

参考文献:

[1]夏晴.ARS和TTS技术在外语口语教学中的应用研究[J].外语电化教学,2006(2)

[2]周英.语音识别技术发展趋势的分析[J].计算机光盘软件与应用,2012(19)

[3]孔菊芳.基于语音识别技术的英语学习网站分析[J].哈尔滨职业技术学院学报,2012(5)

作者简介:

任宁宁,硕士研究生,助理实验师,主要研究方向为计算机应用技术。

猜你喜欢
识别率发音外语
I’m a Little Teapot
基于类图像处理与向量化的大数据脚本攻击智能检测
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
外语教育:“高大上”+“接地气”
大山教你学外语
高速公路机电日常维护中车牌识别率分析系统的应用
大山教你学外语
Playing with h
Playing with /eI/