基于MSAgent和TTS的剧本引擎设计与应用

2012-04-29 11:50凌代红
电脑知识与技术 2012年30期

凌代红

摘要:MS Agent是Windows上的一种自由技术,具有强大的动画能力、交互性和灵活性,对教育软件产生了重大影响。基于 MS Agent和TTS的剧本引擎能分离剧本内容与剧本行为,方便调试、维护和扩展。基于 MS Agent和TTS的剧本引擎设计的IT实用英语朗读平台界面人性化,富有亲和力,提供多种形式的角色表演,满足多种个性化用户需求,提高了教学的趣味性和有效性。

关键词:代理技术;TTS;剧本引擎

中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)30-7344-03

MS Agent[1]是Windows上的一种自由技术,为应用程序和网页提供了新技术去创建新的交互式用户界面。它具有强大的动画能力、交互性和灵活性,非常容易开发,使人们与计算机更加有效、自然地交流。它是多种软件服务的一个集合,使得开发者能够将交互式卡通角色与应用程序和网页协同工作。这些角色通过TTS引擎或声音记录,可以说话,甚至接受语音命令。可视化交互式的个性化角色,可以增强应用程序和网页,使得用户与他们的计算机,进行更强的人性化交互。

目前,随着高校的扩招,高职的生源中,有普通高考的低分段学生,也有职高或中专的三校生,这些学生英语基础普遍较差,绝大部分学生对学习英语没有兴趣。这使得高职院校英语课的教师面临着很大的挑战,以教师为中心,重讲授、轻实践的传统课堂教学组织形式已不适应目前的教学,探索工学结合、推进有效教学是高职院校人才培养工作评估的要求,也是全面提高教学质量的必然选择。

为了推进IT实用英语的有效教学,我们设计了一个基于MS Agent和TTS的剧本引擎,将这个引擎应用在IT实用英语教学中,即在这个引擎的基础上开发一个IT实用英语朗读平台。

1 常见语音朗读软件的状况与问题

常见语音朗读软件(如TextAloud、Speak Aloud、Speaking NotePad、eSpeak、TTSAPP、MagicVoice、SmartRead、Panopreter Basic、Fread等)使用语音合成技术将文字转化为语音,用户可以在电脑上听,甚至保存为WAV等格式的文件。除了具备播放、停止、语速调节、音量大小调节等控制功能外,它们甚至还提供了“波形显示”和“字幕显示”等的功能。

但令人遗憾的是,在高职院校的IT实用英语教学中,常见语音朗读软件难以满足IT实用英语教学需要。Alan Cooper[2]在《软件创新之路——冲破高科技营造的牢笼》一书中指出“精确描述我们的用户以及用户希望达到的目标”、“最简单的方法是找到真实的用户并且向他咨询”。受这些思想的启发,我们与用户(高职院校学生)反复交流,获得了许多宝贵的反馈意见。大多数用户认为,在基于投影仪的多媒体教学环境下,常见语音朗读软件主要存在以下问题:1)虽然提供了文本框或字幕框,但是文本框或字幕框中的文字往往太小;2)虽然提供了语速调节的功能,但是往往不为单词提供重复朗读的功能;3)虽然提供了中英文混读的功能,但是中英文混读效果往往不够理想;4)虽然提供了英文朗读的功能,但是没有为单词提供逐字母朗读的功能;5)虽然提供了华丽的图形界面,但是图形界面仍然缺乏人性化和亲和力。

2 MS Agent对教育软件的重要影响

MS Agent对教育软件产生了重大影响。MS Agent卡通角色不仅生动风趣,而且还能通过TTS引擎和语音命令与用户进行交谈。这些角色在屏幕上可以显示、移动和隐藏,使得计算机在教学活动中更富人情味,学习者仿佛与可爱的动画人物进行交流,这将使教育软件的质量发生新的飞跃。

众所周知,人类的学习活动是社会化的行为方式,有效的学习需要学习伙伴的集体气氛。20世纪后期的计算机技术只能实现框面式的教学软件界面,因而往往被人们批评为“电子翻书器”或“课本搬家”。当时人们只注意到CAI的个别教学的优点:小步子、积极反应、即时强化、学习者自定步调、低错误率等。但是,计算机辅助教育的实践表明,由于计算机辅助教学软件大多数是提供文字和图标式的人机交互,这种机械的学习,往往使学习者在刚开始使用教育软件时饶有兴趣,但很快就产生厌倦感,因而发展教育软件的人性化界面一直是教育技术界努力的方向。

MS Agent卡通角色通过形象与动作的生动变化,语言交流,对用户输入内容的判断参与学习者一起进行学习活动,不仅使学习者感觉到是与各种可爱的动画人物进行交往,而且在学习的过程中建立起虚拟社会生活情景,从而使计算机在教育中的应用从辅助工具阶段发展到学习伙伴和虚拟学习社区的新阶段。

3 基于MS Agent和TTS的剧本引擎之设计

3.1 设计目标

我们设计一个基于MS Agent和TTS的剧本引擎,在这个引擎的基础上开发一个IT实用英语朗读平台。为了解决MS Agent在TTS上的一些问题,我们还在剧本引擎中附加一个Text to Wave管理器。

基于MS Agent和TTS的剧本引擎的设计目标是:根据IT实用英语剧本的一些规定,在MS Agent和TTS的基础上,利用Jscript[3,4]来设计一个剧本引擎,进而开发一个IT实用英语朗读平台,提供更加适合教学需要的人机界面,分离剧本内容与剧本行为,使得任何合法的剧本内容都可以产生某种行为的角色表演,甚至使得同一剧本内容可以产生不同行为的角色表演,满足多种个性化用户需求,提高开发效率和教学效果。

3.2 方案框架

剧本引擎的方案框架,如图1。图中,TTW是Text to Wave的简称。

4 Text to Wave管理器

4.1 设计目标

Text to Wave管理器的设计目标是:利用JScript来管理多种Text to Wave技术(如eSpeak、TextAloud、Active TTS),将这些技术包装在通用接口,有效地解决MS Agent的TTS引擎不支持中文语音输出的问题,并且解决一些卡通角色在语音输出或语音标记上的问题。

4.2 方案框架

5 基于MS Agent和TTS的剧本引擎之应用

5.1 剧本引擎在IT实用英语教学中的应用

IT实用英语是计算机应用技术与网络系统管理专业的一门专业课程,是进一步学习计算机及相关专业英语词汇、掌握科技英语的表达方法和技巧的一门课程。通过学习,帮助学生巩固英语听、说、读、写、译五种基本语言技能训练和词汇、语法等语言知识,提高学习的英语交际能力与综合职业素质,从而提升他们的就业能力。

面对英语基础普遍较差、对学习英语兴趣不高的学生,我们在教学中引入了IT实用英语朗读平台,富有人性化与亲和力的界面,多种形式的角色表演,给枯燥乏味的英语课注入了活力,激发了学生的学习兴趣,吸引学生积极参与,提高了教学的趣味性和有效性。紧密结合高等职业教育的特点,以“工学结合、能力为本”的教育理念为指导,将语言学习与职业技能培养有机融合,确保教学内容和教学过程真正体现职业性与应用性。

5.2 IT实用英语朗读平台的体系结构

IT实用英语朗读平台的体系结构,如图3。

6 结束语

Ms Agent具有强大的交互功能、鲜明的人性化特点和优美的操作界面,基于 MS Agent和TTS的剧本引擎开发的IT实用英语朗读平台界面人性化,富有亲和力,能提供多种形式的角色表演,满足多种个性化用户需求,能分离剧本内容与剧本行为,方便调试、维护和扩展,附加的Text to Wave管理器,能增强MS Agent在语音输出上的能力。

参考文献:

[1] Microsoft Agent Version 2.0 Document [Z].

[2] Alan Cooper. 软件创新之路[M]. 刘瑞挺,刘强,程岩,等,译. 北京: 电子工业出版社,2000.

[3] 扬克.亚当斯. JavaScript完全解析[M]. 黄少年, 施游, 田支斌,译.北京: 人民邮电出版社,2009.

[4] ECMAScript Language Specification(Third Edition) [EB/OL].