提高大学生英语听说能力的“影视语料库”方案研究

2013-12-08 07:15:22吴艳霞王玲香
和田师范专科学校学报 2013年4期
关键词:视频点播符码主题词

吴艳霞 王玲香

(江西中医药大学人文学院,江西 南昌 330004)

语料库现在一般是指存放在计算机里的大量语料和定位检索管理软件的结合[1]。语料库功能十分强大,最突出的特点是能快速而准确地提供一个或多个关键词有关的批量真实语料,从而揭示语言的本质和运用规律,对日常外语教学十分有用。

一、语料库应用于语言教学的国内外研究现状

国外早在上世纪70年代便开始将语料库应用于语言教学。到了90年代,随着语料库应用于语言教学的规模不断扩大,语料库和语言教学成为1994年语料库语言学年会(ICAME)的主题,Wichman等人将该年会论文编辑为《教学与语言语料库》[2]。开始于1994年的教学与语料库国际研讨会(TaLC),两年一届,主要研究每届TaLC的主要议题和研究成果,语料库应用于语言教学呈如下发展趋势:(1)语料库应用于教学的研究已跨出了宣传和介绍其可能性和潜在价值的阶段,落实到了如何向教学应用。(2)对普通语料库进行教学加工,用于语言教学实践的方方面面。(3)教学语料库要开发适合学生水平、符合教学要求和进度的小型语料库。(4)创建多模态语料库,即语料库与音频和视频相链接的,甚至是同步共现的综合性教学资源库。

国内,语料库在语言教学尤其是外语教学中的应用研究,也取得了一定成果[3][4][5]。这方面贡献比较突出的是华南师范大学的何安平教授和她的科研团队,不仅取得了丰硕的成果,而且还建立了语料库语言学与语言教育教学的专题网站。但目前国内对语料库在外语教学中的应用还仅局限于语音、语法、词汇和阅读教学,对于听说教学,其应用价值大打折扣。目前,专门针对听说教学的语料库很少有人问津,是个亟待开发的领域。本文作者在中国期刊全文数据库里分别以“语料库听力”、“听力语料库”和“视听语料库”为主题和关键词,对2001至2012年间全部期刊进行检索,共获得有关听力语料库研究的学术论文13篇,按论文的研究内容将其进行分类如下:(1)对纯文本语料库在听力教学中应用的探讨。(2)对听力语料库构建的介绍。(3)对视频语料库优点的综述和笼统的构想。

基于以上研究,并对学生的听力需求做大量的调查后,本文以英语原声电影和电视为语料,构建“影视语料库”。电影、电视等未经改写的原始材料,注重语言的原生性和学习的场景性,是练习纯正地道英语的首选。但往往线性播放,作为听说材料,不利于主题的加深及图式的构建。本文利用视频点播系统和多款语料检索工具,与教材单元主题同步,垂直整合电影、电视的精彩片段,开发“影视语料库”,以期为学生提供真实的听力材料并帮助学生掌握口语的主题图式和心理词汇,提高听力理解和口语表达内容。

二、影视语料库的功能结构

图1 影视语料库的功能结构

如图1所示,“影视语料库”总规模约6万词,包括“影视视频语料库”和“影视文本语料库”两个子库,前者重在听说训练,而后者重在意义的构建。两者相辅相成,共同促进听说水平的提高。

三、“影视视频语料库”的建立和检索

(一)“影视视频语料库”的建立

图2 视频点播系统主界面

“影视视频语料库”的设计容量为3万词左右,主要的语料来源为美国最近10年的动画片、电影和电视剧。语料收集后,利用Format Factory2.7或豪杰超级解霸,截取所需的电影和电视剧的片段,每个主题(如Culture)下10个视频片段,每个片段5分钟左右,共计6400个视频片段。主要根据主题并兼顾难度和语域的条件下,将其存放在四个子库(大学英语一、二、三、四册)。

(二)“影视视频语料库”的检索

1.视频点播系统

“影视视频语料库”的检索基于美萍VOD视频点播系统8.4标准版[6],本视频点播系统以校园局域网为基础,根据流媒体传输原理,采用B/S模式,其主界面图2:

视频点播系统由编码器、服务器、终端播放器三大部分组成。三大部分分工协作,共同完成语料的加载和检索。

①编码器:由一台普通计算机、一块流媒体采集卡和流媒体编码软件组成。流媒体采集卡负责将音视频信息源输入计算机;编码软件负责将流媒体采集卡传送过来的音视频信号压缩成流媒体格式,使其成为可供服务器发布的流式文件。

②服务器:由VOD视频服务器和一台硬件服务器组成。这部分负责增加、删除、修改、分发编码器传上来的流媒体节目。

③终端播放器:这部分由一台普通PC和播放器组成,可以实现在线查找、浏览、点播、下载以及评论音视频语料。我们将安装的播放器为QQ影音或KMPlayer,这两款播放器可以有效进行字幕显示、隐藏以及字幕语言切换,并且具有开始、停止、暂停、和随机播放等功能。

2.视频语料的加载

①在要发布视频的服务器上安装好视频点播系统,然后运行视频点播服务,这样一个VOD点播系统就搭建起来了。该系统已将视频点播的片源进行了详细的分类,有电影大全、电视剧场等6大类(如上图所示)。点击左方任意片源的下拉列表,还可看到每大类片源的进一步细分。作者根据需要对片源进行了重新的分类和细分。操作如下:点左键选中第一个分类“电影大全”,再点击右键,选择弹出菜单中的“重命名”命令,重命名为“全新版大学英语(一)”,继续点击右键,选择弹出菜单中的“新加子类”,连续加入“Culture”、“advertising”等和教材同步的16 个标题,如图3左方列表:

图3 “影视视频语料库”点播界面

②接下来为每个新加子类添加10个相同主题的视频片段,围绕同一主题的不同视频往往共享一个语义场,容易形成关于该主题的心理词库和图式。学习者的心理词库和图式越丰富,口语表达就会“言之有物、自然流畅、恰当得体”。我们将截取和压缩后的音视频语料根据主题和难度依次添加到每个片源子类中,如图3右方列表。操作如下:选中新加的子类后,在窗口上面的标题栏中点击“项目编辑”,在弹出菜单中选择“项目添加”命令。在打开的项目添加对话窗口中,直接指定影片所在路径,输入主演、导演、影片简介等信息。最后,在播放方式中要选中“此节目客户机通过美萍VOD服务器点播”选项,点击确定后,即可成功将电影添加到点播列表中。如图4:

图4 视频片段添加界面

③客户机不需要安装客户端程序。将美萍VOD点播系统目录中的“vodclient.exe”文件拷贝到每台客户机上。在客户机上运行“vodclient.exe”文件,第一次运行时,软件会提示你输入服务器IP地址。然后进入点播界面,双击你想看的节目开始点播。

四、“影视文本语料库”的建立和检索

(一)“影视文本语料库”的建立

文本语料库的设计容量为3万词左右,与视频语料库大体相等。语料内容为视频语料的字幕文档。

1.文本语料的预处理

文本语料库的语料收集有两种途径:①通过subrip软件将视频中的字幕转换成扩展名为 srt的字幕文档;②从射手网直接下载srt字幕文档。获得字幕文档后,再用LRC歌词文件转换器将字幕文档转化为文本格式,完成后称为文本生语料。将文本生语料,按照大学英语一、二、三、四册将视频语料库切分为四个子库,分别存放。在我们获得文本生语料后,还需做相应的加工和处理。这其中包括文本的清理、语料元信息标注。这里我们借助Detagging Tool实现清理任务;本课题标注的元信息,主要包括标题、文本类别、来源、关键词四个方面。我们使用目前常见的通用标准语言XML进行元信息标注。

2.语料符码

语法信息的标注又叫语料符码。常见的有词性符码和语法符码。本课题根据研究的需要对语料进行词性符码,词性符码指对语料里面的每一个词都添加词性标记。使用的符码工具为免费的自动词性符码软件TreeTagger,将符码后的语料也按照以上四册分别存放。

(二)“影视文本语料库”的检索

语料库检索的目的是导出索引行,以便我们批量观察以下几个方面语言现象:(1)最频繁出现的词汇及其最核心的意思;(2)最常用的典型组合。前者,我们通过提取主题词和核心主题词来实现。后者,我们通过提取类联接、词语搭配和词块来实现。这些规律的掌握有助于学生掌握覆盖率广的常用口语词汇和表达,进而快速提高听说能力。

在比较了多款语料库检索软件后,我们选择了索引软件Wordsmith Tool 3.0v对“影视文本语料库”进行检索,提取主题词和核心主题词。通过统计和分析主题词、核心主题词的分布和内在联系,能够发现某一主题所触发的词语群,进而发现学生在表达某一主题的心理词汇[7]。我们使用类联接专用分析工具Colligator来分析类联接和搭配。Colligator由北京外国语大学的梁茂成和许家金等设计[8]。另外我们使用索引工具AntConc来分析在类联接和搭配基础上所形成的词块的使用情况[9]。

五、结语

建立影视语料库,将作为泛听材料的电影、电视转变为精听材料的视频剪辑;将点播系统应用于“影视视频语料库”,提供对视频材料的快捷、科学的检索;使用Colligator等语料库工具对“影视文本语料库”进行检索,能大大提高学生语言知识和技能体系构建的效果;将“影视视频语料库”和“影视文本语料库”结合起来,能优化听说习得过程。只要学生每天两个小时左右,不间断地使用“影视语料库”三个月,听力水平可以达到听懂每部电影85%到95%的水平,可以轻松听懂老外说的英语。如果能同时做到跟读模仿的话,三个月后,基本上可以达到口语和发音有质的飞越,同时口语也能达到比较流利表达的水平。该语料库的建库方法可以推广到日语、法语和某些难懂的汉语方言中。

[1]谢家成.论个人语料库的构建[J].外语电化教学,2003,(91):27.

[2]Wichman,A.et al.Teaching and Language Corpora[C].London:Longman.1997.

[3]王立非,梁茂成.计算机辅助第二语言研究方法与应用[M].第1版.北京:外语教学与研究出版社,2007.

[4]梁茂成,李文中,许家金.语料库应用教程[M].第1版.北京:外语教学与研究出版社,2010.

[5]何安平.语料库辅助英语教学入门[M].第1版.北京:外语教学与研究出版社,2010.

[6]吴浩.VOD系统与技术[J].宁夏师范学院学报(自然科学),2007,(6):99-101.

[7]甄凤超.主题词和核心主题词提取与外语听力教学[J].四川外语学院学报,2002,(3):153-155.

[8]文秋芳、王立非、梁茂成.中国学生英语口笔语语料库[M].第1版.北京:外语教学与研究出版社,2009(43-55).

[9]濮建忠.学习者动词行为:类联接、搭配及词块[M].第1版开封:河南大学出版社,2003(12-56).

猜你喜欢
视频点播符码主题词
《一直游到海水变蓝》中的电影符码解读
向真而死——论《菲德拉的爱》的消费符码与悲剧情感
符码的游戏艺术
现代装饰(2019年9期)2019-10-12 08:47:48
土家族吊脚楼文化的群体记忆与精神符码
流媒体的视频点播系统在微课堂中的应用研究
基于嵌入式Linux平台的网络视频点播系统
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
2014年第16卷第1~4期主题词索引
基于Web的流媒体视频点播系统在校园网络中的运用
西南学林(2014年0期)2014-11-12 13:09:00