胡茶娟 邸平
【摘要】计算机辅助口语测试技术为大规模口语测试的实现提供了可能。文章基于畅言互动英语口语测试平台开展了大学英语口语测试实践,探讨大规模在线口语测试的可行性,并就具体实施中存在的问题提出解决思路。研究表明,畅言互动英语口语测试系统具有良好的可操作性,其技术设计可以达到预设目的,但是在测试效度、测试信度以及技术整合上还需要进一步完善。
【关键词】口语测试:计算机辅助;大学英语:反思
【中图分类号】G420 【文献标识码】A 【论文编号】1009—8097(2013)06—0076—05
引言
随着大学英语教学改革的深入和大力推进,口语教学及测试己普遍受到国内各高校的重视。但是,在以教师为主导的传统口语测试环境下,由于学生人数众多、考试时间和教师精力有限,使得大规模的英语口语测试难以实现。以计算机技术为主的现代信息技术为促进大学英语教学改革提供了强大的技术支持,也为大规模英语口语测试提供了实现手段。一大学英语口语测试现状
口语考试是大学英语教学评估的重要手段。自2006年全面实施大学英语教学改革以来,全国各高校不同程度地实行了对大学英语教学理念、教学模式等方面的改革,但是,口语教学及其测试却未能实现与时俱进的突破。廖亦斌通过短信调查发现,受试对象中大部分高校(不少为211院校)口语测试不到位,在期末考试中并无口语考试的部分。而笔者同参加外教社暑期教学研讨班的其他高校教师交流得知,许多实施口语考试的高校出现了进退两难的尴尬局面。一方面,为了督促学生的口语学习,提高口语能力,口语考试势在必行;另一方面,由于采用的是以教师为主导的传统口语测试,为了保证考试的真实性和公正性,通常会以小组讨论形式让学生就某个话题进行交流,并安排至少两名教师评分,但是这种传统口语测试用到大规模的大学英语口语考试中,不仅需要耗费掉大量的时间和精力,而且对学生口语能力提高的促进作用也相当有限。
出现以上现象的原因主要有:(1)扩招后的师生比列严峻,无论是采取1:1、1:2还是1:3的师生比例考试组合,都需要耗费巨大的时间和精力,口语考试实施困难。(2)没有规范化的培训,教师口语测试评判能力和水平参差不齐,无法保证口语考试的信度和效度,并且为了保证公正每个考试小组配备两名以上教师的要求也会让大规模的口语测试难以实现。(3)缺乏相关部门的介入和指导,口语考试没有正式纳入学生评估体系或所占比例甚小,也未纳入教师的工作量,费时费力,教学双方收效不明显。可见,传统口语测试已经不能满足目前大学英语教学的需求,大规模英语口语测试迫切需要的是一种省时省力、高效的测试方式。随着计算机和网络技术的发展,计算机辅助口语测试技术已经成熟,“将多媒体软件应用于口语教学是对传统口语教学的突破,也是当前大力加强口语教学的社会现实需要”。
二 畅言互动口语测试平台简介
畅言互动英语学习平台是由科大讯飞信息科技公司研发的可部署在校内网、校外网和计算机教室的自主学习系统。该系统融合了智能语音技术,可以帮助实现智能化、自动化的英语口语测试、英语听力测试、英语口语对话学习、英语朗读训练和英语单词速记,并且有利于教师快捷方便地掌握学生的英语水平和学习进度。口语测试功能提供一个开放性的考试环境,教师可以设定试题,通过系统的实时评测功能,进行自动化考试、判分和生成测试报告。其关键语音技术包括:(1)语音合成技术(TextTo Speech,TTS),该技术能够自动将任意文字实时转换为连续的自然语音,提供高效便捷的语音信息服务;(2)语音识别技术(Auto SpeechRecognize,ASR),让计算机辨别人类的语音,并将语音中包含的文字信息提取出来,实现有效人机交互。(3)语音评测技术,即通过计算机自动对发音进行评分、检错并给出矫正指导。以上关键语音技术服务通过Web Service的方式实现。
三 大规模在线口语测试设计和实践
1 实践对象
研究对象为我校2012级普通班学生。目前我校大学英语教学实行分级教学,分为长望实验班(三级起点班)、实验班(二级起点班)和普通班(一级起点班)。其中,普通班学生共2569人,占年级总人数的76%,其学期总评成绩由平时成绩(10%)、口语成绩(10%)、期中成绩(20%)和期末成绩(60%)四部分组成,其中口语成绩指学期末的在线口语测试成绩。
2 实施方案
口语考试地点为我校大学多维语言综合训练中心的两个大学英语自主学习教室,共200个学生机位。
(1)时间安排
期末口语考试集中安排在两天进行,考试时间为8:00-12:00和13:00-17:00,学生根据各自事先安排好的时间段进入自主学习中心考试,每一轮考试流程(包括组织过程等)控制在30分钟以内。进行口语考试的时间为10分钟,非设备等客观原因学生不允许重考。任课教师不用到场,考试地点有一名实验技术人员和两名学生助理负责维护考场秩序和进行考试指令说明。
(2)题型设计
本次口语考试内容由任课老师结合所学课文主题设计,共九套不同主题的口语试题(题型设计见表1),学生随机选取进行口语考试。
3 学生终端
学生登录畅言互动英语学习平台,输入学号和密码,确认个人信息后进入口语考试界面。该界面为学生提供了九套口语测试题,学生随机选择一套后,口语考试正式开始。
第一部分为短文朗读。朗读片段的内容和体裁选自全新版大学英语综合教程的课文。系统在宣读题目指令以后,提供示范朗读(图2),为学生提供朗读技巧参考和准备时间。学生可以选择跳过直接进入朗读考试,录音时间为2分钟。
第二部分为主题说话,情景主题参考新视野视听说教程的单元主题设计,提供思路提纲(图3),学生要求就提纲进行语言组织和口语表达。该部分准备时间为3分钟,录音时间为2分钟。
学生在其电脑终端完成整个口语考试所需时间仅为10分钟。总的来说,该平台提供的学生端口语测试功能良好。据学生口语考试结束后的访谈记录,学生普遍认为:(1)该平台提供的界面友好,操作简单,省时高效。(2)大部分学生对自己的口语成绩表示满意,认为在线口语测试客观公正。
4 教师终端
口语考试结束后,任课教师可以在任何一台联网的计算机终端上登录学习平台管理系统(图4),查看学生的测试成绩和测评报告,导出学生测评成绩和考试录音。如果对学生成绩不确定,可以查看详细口语测试报告(图5)。该报告将提供学生的口语考试各部分的录音和原文参考,教师可以播放学生录音进行重新评估,确保无误。
根据任课教师的考试总结和会谈记录,畅言互动在线口语测试平台具有以下优势:(1)考试组织管理得以简化,节省了人力物力。口语考试时任课教师不需要到场,整个考试过程由系统自动生成口语成绩和评估报告,教师需要完成的是整体管理学生成绩和把握学生口语水平。(2)系统自动生成的评估报告,能够比较真实地反映学生的口语现状,为任课教师的口语教学提供参考,缓解口语教学中师生1:1交流机会少的局面,增进教师对学生的了解。(3)系统的录音保存功能和导出功能,创建了一个丰富的口语语料库,教师不仅可以通过录音重播追踪学生的口语学习进展,而且也为教师进行口语教学研究提供了数据资源。(4)为学生提供个人原始录音和示范音频,还原口语考试现场,有助于学生自我分析和发现口语表达中存在的问题。
四 存在的问题与反思
1 对在线口语测试平台的反思
(1)测试效度
效度是测试的可解释性和可推广性。大学英语口语测试是针对基础阶段大学英语学生进行的口语能力评估。《大学英语课程教学要求》对基础阶段口语能力提出了要求,即“能就教材内容和一般的听力材料进行问答,复述和讨论;能用英语进行一般的日常会话;能就一般的社会生活话题进行简单的交谈、讨论和发言,表达思想清楚,语言、语调基本正确”。畅言互动口语测试平台拥有的语音识别技术(ASR)实现了数字化模拟口语考试机制,减轻了口语测试对考官的需求和考试效度的压力,能够通过诸如朗读、看图说话、复述等结构主义口试题型对学生录音进行机评自动生成成绩。这样的人机对话有比较固定的参考答案,具备命题容易、评分相对客观可靠的优点,但是该平台支持的人机对话考试模式只局限在某些测试题型上,无法实现如谈话、讨论、辩论等交际法口语测试题型的机考,因而很难做到真实的沟通,体现出交际的真实性和交互性,不能完全准确的反映学生的真实交际能力。蔡基刚认为“只有试卷内容能测试到各种相关的交际功能,而且这些功能具有足够的代表性,才具有较高的效度”。理想的口语测试考查形式应该是对话、讨论、辩论等具有交际真实性和互动性的题型。而此类题型所要求的真实性和互动性却是目前较难攻关的技术难题,今后的研究和开发应该专注这一方面,让在线口语测试更加真实化,进一步提高在线口语测试的效度。
(2)测试信度
信度主要指测试的稳定性和可重复性。大规模口语考试实现准确、公正地测量学生的实际口语能力需要考虑评分模式的可行性和可靠性。我国大学英语口语测试的对象为水平相对较低的在校学生,因此在制订具体的评分标准上要依据学生的实际情况来决定。综合式和分项式是目前大规模考试常用的评分模式。为了确保口语考试的信度,提高口语测试对学生口语学习的反拨作用,评分标准和原则应该保持一致性,为学生和教师提供多角度、多层面的测评分析,为今后的学习和教学提供参考。蔡基刚指出,可以利用计算机把口语评分内容分解,将打分专业化、流水化,实现计算机口试的准确性和高效率性。在线口语测试系统的评分一致性需要通过专业、细化的评分系统来实现。这样的评分系统能够提供:1)能力分项评分(AbilityAnalytical Scoring),从语音、词汇、流利性等各方面对学生的口语表达能力进行评分,然后根据各个方面的得分算出总分;2)题型分项评分(ItemAnalytical Scoring),就考生对各题的内容表达及语言表现程度给分;3)总体综合评分(Holistic Scoring),把学生的口语能力分为五个等级,按每一级规定的标准给分。畅言互动英语学习系统提供的口语测试平台并未细化评分标准,系统自动生成口语成绩评估报告构成比较简单,只是将单项得分列举出来,对口语表现的得分点或是扣分点没有明确说明,特别是对学生口语表现的能力分项未作出单项评分。这样形成的测评报告只能为学生和教师提供一个总体判断,无法帮助学生深入了解自己口语学习的优势和存在的问题,跟进自己的学习。
(3)测试技术
畅言互动英语学习平台的服务端使用VS2008开发工具C#语言进行开发,以.NET Framework 2.0作为实行环境,产品为B/S架构,并使用AJAX技术来进一步提升系统页面的表现力。服务端的配置要求为:Intel Penfium 3.2 GHz(2 Core)的CPU、2G内存、200G以上的硬盘剩余空间和100M网卡,其对应的服务端并发性能支持1千人同时在线和50路关键业务,而口语测试每题评测时间不大于评测引擎客户端所需时间的120%。客户端采用Delphj开发外壳程序与部分允许离线使用的客户端功能,其他的部分采用嵌入浏览器控件打开服务端页面的方式实现,使得客服端具备较好的响应效果。系统采用的关键语音技术服务通过Web Service的方式实现,便于灵活部署。
但是作为口语测试系统的重要功能之一,该系统的数据库管理和维护功能稍显薄弱,在提供学生考试录音及传送给客户端的表现上比较吃力。为了保证传输可靠性和可行性,便于考试过程中大量文件的传输,今后在线口语测试系统的研发除了需要高性能网卡提高服务器的网络并发能力,更有效的方式在于对系统服务器进行有效划分,建立应用服务器和数据库服务器,采用如Microsoft SQL Server 2008等大型关系型数据库作为后台管理数据库,延伸数据管理的有效性,建立“以数据的综合处理、流程汇总、试题数据库管理和信息检索技术为核心”的大型网络数据整合应用平台。
2 对在线口语测试方案和实施的反思
(1)优化测试方案
本次口语测试仅有短文朗读和主题说话两种题型,容易操作和实施,在机考口语测试中易于实现,但考查形式稍显单薄。人类语言具有强大的交际性,交流互动是学习一门语言最大的目的。短文朗读侧重语音基础和意群停顿,主题说话注重描述事物或叙述事件的能力,两种考查形式都缺乏交际功能,只能局限在描述、叙述等语言功能上,无法测试较高级的语言能力,存在引出的话语功能和话语范围比直接口试狭窄的问题。
另外,本次口语考试测试时长为10分钟,除去考试指令、准备的时间,真正用于口语表达的时间仅四分钟,这其中只有两分钟的时间用于主题说话。后期学生访谈结果也证明了这一点,有学生反映“考试刚开始,我还没找到感觉就已经结束了”。测试时间长度的制定需要考虑学生人数、设备数量、教学计划、实验人员工作时间等诸多客观因素。合理有效的考试长度不仅能让大规模口语测试高效有序的完成,而且能够为学生提供足以展现其口语能力的时间长度。可见,今后开展口语测试时间需要作出调整,调整依据可以参考大学英语四六级口语测试等大型考试的时间设置标准。
(2)完善评价体系
目前,我校学生的口语成绩占期末总评成绩的10%,而教师对学生的口语成绩评定主要取决于期末在线口语测试成绩,这使得学生平时在线口语训练的参与性不高,大部分学生反映平时很少在自主学习中心进行在线口语练习,部分学生甚至从未去过自主学习中心。只有建立多层次、多维度的评价体系和口语学习激励机制,加大口试在学期成绩中的权重,把在线口语考试纳入形成性考察之中,从平时、期中和期末口语考评三个方面对学生做出要求,注重平时成绩的积累,促进学生参与在线口语训练的积极性,树立学生口语学习的主体意识,从而减少偶然因素的影响,使评价更加客观。
(3)促进教师多维角色转变
教师的指导、监督和管理角色在口语测试中具有重要作用。作为在线口语测试的管理者,教师应该及时查看学生的口语练习记录,对学生的在线练习数据给予反馈和帮助,引导学生参与更多的口语练习任务,实现在线口语练习的良性循环,保证教学相长的双向互动性。教师管理的不到位在本次实践中凸显出来,大部分教师反映还未从传统口语测试的角色中转变过来,在线口语训练仅仅停留在对学生的口头要求上,并且多数教师对在线测试平台没有深入了解,更谈不上对学生的监控和指导。因此,为了让教师熟悉在线口语测试系统,对教师的系统培训显得尤为迫切,除此之外,同样需要建立相应的机制规范教师行为,避免出现由于在线口语测试系统的自评功能使得教师完全依赖于机评的被动现象。
五 结束语
口语测试是语言能力测试中不可缺少的一部分。现代教育技术的发展为大学英语口语测试寻求新的突破提供了契机,计算机辅助大规模英语口语测试还处于尝试阶段,如何使大规模的口语测试易于操作并具备显著的效度和信度,还需要大量的实践和探索。