陈雯雯
摘 要:随着计算机的普及和快速发展,信息技术对语言测试形式产生了重要的影响。很显然,计算机适应性语言测试已经成为这一领域最重要的发展方向。本文主要介绍了计算机化调适性语言测试(Computerized Adaptive Language Test以下称CALT)的定义。并且分析了CALT的优势及其面临的问题与挑战。并指出,计算机化调适性语言测试因为它符合外语教学改革发展的实际需求,将成为引领外语测试的新方向。
With the popular of computer and its rapid development,information technology has a significant impact on language testing. Obviously,Computerized Adaptive Language Test(CALT)has become the most important development direction in this field. This article mainly introduces the definition of CALT. At the same time,it not only analyzes the advantages of CALT but also analyzes the questions and challenges it faced. It also point out that because CALT can meet the actual demand of foreign language teaching reform,it will become the new leading direction of foreign language testing.
计算机技术的发展不但影响着外语教与学的整个过程,同时也使得语言测试的技术手段和方式发生了重大的改变。语言测试技术已经成为众多研究者关注的新课题。2001年在美国举行的第23届国际语言测试研讨会的主题就是“语言测试与技术”,基于计算机技术所构建的测试新方法——计算机化调适性语言测试成了本次会议的重要议题。计算机化调适性语言测试由于其因材施测、能精确估计考生能力及节省施测时间等显著的优点,正逐步渗透到各类外语测试中去,将引领外语测试发展的新方向。
一、计算机化调适性语言测试的定义
计算机化调适性语言测试源于计算机化调适性测试(Computerized Adaptive Test)(下称CAT),是一种技术上受计算机终端和PC管理的先进的测试语言能力的方法。它是现代语言测试理论与当代多媒体技术相结合的产物,采用项目反应理论为数学模型建立题库,并以此根据题目的各方面信息和受测者的答题情况,从题库中选取符合受测者语言水平的题目进行测试,在最短的时间内迅速准确地估计受测者的语言能力,直到达到预定的测试精度要求。
二、计算机化调适性语言测试的优势
计算机技术的发展和测量学“项目反应理论”的成熟催生了新一代计算机化语言测试——计算机适应性语言测试。这种被称为“量体裁衣”式的测试具有传统的纸笔测试无法比拟的优势,如具有良好的反馈作用,测试的个性化、人性化加强,安全性提高。为每位受试提供适合其语言能力的题目或任务,能够提高他们的兴趣,促使他们发挥最佳水平,从而实现对受试语言能力更准确的测量。例如,基于网络的DI-ALANG融自我评估和诊断性测试为一体,为受试提供个性化的语言能力评估信息。一些新题型得以开发使用,如文章复原法可以用来考察受试在句子和语篇层面的语言理解能力。
比较传统的纸笔考试而言,CALT具有以下的四点优势:
(一)具有人性化和个体性
在传统的考试中,不管考生实际语言能力如何,都必须做大量的固定的试题进行语言考查,需要较多的时间;而在CALT中,后面试题的呈现是以前面答题的反应情况来决定的,或难或易,循序渐进的进行。同时,CALT还可以根据不同的测试对象确定不同的常模,考试的内容、题量因人而异,有针对性的施加测试题目,具有无可比拟的个体性,具有人性化特征,符合外语教学改革的要求。
(二)具有科学性和准确性
效度与信度是语言测试中最重要的两个原则,测试的科学与准确性取决于该测试是否具有高效度和高信度。在传统的测试中,由于不同考生接受同一批题目的测验,语言水平低的考生无法作答难度大的题目,那些难度小的题目对语言水平高的考生又测不出真实水平,测试的效度时而高、时而低,难以把握。CALT则不同,它不但定义了信息函数这一综合质量指标作为科学挑选题目的标准,而且题目函数估计准确,电脑能根据题目相对难度、题型和考生对初始题目应答的整体表现,适度调整出与考生水平相适应的题目。因此,由于测验的信息量最大,也就能最大限度地测算出代表考生实际语言能力的成绩,测试的效度也就最好,实得分数分布与目标分数的分布的拟合度也最好。同时,就信度而言,传统的测试评分往往由人工评判,虽然有统一的参考评判尺度,也难免会因人而异而产生误差。CALT则通常具有良好的稳定性、等值性与客观性,且考生每答对一个试题就会重新估计一次考生的能力估计值,测试之后能马上打印测试结果,各项工作由电脑自行进行,排除了人为的因素,测试成绩公开、公正、公平、真实可靠、准确性高。
(三)具有保密性和安全性
与传统的测试不同,CALT由于對不同的考生施测不同内容,大大地降低了猜题、舞弊的发生,对题库中题目曝光频率的控制与测试数据的层级保密很大程度上都提高了语言测试的安全性。
(四)具有经济性与实效性
比较传统的测试,CALT的题量较少,考试时间短,节省了大量的人力物力,降低了成本。测试之后能立即计分并报告成绩和给出反馈,快捷又实效。除此之外,CALT由于可以调整学生的作答速度与题目难度,测试环境自然、宽松,降低了考生的考试焦虑与挫折感,尤其在口语、听力考试中更益于考生正常发挥自己的真实水平。
这种被称为“量体裁衣”式的测试具有传统的纸笔测试无法比拟的优势,如具有良好的反馈作用,测试的个性化、人性化加强,安全性提高。与其他的考试相比,CALT考试更注重考试过程及其测试精确度的提升。CALT能为每位受试提供适合其语言能力的题目或任务,由此可提高他们的兴趣,促使他们发挥最佳水平,从而实现对受试语言能力更准确的测量。
总之,CALT的优势在于具有明显的渐进性和个体性,即受试者即将面对的试题是以其前面答题情况而定,其题目或难或易,因人而易,循序渐进,具有很强的科学性和准确性。CALT不但以信息函数这一综合质量指标为科学的选题标准,而且题目函数估计准确,能最大限度地测算受试者的实际语言水平,并且具有稳定性、等值性与客观性的特点。CALT安全指数高保密性好,几乎不可能猜题、压题、舞弊。CALT由于题量灵活,时间可长可短,测试后能即时记分并报告成绩,所以说其具有经济性和实效性。
三、计算机化调适性语言测试面临的问题与挑战
现代信息和网络技术为语言测试带来了许多快捷和希望,同时也带来了一些问题和隐患。虽然互联网和电脑技术的普及速度非常快,但目前网络带宽和网络安全还是一个急需解决的问题。在我国有些地区计算机还不够普及,这就给计算机化语言测试的推广带来一定的困难。《教育部关于 2013 年深化教育领域综合改革的意见》提出要实施高考英语科目一年多次考试。随着“一年多考制度”的推广,必然会遇到同时使用多套试题的情况,随着而来的是试题库建设,现代网络和计算机技术的发展为试题库建设带来诸多方便,但试题库建设和使用涉及多方面的工作。试题参数的确定需要做大量前期工作。试题库的试题需重复使用,在试题使用之后主要问题之一是试题的安全性,如何不让使用过的试题泄露出去,这些需要更多研究和实践。同时为了保证考试的公平,多套同时使用的试卷之间的等值显得尤为重要,如何科学地利用现代技术等值试卷还需进一步进行研究。基于计算机的考试改变传统纸笔考试的一些题型和做法,这些改变对学生有影响,会在一定程度上影响试卷的效度。
而由于CALT研究起步较晚,所依据的理论基础与技术手段有待进一步完善,加之语言测试的特殊性及其与传统测试的差异性等原因,均不可避免地决定了CALT仍存在着诸多的问题:
(一)CALT的评分问题
传统测试中,如果学生不能回答某些问题,可以跳题或者省略,然而在CALT中允许跳题,若选题项没有被计分,学生可跳过题项答题时可能会对题目的安全性有影响。而如果不允许跳题,则是剥夺了学生资助决定做题顺序的自由。
(二)CALT的题项设计问题
在题项的采集上,传统测试在设计上常常根据明确的考试要求来收集某个特定领域不同的知识或者技能题项。而CALT的一般时间上会比传统测试短,很难像传统测试一样根据具体要求来收集题项。它一般是从所有可能的集体要求中随机抽选出。
(三)CALT测试题目中的交际能力问题
外语教学的目的是培养学生的交际能力,测试考生交际能力的高低则通过对语言行为的衡量来判断,即需在交际、环境、话题和目的等语言使用环境中测试考生的语言组织能力与语用能力;但是由于语用背景是具体的,千变万化的,没有固定的模式可寻,难以数字化和信息化,测试结果也只能被看成在考试所设计的背景下的特定的运用外语行为,而非考生在真实外语生活环境下的交际能力。因此,如何锁定测试目标设计出充分体现交际能力的真实测试项目是CALT须解决的棘手问题。
(四)CALT题型与语言测试目标能力关联性问题
不同起始题目与题型的选择对不同目标能力初步估计值的效度也不同,直接影响到目标测试能力的准确定位,起始题目、题型的选择对整个测试过程起着关键的导航作用。考生测试速度与语言能力的关系、CALT对教学的反拨作用、計算机操作熟练程度与测试成绩之间的关系以及如何避免商业化等问题都有待我们外语工作者与软件工程师进一步研究与实践。
曾用强教授在2009年全国英语专业四、八级测试暨计算机技术应用专题研讨会中,作了“计算机化考试的几点思考”为题的发言。他认为目前人们对计算机化考试存在一些误解,主要体现在:计算机化考试就是纸笔考试的计算机化或网络化;计算机网络技术决定了机考的发展;实现多次考试;简化考务工作。计算机化考试一般要经过内容设计、技术开发和实施三个阶段,计算机化考试有它独特的特点和规律,我们必须遵循这些特点和规律才能开发出符合考试发展和需要的计算机化考试。
四、总结
综上所述,CALT是现代化教育技术改变测试手段的新方向,世界上许多很有影响的国际性英语考试也正在全面推行CALT。作为一个新兴的事物,CALT仍有许多问题和挑战,需要不断地改进与完善。随着语言教学的改革与进步,计算机技术的优势将扮演越来越重要的角色。目前,在我国这方面的研究涉足并不多,相信计算化调试性语言测试将会越来越普及,研究成果也将日益丰硕。
参考文献
[1] 陈冰冰. 引领外语测试新方向——计算机化调适性语言测试[J]. 外语电化教学,2005 (102)
[2] 陈慧麟. 基于纸笔的语言测试和基于计算机的语言测试之间效度对等性验证模式初探[J]. 外语界,2009(3)
[3] 蔡基刚. 大学英语四、六级计算机口语测试效度、信度和可操作性研究[J]. 外语界,2005(4)
[4] 高国安. 浅谈计算机在外语教学中的应用[J]. 高校社科信息,2001(3)
[5] 何莲珍. 认知计算机适应性考试模型的设计[J]. 现代外语,1999(2)
[6] 洪云. 计算机化语言测试的发展及其面临的问题[J]. 中国成人教育2010(15)
[7] 金艳. 计算机化语言测试的效度研究——浅析计算机能力与测试构念的关系[J]. 外语电化教学,2012(1)
[8] 金艳,张晓艺. 技能综合对语言测试构念效度的影响——培生考试与大学英语六级网考的对比研究[J]. 外语电化教学,2013(154)
[9] 孔文,李清华. 大规模语言测试的方向:计算机适应性语言测试[J]. 外语界,2002(2)
[10] 刘建达. 现代技术与语言测试应用、影响及发展方向[J]. 外语电化教学,2013(152)
[11] 李清华,孔文. 基于计算机的语言测试及其效度验证[J]. 外语界,2009(3)
[12] 李清华. 基于纸笔的语言测试与基于计算机的语言测试的等效研究综述[J]. 外语界,2006(04)
[13] 田文燕. 国外计算机化语言测试(IBT)现状综述[J]. 外语界,2006(5)
[14] 田文燕. 从纸笔测试到计算机化语言测试的发展[J]. 湖北广播电视大学学报,2007(2)
[15] 田文燕,張震宇. 计算机化语言测试的应用问题与展望[J]. 外语电化教学,2007(4)
[16] 吴会芹. 用现代化手段辅助语言测试[J]. 外语电化教学,2006(109)
[17] 王勇旗. 计算机化语言——新测试形式带来的思考[J]. 学科改革,2008(05)
[18] 杨安良,田少华. 我国计算机化调适性语言测试(CALT)研究现状[J]. 外语界,2008(2)
[19] 应真箭,叶新东. 计算机适应性语言测试的几个问题[J]. 教学与管理,2005(6)
[20] 杨满珍. 20世纪90年代国外语言测试的发展[J]. 外语教学,2002(05)
[21] 杨琪. 计算机辅助大规模英语口语测试的实践与反思[J]. 外语电化教学,2012
[22] 朱音尔,张肖莹. 基于网络的大学英语机考探索与实践[J]. 外语电化教学,2009(126)
[23] 郑佩芸,史光孝,潘鸣武. 信息技术在语言测试中的应用现状及展望——计算机信息技术应用专题研讨会述评[J]. 外语电化教学,2010(131)