高风险语言测试负面后效产生的原因及对策
——以大学英语四级考试为例

2011-08-15 00:53王建梅

重庆理工大学学报(社会科学) 2011年1期

关键词：后效考试大学

王建梅

(重庆理工大学外国语学院,重庆 400054)

高风险语言测试负面后效产生的原因及对策
——以大学英语四级考试为例

王建梅

(重庆理工大学外国语学院,重庆 400054)

高风险语言测试负面后效产生的主要原因是测试目的不明确、测试目标和教学目标不一致、测试内容与实际语言运用不一致。测试开发者应通过准确定位高风险测试目的和使用范围,开发更多语言测试,提供多种选择等措施改善测试方法,减少高风险语言测试负面后效。同时,社会、政府、学校都应对测试后效的复杂性有充分认识,科学利用测试对教学的调控作用。

高风险语言测试;负面后效;大学英语四级考试;测试目标;教学目标

语言测试后效(the impact of language testing)指测试对教师和学生个体、教学政策、教学实践、教学体系以及社会等产生的影响[1]291。近年来,语言测试后效或反拨作用(washback)已成为语言测试研究中频繁使用的一词,并受到广泛重视。“语言测试工作者的研究重点逐步从提高测试信度和改进测试效度发展到关注测试的后效。”[2]语言测试后效研究主要有两种:传统的多项选择测试和大规模测试[3]2。测试后效对教学的影响有积极的一面,也有消极的一面。“一般来说,测试,特别是语言测试,常常因其对教学产生负面影响而广泛受到批评。”[3]12560多年前Vernon就发现,在教学活动中,教师容易忽视与通过考试关系不大的学习科目和活动[4]166。接着许多语言研究者指出测试对教学活动会产生负面效应[5-9]。并且,高风险语言测试对教学更易产生直接的、负面的后效[10]3;考试风险越大,教学就越可能受到负面影响,遭到扭曲[11]。因此,语言测试研究和使用必须充分考虑和尽可能减少测试的负面后效。然而,测试负面效应与测试质量并不是简单的单项对应关系。“一个不好的测试可能会产生好的后效,而一个好的测试由于教育系统的其它原因可能产生坏的后效。”[12]242语言测试的正面或负面后效,受到包括测试质量在内的多方面影响,如教育、社会、政治等多种因素。“近30年语言测试理论研究重要成果之一,就是认识到学生考试分数代表着复杂的多种因素影响。”[3]2

一、大学英语四级考试后效纵观

作为全球每年参考人数最多的大学英语四级考试发展迅速,考试规模从20世纪80年代末的十多万人发展到目前每年一千多万,已成为一个大规模、高风险的考试[13]。在22年间,大学英语四级考试从广为接受到备受争议,经历了一系列变化。一开始,人们普遍认为大学英语四级考试大大推动了我国大学英语教学,使学校、教育主管部门甚至社会对大学英语教育的重视程度普遍提高,各校英语教学条件、教学投入均有所改善,大学英语四级考试的正面效应凸显[14-17]。由于考试内容有听力、阅读、写作、语法结构多项内容,20世纪80年代末的大学英语教学也从过去只重视阅读逐步转向提高学生英语阅读、听力、写作等多种技能。20世纪90年代初,大学英语四级考试的负面效应逐渐显现,大多数高校存在英语应试教学,语言技能培养在很大程度上被题海训练所取代。大学英语四级考试开始受到各种批评,如试题中客观题比例大、题型单调、不能准确反映学生的语言运用能力等[18-20],四级考试改革的呼声也随之日益高涨。到20世纪90年代末及21世纪初,尽管大学英语四级考试中心采取了一系列的从考试内容、考试计分体制到成绩报告方式等多方面的改革,但各界对大学英语四级考试持批评意见的人越来越多,批评也日益深刻、尖锐[21-26],并且,关注焦点更多集中在测试的后效作用上。大学英语四级考试所带来的应试教学、学校和社会对考试成绩的不当使用、考试作弊等负面效应并没有随着考试改革得到有效改善。那么造成考试负面效应持续发展的主要原因是什么呢?

二、产生负面后效的原因

高风险语言测试的后效受到试题质量、教育体制、社会、政治等多方面因素的影响。因此,语言测试工作者应从试题设计开始就根据测试目的和测试对象准确选定测试内容,明确测试使用范围,尽可能避免或减少语言测试带来的负面效应。

(一)语言测试目的不明确

根据McNamara测试理论[27]23-33,一个语言测试从构思到实施的主要过程为:测试需求分析→测试受限分析→测试内容→测试方法→试测试→效度检测→改进测试→实施测试→(测试后效出现)。可以看出,语言测试的出现始于对该测试有需求,这个需求可能是教学需求也可能是社会需求。也就是说,设计一个测试,首先应该明确此测试的目的是什么,是用于检测教学内容情况还是检测学生学习水平;是用于某种门槛设置还是人才选拔。“测试的目的是整个测试设计、实施的基础,也是测试后效产生最直接、最主要的影响因素。”[28]78一旦由于教育、社会、政治等原因,测试目的扭曲,测试基石动摇,那么测试效度就减弱,测试的负面效应就会随之加强,此时的测试已经不再是设计初衷的测试。并且,当测试基石改变后,对测试内容、测试方法等接下来的各环节加以改革,都不会对测试性质产生根本性的改变,因为测试目的决定测试内容和方法,从而影响测试后效。可以说,测试的负面效应在很大程度上是由于测试本身属性造成的。从大学英语四级考试、托福和雅思考试分析可以看出测试目的对测试后效的决定性影响。

20多年前大学英语四级考试出现时,其测试目的是检测大学英语课程大纲执行和完成情况,即检查学生经过两年的学习是否达到了大纲的教学目标。考试中心至今仍声称大学英语四级考试的目的依然是这样:“大学英语目前仍是大学生的一门必修的基础课程,终结性的大规模考试依然是评价教学质量的重要手段之一。”[13]由考试设计之初的目的可以确定,四级考试应该是一标准参照考试(criteria-referenced test),“在一个标准参照考试中,学生的分数能清楚地说明该生运用现有语言能力所做到的和还不能做到的,并且能明确地反映该考生已经达到的水平。”[26]但四级考试的实施过程和成绩使用又是典型的常模参照考试(nor m-referenced test),“大学英语四、六级考试是依据‘教育测量技术’‘大规模’的常模参照考试。”[29]“大学英语四、六级考试的常模是1987年全国6所重点大学学生的四级考试成绩,在此基础上,每次考试后学生的原始分数通过分数等值处理后进行报告。”[15]常模参照考试的最大特点就是要将所有考生成绩进行比较,只有很少一部分人能达到优秀,大部分学生都处于中等及其以下的分数段。这就是说,大多数学生无论是否达到了教学大纲的要求,他们都会长期处于全国四级考试成绩“差”的群体中,成绩显示就是不合格。测试目的不明确,导致学校、社会和政府对四级测试分数的不当使用,即测试负面效应的加剧。

与四级考试相比较,全球另外两个大规模、高风险语言测试即托福(T OEFL)和雅思(IELTS)考试有明确目的。T OEFL,由美国教育测验服务社(ETS)在全世界举办,是一种针对母语非英语的人进行的英语水平的考试。大多数英语国家都将T OEFL考试成绩作为申请本科、硕士和博士入学的必备成绩之一。雅思是由英国文化委员会(The British Council)、剑桥大学地方考试委员会(CUCLES)和澳大利亚教育国际开发署( IDP Education Australia)共同举办的国际英语水平测试。此项考试是为申请赴英联邦国家(英国、澳大利亚、加拿大、新西兰等)留学、培训的非英语国家学生而设,用来评定考生运用英语的能力,即雅思是对所有外国学生进入英国大学学习的一种国际性的英语水平测试,是英国大学接收外国学生的一个语言标准。并且,根据考试对象和成绩使用目的不同,雅思又具体将考试分为“培训类”(general training)和“学术类”(academic)两种。

正是托福和雅思考试的目的非常明确,考试成绩被滥用的程度要小得多,对考生带来的负面影响也相对较小。“研究表明,雅思对课堂教学有积极的效应。”[30]当一个大规模、高风险测试结果使用不符合测试设立初衷时,测试委员会或测试设计者有责任和义务向公众澄清测试目的,明确限制测试使用范围,而不能一味地将测试负面效应推卸给成绩使用者或社会。

(二)测试目标和教学目标不一致

语言测试是语言教学中的一个重要组成部分,存在于教学各个环节,贯穿于教学始终。例如,在大学,当学生入校时,往往要对他们进行外语测试,以确定学生外语学习起点、学习内容和学习方法的选择;学习中也不断要进行测试,以检查教学状况、调整教学进度和内容;学期末还要进行语言测试以评价学生学习效果、发现教学中的问题。高风险语言测试同样也应服务于语言教学,各种语言测试的目标应该与教学目标相一致,否则,测试的负面效应必定会加大。同时,如果教学目标定位不符合社会实际需求,与之相对应的测试也一定会带来负面的社会效应。

测试目的与测试内容密切相关,而测试内容应参照各学校相关的人才培养目标所确定的知识和能力结构要求。只有这样,才能保证测试内容与人才培养目标、教学目标的一致性,使测试能够强化、促进教学目标和人才培养目标的实现,即起到积极的反拨作用。

如前文所述,大学英语四级测试的目的是检测各高校大学英语课程大纲执行和完成情况,即检查学生经过两年的学习是否达到了大纲的教学目标。然而,这一检测对象的设立存在问题。全国1 800多所高等院校使用同一个英语教学大纲,这本身就不科学、不合理。我国各地区经济发展不平衡,各高校的特点各异,办学目标不同,教学条件、教学资源、教学水平差异显著,怎么能用同一个教学大纲来统领全国大学英语教学?由此设计的全国大学英语四级统考必定会导致无意义的结果,“一流学校的大多数新生刚进校就能通过四级考试,而普通院校师生拼死拼活,到大四还是有37.6%的学生不能通过英语四级考试。”[31]因此,这样的测试会对很多学生带来非常大的消极的后效作用。

教育部已经意识到全国大学英语教学使用同一大纲的不合理性。2002年12月,教育部正式启动了《大学英语教学改革》工程,制定了新的《大学英语课程教学要求》,该教学要求分为一般要求、较高要求和更高要求,供不同院校根据本校实际选择。并且,教育部鼓励各高校制定个性化、特色化的大学英语教学大纲。张尧学提出:“国家重点大学应该逐渐转向不设公共英语基础课,学生入校后直接接受双语教学。”[32]近几年,有些院校已经开始打破传统的“大学英语”课程设置,减少大学英语教学学分,尝试比较灵活的学分制教学。与“大学英语教学要求”的改革不同,改革后的大学英语四级考试仍然没有考虑我国地区、教学资源、学生个体等的差异,只对教学结果进行统一评价。不同的教学大纲(教学要求)应该有不同的考试内容。那么,这种情况下的英语四级考试目标与哪种英语教学目标相一致呢?这样,四级考试的负面效应当然不可能降低。

(三)测试真实性不理想

真实性是任何语言测试必须考虑的重要因素,它会对社会、教育、考生心理等多方面带来影响。“语言测试中最复杂、最持久的问题就是如何处理好测试任务中的语言使用与日常语言交际中相应的语言使用之间的关系。毫无疑问,测试的语言使用和现实生活中的语言使用之间有密切关系。否则,语言测试不能反映任何我们所期望测量出的考生语言能力,语言测试仅成为一个不真实的幻影,一系列无果程序的进行。”[33]23

当然,测试和实际语言交际活动之间有差别,语言测试设计和实施中不可能完全实现测试真实性。事实上,“测试就是进行推断。即使语言测试完全模拟现实世界中的语言运用行为(如读报、听广播、谈话等),测试中的语言行为本身也无意义。我们只能由此推断出考生在其相应的真实世界中进行相似或相关的语言交际任务中表现如何。”[27]7-8测试真实性反映在某一测试任务特点和目标语言任务特点之间的符合程度。在设计一个语言测试时,首先要确定目标语言使用任务的主要特征,然后再据此设计或选择测试任务。真实性高的测试任务会尽可能多地包含重要目标语言任务,使测试结果能全面、正确地反映考生实际语言运用能力。参加这样的测试,学生就必须掌握更多现实生活中所需的多方面技能和知识。因此,测试真实性会直接影响学生学习范围及知识面。我国大学英语教学和大学英语四级测试的发展就是一个典型实例。20世纪80年代初,许多学校的大学英语测试不考听力,或听力占很小比重,结果是,尽管听力是语言学习中一项重要技能,在教学中却常常被忽视,有些学校根本没有听力课。自20世纪80年代末起,英语四级测试中听力比重逐渐加大,大学英语教学中听力训练开始被重视。测试的真实性不仅关系到学生学习内容,还影响学生的学习方法。如果测试内容范围与目标语言使用范围不相吻合,而测试结果又会对教师和学生带来较大影响(如高风险语言测试),那么,教师和学生就会采取各种应试策略(如题海战术)提高测试分数,把真正应该学习和掌握的教学内容和语言技能搁置一边,从而对教学产生较大副作用。

多年来,大学英语四级考试不断进行考试内容改革,但测试真实性方面并没有实质性改变。如更能反映学生真正语言运用能力的口语和写作部分20多年间没有什么变化。作为语言能力的重要标志之一,口语仍然是非必考部分。只有在四级考试的笔试成绩达到550分以上(满分为710分)者才有资格参加口语测试。全国只有少部分学生有此资格。作为一个“能全面考核学生语言运用能力”的、影响力很大的全国统考,将大部分学生拒口语考试门外,怎么能说这一考试的内容效度高?另外,写作部分多年来一直占考试总分的15%,且题型变化不大,虽然近几年作文题目更贴近学生生活,但写作体裁、要求、评分标准基本没有变化,题型单调、模式化。因此,八股文式的作文训练在实际教学中广泛使用,很多通过了四级,甚至通过了六级考试的学生连自己的英文简历都不会写。现代测试理论认为,一项有效的测试应做到语言测试行为和语言的实际情况相一致,以提高测试的真实性,改善测试后效作用。例如,雅思考试一直采用最直接的考试形式,最大程度地接近现实生活中的语言活动,取得良好的考试正面效应。雅思考试后效研究表明:考试对课堂教学和学习过程有着正面的影响,对教学起到了推动作用[30]。

三、解决途径

(一)明确定位高风险测试

“高风险测试指那些用来做出重大决定或会带来重要后果的测试”[11],测试风险越高,其可能产生的负面效应就越大。因此,高风险语言测试应该有非常明确地目的、性质和结果使用范围,避免对结果的滥用,从而有效减少语言测试负面效应。

如前文分析,从大学英语四级考试的目的来看,它是一个校标参照测试,检查学生是否达到希望的教学要求。但在测试实施和分数处理上采用的又是典型的常模参照考试。学校、教师、学生和社会都关注的是某考生的分数,在“常模”中的位置,而非自己是否达到大纲要求。考试中心关心的是考试的信度和区分度,追求漂亮的正态分布,要给学生排队,把优秀学生挑出,把大部分学生关在及格线外(每次四级考试的通过率在30%左右)[34]。这样的考试不可能以教学内容为参照,测出各校执行自己教学大纲的情况。因此,大学英语四级考试作为水平测试更恰当,这样可以减少四级考试与各校大学英语教学之间的冲突,学校和学生可以真正自由地选择是否参加四级考试或其它测试,学校也可以根据本校的人才培养目标和学生实际情况来进行大学英语教学。这样,中国的大学英语教学才可能出现百花齐放、百家争鸣、各具特色的良好局面。

(二)开发多种语言测试,提供多种选择

大规模、高风险语言测试,参考人数多,而考试结果又会对考生产生很大影响。但实际上,并不是所有考生的参考目的与考试本身意旨相同。学生参考是因为找不到其他可以证明其语言能力,同时又被广为认同的考试。如果有多种根据不同需求设计的高效度、高信度的语言测试,考生就可以根据自己的能力和需要选择所要参加的考试。社会、用人单位也可以根据各自的需求,选用符合自己目标的测试结果,从而分散某一高风险测试的社会权重,有效减小测试的负面效应。“考试的社会权重过大,常常是考试结果的误用和滥用造成的。”[2]23在英国有一部分学校不仅把雅思成绩作为评估语言的依据,也承认雅思和托福之外的替代考试的成绩。例如,华威英语语言测试(WELT)受到华威大学、埃克塞特大学在内的30所英国院校认可;牛津入学英语测试(OPT)和院校自行组织的内部测试也受到组织该考试的院校方认可。

目前,随着大学英语教学改革的推进,许多学校已在不同程度上对大学英语课程设置进行了改革,根据学习者的特定目的和特定需要而开设的英语综合、语言应用、专业英语等课程越来越多。在这种形势下,传统的大学英语四级考试显然不能满足所有学校英语教学和社会的需要。与大学英语教学改革相适应的大学英语考试,也应该拿出一系列菜单式的不同测试供学生甚至用人单位选择,使测试真正服务于教学,对教学产生积极影响。否则,大学英语四级考试实际上就变成了中国大学英语教学的一种垄断式测试。当一个事物成为垄断时,其负面效应就会变大。测试的决策者和设计者应对测试负面效应负主要责任,解决方法之一是开发多种能满足不同需求的测试,供考生和成绩使用者选择。

(三)科学认识测试,减少管理部门操控

“管理部门和政治家们应该对测试后效的性质负责,因为测试常常被用来实施教育革新,引导和控制教学大纲的执行。测试常简单的用作改革的杠杆。”[35]语言测试的主要功能之一,是通过采用“好的”测试,推动自上而下的教育改革方案[36-37]。世界许多政策制定者都意识到测试的能量,利用测试来实施当地的教育改革,强行推行新教材、新的教学模式和教学方法。“测试是政策制定者的最爱。”[38]尽管高风险语言测试能够帮助推动教学改革,但这种考试驱动教育改革有很大的局限性。“在教育中,通过引入一个新的语言测试作为命令式、义务式的测量方法,很容易产生不想看到的结果。”[39]并且,Shepard指出,这种做法剥夺了大多数教师的权利[40]27;甚至是制定政策的一种不道德、不民主的举措[41]11。如果测试改革、教学改革没有得到执行者(教师和学生)的认同,而是自上而下的强制性执行,许多教师就会反感,消极参与。这也是为什么测试往往只能影响教师教授的内容,而对教学方法改革没有多大作用。测试不会影响教师关于教学、教师和学生角色、教学方法等根本性的观念[42-43]。国内外语言测试后效研究都有此例,香港中学会考(HKCEE)曾试图通过考试后效自上而下地影响英语教学,18年的历史证明,考试很快改变了教学内容,但对教师如何教、学生如何学只有表面上的变化,没有实质性的改变。“试图用测试后效正面影响课程改变的过程是非常缓慢的,并没有实现测试的意图。”[3]41-43在北美、英国、澳大利亚等地的研究表明,权利强制,不能产生长效的、持久的变革[44]64。

中国大学英语四级考试的产生、改革,在很大程度上也是由政府机构来决定。全国高等教育那么多科目,为什么只对大学英语一门课的学习效果采取统考形式检查?没有官方的行政命令,其他任何一个机构都不可能做到,但行政管理者也应该了解语言学习、语言测试的特点,特别应把握好测试作为推动教学改革杠杆作用的局限性,因为大规模、高风险语言测试的后效常常不能与测试设计意图一致。同时,我们应充分研究和借鉴国内外语言测试后效研究成果,正确认识语言学习、语言测试的特点,科学指导我国大学英语教学工作。

大规模、高风险语言测试对学生、教师、学校、社会等多方面都会产生积极和消极后效,而且,负面效应往往更突出。因此,测试开发者应该在测试设计和实施的每一环节都要考虑测试可能产生的后效作用。首先,必须明确测试目的和使用范围。当测试使用范围改变,测试的目的就发生了变化,即测试设立的初衷改变,此时,试图改变测试内容来改善测试后效作用将无济于事。其次,测试内容要与教学目标相一致,要与语言实际应用相吻合。否则,高风险测试很容易成为管理者通过测试来操控语言教学的工具。在这种情况下,管理者试图通过测试推进教学改革、改进教学质量的良好愿望就很难实现。我国大学英语四级考试在22年间的经历证明,使用大规模、高风险语言测试主导教学,推动教学改革不一定有效。努力开发多种测试目的明确、满足教学和市场需求的高信度、高效度的测试,是降低测试负面效应的有效方法。同时,社会、政府、学校都应对测试后效的复杂性有充分认识,科学利用测试对教学的调控作用。

[1]Wall D. Impact and washback in language testing[C]. Dordrecht:Klower Academic.Language testing and assess ment,1997(7):291-302.

[2]杨惠中,杜诗春.语言测试的社会学思考[J].现代外语,2007(4):368-374.

[3]ChengL,Watanabe Y,Curtis A.Washback in Language Testing[M].London:Lawerece Erlbaum Associates, Inc.2004.

[4]Vernon P E.The measurement of abilities[M].2nded. London:University ofLondon Press,1956:166.

[5]W iseman S.Examinations and English education[M]. Manchester.England:ManchesterUniversityPress,1961.

[6]DaviesA.Language testing symposium:A psycholinguistic approach.[M].Oxford:Oxford University Press,1968.

[7]McEwen N.Educational accountability in Alberta[J]. Canadian Journal of Education,1995(20):27-44.

[8]Fish J.Responses to mandated standardized testing[M]. Unpublished doctoral dissertation.University of California,LosAngeles,1988.

[9]Alderson J C,Wall D.Does washback exist?[J].Applied Linguistics,1993(14):115-129.

[10]Noble A J,SmithM L.Measurement-driven reform:Research on policy,practice,repercussion[Z].Arizona State University,Center for the Study of Evaluation, 1994:3.

[11]Madaus G G.1988.The influence of testingon the curriculum[C]//Tanner,L.N.ed.Critical Issues in Curriculum:Eighty-seventh Yearbook of the National Society for the Study of Education.Chicago:University of Chicago Press,1990.

[12]Messick S.Validity and washback in language testing [J].Language Testing,1996(13):241-256.

[13]金艳.提高考试效度改进考试后效[J].外语界,2006 (6):65-73.

[14]杨惠中.从四、六级考试看我国大学生当前的实际英语能力[J].外语界,2000(1):47-53.

[15]杨惠中,金艳.大学英语四、六级考试分数解释[J].外语界,2001(1):63-69.

[16]陈祖芳.学术讨论要尊重事实——就四、六级考试问题与刘润清先生商榷[J].外语界,2004(1):76-79.

[17]吴启迪.教育部2005年第二次新闻发布会[EB/OL]. [2005-02-25].http://www.moe.edu.cn/edoas/website18/info8745

[18]刘新民.对四、六级英语统考作文的几点思考[J].外语教学与研究,1991(3):73-75.

[19]黄忠廉,刘丽芬,倪传斌.CET-4新增翻译题型的调查与分析[J].外语教学与研究,1996(3):61-65.

[20]叶国强,赵锦.改进大学英语四、六级考试题型和体系的设想[J].外语教学与研究,1999(4):61-64.

[21]吕良.CET的反拨效应对外语教学的影响[J].山东外语教学,1995(4):68-71.

[22]井升华.我国大学英语教学费时低效的原因[J].外语教学与研究,1999(1):22-24.

[23]牛强.现行高校英语测试中的问题[J].外语教学与研究,2001(2):140-143.

[24]刘润清.高校英语教学改革笔谈之三[J].外语教学与研究,2003(5):378.

[25]张尧学.关于大学本科公共英语教学改革的再思考[J].中国大学教学,2003(7):1-4.

[26]韩宝成,戴曼纯,杨莉芳.从一项调查看大学英语考试存在的问题[J].外语与外语教学,2004(2):17-23.

[27]McNamara T.Language Testing[M].Oxford:Oxford U-niversity Press,2000.

[28]Bachman L F.Fundamental Consideration in Language Testing[M].Oxford:Oxford University Press,1990:78.

[29]杨惠中,C.Weir.大学英语四、六级考试效度研究[M].上海:上海外语教育出版社,1998.

[30]Charge N.IELTS[R].ALA,Wisconsin.2005-07-29.

[31]杨惠中.大学英语四、六级考试十五年回顾[J].外国语,2003(3):76-82.

[32]张尧学.加强实用性英语教学提高大学生英语综合能力[J].中国高等教育,2002(8):3-8.

[33]Bachman L F,Adrian S P.Language Testing in Practice [M].Oxford:Oxford University Press,1996.

[34]蔡基刚.转型时期的我国大学英语教学特征和对策研究[J].外语教学与研究,2007(1):27-32.

[35]D Chamberiain,Baumgardner,ed.ESP in the classroom:practice and evaluation[M].London:Modern English,1988:98-107.

[36]JamesM.Measured lives:The rise of assess ment as the engine of change in English schools[J].Curriculum Journal,2000(11):343-364.

[37]Linn R L.Assess ments and accountability[J].Educational Researcher,2000,29(2):4-16.

[38]Madaus G G.Public policy and the testing profession: You’ve never had it so good[J].Education measurement Issues and Practice,1985,4(4):5-11.

[39]ChengL,Couture J C.Teachers’work in the global culture of performance[J].Alberta Journal of Educational Research,2000,46(1):65-74.

[40]Shepard L A.Interview on assess ment issues with Lorrie Shepard[J].Educational Researcher,1991,20(2):21 -27.

[41]Shohamy E.Using language tests for upgrading knowledge [J].Hong Kong Journal of Applied Linguistics,2000,5 (1):1-18.

[42]ChengL.How does washback influence teaching? Implications for Hong Kong[J].Language and Education, 1997(11):38-54.

[43]Cheng L.Changing assess ment:Washback on teacher perspectives and actions[J].Teaching and Teacher Education,1999(15):253-271.

[44]Markee N.Managing curricular innovation[M].Cambridge,England:Cambridge University Press,1997:64.

(责任编辑魏艳君)

The Causes of the Negative Impact of High-stakesLanguage Testing and the Countermeasures——Taking CET-4 as an Example

WANG Jian-mei

(School of Foreign Languages,ChongqingUniversity of Technology,Chongqing 400054,China)

Taking College English TestBand 4(CET-4)as example,this paper probes into the main causes of the negative impact of high-stakes language testing.It is believed that the ambiguous objective of language testing,the contradiction between test objective and teaching objective,and the inconsistency of test contents and practical language use contribute most to the negative impact of testing.Instead of shirking the responsibility and shifting the blame onto the school and society,test developers can do a lot to reduce the negative impact by explicating the aim and limitation of the test, developing various reliable and validating language tests in accordance with the requirements and students and society.Meanwhile,the government,society and school should be well aware of the complexity of testing impact,and make use of language testing as a leverwith care and scientific mind.

high-stakes language testing;negative impact;CET-4;testing objective;teaching objective

G642.47

1674-8425(2011)01-0116-06

2010-07-15

王建梅(1964—),女,山西太原人,教授,研究方向:外语教学与测试、二语习得。

高风险语言测试负面后效产生的原因及对策——以大学英语四级考试为例

一、大学英语四级考试后效纵观

二、产生负面后效的原因

(一)语言测试目的不明确

(二)测试目标和教学目标不一致

(三)测试真实性不理想

三、解决途径

(一)明确定位高风险测试

(二)开发多种语言测试,提供多种选择

(三)科学认识测试,减少管理部门操控

高风险语言测试负面后效产生的原因及对策
——以大学英语四级考试为例