乔淑霞
(重庆三峡学院外国语学院,重庆万州 404100)
教育界把测试对教学和学习的影响称为反拨效应(washback effect)。后来,这一概念被运用到应用语言学领域,特指语言测试,尤其是外语测试对相应的教学和学习产生的影响。尽管早在18世纪人们就已经关注到了测试的影响,但对这种影响进行大量而深入的研究却是20世纪80年代以后。[1-7]Buck[8]曾这样评论反拨效应,为了适应测试的要求,教师和学生会调整他们的课堂活动,尤其是当某个测试涉及到升学率或者学生的前途时,测试对课堂教学的反拨作用是非常大的,因此测试的反拨效应可能是有益的或有害的;Hughes[1]提出了反拨的基本运作模式,这个模式有三个因素组成:参与者、行为和过程;Alderson & Wall[2]率先对反拨效应进行了比较全面和深入的探讨,提出了15个反拨效应假设,为这一领域的实证研究奠定了一定的基础;Cheng[6]则对香港英语证书考试对教学的影响进行了研究。随着研究的深入,人们越来越认识到反拨效应的复杂性。测试的巨大影响及反拨效应的复杂性使反拨效应研究变得尤为重要。测试的正面反拨效应是指测试对教学产生人们所期望的影响,而负面效应是“某一被认为‘质量差’的考试对教学产生的不利影响。”[2]因此测试的合理设计与实施对实现教学目标和提高教学质量有着重要作用,也就是发挥正面反拨效应。而目前大多数高校英语教师在设计英语测试时,“命题中存在着很大的盲目性”“大多数考试往往遵循着老模式……老师命题时常常是利用手头现有的资料……”。[9]这样的考试自然难以对教学产生良好的反拨作用。本文以反拨效应研究专家对提高正面反拨效应途径的理论阐述为基础,着重探讨如何在设计英语测试时保证测试质量,从而提高正面反拨效应,进而使教学和测试形成良性的互动。
如前所述,测试的反拨效应可以是正面的,也可能是负面的。进行反拨效应研究的重要任务之一就是探索减少负面效应,扩大正面效应的途径和因素。就如何扩大正面反拨效应,一些专家提出了自己的看法。
Hughes[1]提出要提高正面反拨效应应注意七个方面:第一,测试要以培养学生的能力为目的;第二,使用那些能检验出被试真正能力的测试,而不使用那些满是选择题的测试;第三,要使用丰富广泛且不易预测的测验材料,以防教师为了备考去押题;第四,使用尺度参照考试,而不使用标准参照考试;第五,成就测试要以教学大纲为基础;第六,要保证测试的形式、内容和目的能够被教师和学生理解;第七,测试的开发者在必要时向教师提供一些所需的帮助。不难看出,这七条建议中有五条与测试效度相关,因为测试效度的高低取决于测试的正面反拨效应的大小。换言之,提高测试效度与提高正面反拨效应是相互依存的关系。Brown[7]指出要提高测试的正面反拨效应,测试的参与者应对测试的设计、测试的内容、测试的施考及测试结果的解释等方面给予充分考虑。Brown所说的这几个方面,分别涉及测试的其他质量因子,如互动性、内容效度、可操作性。Bailey[4]认为提高测试质量就是提高正面反拨效应。
尽管以上专家对提高反拨效应途径的观点各有侧重,但都认为判断一个测试是否发挥了正面效应主要依赖考试质量。正如 Heaton[10](16)所说:“如果考试质量好,那么它就会对教学产生正面影响;如果考试质量差,那么它就会对教学产生负面影响。”而影响考试质量的因素主要有信度、内容效度、结构效度、真实性,因此,在设计英语测试时应对这几个方面给予重视,从而最大限度地发挥测试的正面反拨效应。
从以上的论述可以看出,测试质量的高低关乎正面反拨效应的大小。因此,我们在进行英语测试设计时,应着力考虑以下几个方面:
信度指的是考试结果的一致性,即同一组受试者在同样的两次考试中排名顺序是一致的。如果考试结果不稳定,就不能真实地反馈受试者的能力。而潜在的影响信度的因素,Bachman & Palmer[3](139-140)认为,主要存在于测试的指导语、测试语言馈入性质、测试预期回答性质以及馈入与回答的关系等几个方面。比如,某一受试者参加两次同样的考试,一个考试的指导语长,而另一个考试的指导语短,这就会导致该考生的考试表现不一样,考试结果有变化。
内容效度指“一测量工具内容上的代表性或所选样本的充分性。”[11](38)简言之,考试内容应参照教学内容和大纲对考生的知识和能力进行抽样。“考生所掌握的语言知识和具备的能力是多方面的,不可能通过一次测试全面考察,而只能抽取一定量的样本,从中推断考生的能力。样本必须具有代表性,即能通过部分内容的考查,全面、真实地反映考生的整体水平和能力。”[14]就英语测试来说,无论是大学英语,还是专业英语,都须参照有关的教学大纲。教学大纲往往对知识和能力进行了分解,提出了明确的要求,对各知识点和能力构成要素也进行了详尽的说明。因此,对具体测试内容的抽样应充分体现这些要求,同时也要注意知识点和能力构成要素的合理安排。否则,就会对教学和学习产生错误的导向,即负面反拨作用。例如,在考查学生的阅读理解能力时,由于种种原因,题目过多的集中在某一、二项技能上,而忽视对其他技能的考查。如果这样的测试内容反复出现,就会对学生和教师产生误导作用。所以,要使测试真正地对教学产生良好的反拨作用,必须要保障其内容效度。
“结构效度指的是语言能力理论中假设的基础能力或特征”,[1](26)如听力能力、阅读能力、写作能力和口语能力就是典型的理论能力结构。如果一个考试表明能够测量某个理论结构,它就具有结构效度。换言之,一个考试如能测量出考生的听力、阅读或者写作能力,那么这个考试就具有结构效度。结构效度与考分的解释功能有关,如写作能力考试的分数能否解释学生的写作能力。不难看出,要使一个考试具有结构效度,考试方式的选择非常重要。外语教学最终要培养的是实际语言运用能力,而考试方式的选择应能强化和促进这种能力的培养,即它们要具有正面反拨效应。例如,要测试学生的写作能力,最简单的,也是最直接的方法就是让学生写一篇作文,因为学生在完成作文的过程中必须运用他们的写作能力。“如果采用间接考试、分离式考试(多项选择题)来考察写作能力,势必会导致消极的反驳作用,长此以往,教师和学生都不会对实际写作能力的培养给予足够的重视,而是会花很多时间去做多项选择题。”[14]
当然,具体考试方式的选择还需考虑其他一些因素。如直接考试便于考查被试的实际语言运用能力,但阅卷过程中就需要投入大量的人力和物力,不够经济。因此,在具体操作中,既力求保证测试的积极反拨作用,又要根据具体情况,兼顾其他因素。
测试的真实性是指被试在测试中使用目的语完成测试任务与其在现实生活中使用语言进行交际活动的相似程度。可以说,真实性在口语测试中体现得最为充分。正如Doye[12]所说,具有真实性的测试才能检验学生应对真实生活的语言能力。因此在英语测试设计时,务必要保证其具有真实性,使其具有较高的反拨作用,从而积极影响外语教学,激发学生的学习动力。当今语言测试界有两种方法来实现考试的真实性:一种是从形式上尽可能对应目的语国家的真实生活状况;另一种是要考虑确定成功的语言交际所需的能力的特性,以及那些决定语言使用者和背景、对话互动关系的情境特性。前者被Bachman[13](301)称为“现实生活法”,后者为“交际/能力法”。两种方法各有所长。现实生活法侧重考试的表面效度、预测效度和内容效度;交际/能力法侧重考试的结构效度。确定哪一种方法要考虑各种因素,如考试目的、考试用途、考生人数、考官人数、考试时间以及考试场地等。如果一个班有10名学生,可用的考试时间为两个小时,考官有两位教师,这时可以考虑采用现实生活法,考试形式可以是情景对话或小组讨论;如果学生较多,考官只有教师本人的话,则考虑采用交际/能力法,运用录音口试的形式。
“语言测试对教学及整个教育体系的潜在影响是不容置疑的。因此,测试的设计开发者必须高度重视测试对教学和学习的‘反拨作用’、从理论和实践的角度对其进行充分的研究,使测试产生积极的影响”[14]。在设计英语测试时,首先要明确考试的性质和目的,其次要从考试的内容、考试方式、真实性等方面预测其对教学和学习可能会产生的影响,同时要对这些影响加以权衡,努力提高正面反拨效应。
[1] Hughes, A. Testing for Language Teachers [M]. Cambridge: Cambridge University Press, 1989.
[2] Alderson, C & D. Wall. Does washback exist? [J]. Applied Linguistics, 1993, (14/2): 115-129.
[3] Bachman, L. F & A. S. Palmer. Language Testing in Practice [M]. Oxford: Oxford University Press, 1996.
[4] Bailey, K. M. Working for washback: A review of the washback concept in Language testing [J]. Language Testing, 1996, (13/3): 257-279.
[5] Wall, D.Introducing new tests into traditional systems: Insights from general education and from innovation theory [J]. Language Testing, 1996, (13/3): 334-354.
[6] Cheng, L. How does washback influence teaching? Implications for Hong Kong [J]. Language and Education, 1997(11/1): 38-54.
[7] Brown, J. D. University Entrance Examinations: Strategies for creating positive washback on English Language teaching in Japan [J]. Shiken: JALT Testing & Examination SIG Newsletter, 2000, (3/2): 4-8.
[8] Buck, G. Testing listening comprehension in Japanese university entrance exams[J]. JALT Journal, 1988, (10): 15-42.
[9]江澜,冯晓媛.对教师自行设计的英语考试内容效度和表面效度的调查和反思[J].外语教学,2003(5).
[10] Heaton, J. B. Classroom Testing [M]. Harlow: Longman, 1990.
[11]邹申,杨任明.简明英语测试教程[M].北京:高等教育出版社,2005.
[12] Doye, P. Authenticity in Foreign Language Testing [J]. Current Developments in Language Testing, 1991, (25):103-110.
[13] Bachman, L. F. Fundamental Considerations in Language Testing [M]. Oxford: Oxford University Press, 1990.
[14]李绍山.语言测试的反拨作用与语言测试设计[J].外语界,2005(1).