朱 晗 刘 娟 宋媛媛
x
摘要:为了展望多项选择题这一颇有争议考题的发展前景,运用历史分析的方法,从多项选择题历史演变入手,在论述有关英语多项选择题早期使用及研究的基础上,对近年来多项选择题的利弊进行了评述,同时探测多项选择题与其他理论的近期交叉研究。
关键词:多项选择题;历史演变;发展前景
中图分类号:H310.4文献标识码:A文章编号:1000-2731(2009)04-0156-04
一、多项选择题的历史演变
多项选择题始于心理测试(mental testing)。心理测试是心理学中用来测量人类认知能力的手段,1904年由法国医生Binet在确认智力发育迟缓、需接受特殊教育的儿童时最先使用。1917年,美国参战时,心理学家Robert M.Yerkes受命对100多万美军新兵进行心理测试,以排除其中心理素质不宜战争的人。迫于新兵人数庞大,时间、人力、物力缺乏。Yerkes采用了客观评分成组测试法(objectively scoring group test),开创了大规模客观心理测试的先河。这是最早使用多项选择题的心理测试之一,在公众中产生了巨大影响。同时,在现代统计学奠基人Francis Galton提出的正态分布学说的基础上,相关分析、因子分析等一整套精巧周密的统计方法也逐步完善,从而为开发、分析、评价这类测试提供了方法和标准[1][2]。
19世纪20年代初,以多项选择题和是非题为代表的客观性测试开始在美国教育界包括语言学科中使用,并迅速获得承认;20世纪30年代,心理计量学的发展进一步促进了客观性测试手段的应用;到了20世纪50年代,客观性语言测试已在美国教育性语言测试中占主导地位;在20世纪60年代,许多结构主义语言学家和教育心理学家开始研究语言测试的模式,并采用测量学的方法计算测试的信度、效度。以美国的罗伯特拉多(Robert Lado)为代表的结构主义语言学家们非常注重客观性测试,他们认为语言是一个独立的体系,语言学习应分三个阶段,因而每一次测试只能测量语言的一个部分(语音、词汇、语法和搭配等)[3]。在这种背景下,多项选择题应运而生并迅速发展。1954年,多项选择题成为由美国大学入学考试委员会(College Board)主办的所有语言测试的惟一使用题型。并在1965年达到顶峰,最突出的代表就是针对外国人的英语语言测试——TOEFL(托福)考试,这标志着以心理计量学为基础的客观考试的完全成熟。随着交际测试的崛起,从20世纪80年代开始,多项选择题在交际测试中渐成主流。
20世纪80年代后期,多项选择题引人中国,并广泛应用于各种大规模考试之中,为中国测试界送来一股暖风。如1988年英语高考、1987年、1989年的大学英语四、六级考试中多项选择题均占总分的80%以上。如今,在考试改革的浪潮中,多项选择题仍在各大规模的考试中被广泛使用。
二、多项选择题的利弊分析
语言测试,特别是标准化考试的目的就是测量人们的“实际语言能力”。但是随着语言测试的逐渐发展,许多学者开始质疑现行的语言测试是否能够测量人们的“实际语言能力”,多项选择题最受争议,这也成为近年来学者们研究的焦点。人们在肯定其科学性、客观性、高信度的同时,也有刘润清、潘之欣等学者认为,英语多项选择题脱离语境,忽略了语言实际运用能力的考核[4][5]。
(一)多项选择题的优点
多项选择题自出现至今,在世界范围内广为使用。多项选择题之所以能在语言测试中占有如此重要的地位,是因为其无可比拟的优点。张新元[6]、刘艳[7]、贾敏[8]、汤艳[9]、李丹[10]。伽等学者对多项选择题的优点进行广泛研究,具体归纳如下:(1)阅卷评分方便。一是在考试中,考生只需写一些简单的符号(如ABCD),或在答题纸上把符号涂黑,因而简化了阅卷工作;二是,由于多项选择题的答案事先已经达成一致,这样评分不需要评分人的主观判断,不再需要高纯度的脑力劳动,评分可由非专业人员,甚至计算机完成,实现完全机械化,其过程比其他题型更简单、迅速、经济,这也正是它适应大规模考试的原因之一。(2)测试信度、效度高。效度是指试卷与测试目标一致的程度。从它产生的理论依据上看,多项选择题采取一题一考点的方式,每道题只测试一个语言点,非常有针对性。教师可以及时准确地了解学生的掌握情况和教师的教学效果,测试的效度较高。信度是指测试测量结果的一致性、可靠性。考生在回答多项选择题时,只需在答卷上书写符号或在答题卡上将符号涂黑,比自行书写答案耗费时间要少很多。所以在有时间限制的情况下,多项选择题可以测试更多数量的试题,覆盖更多的语言点,如语音、词汇、语法、阅读理解和完形填空等,测试抽样量较大,测试内容覆盖面较广,意味着测试的信度较高,即考试结果的可靠性和稳定性相对较高。(3)形式灵活,成卷方便,使用范围广。多项选择题的选项数量、答案数量、提问方法等都可随意改变,选项还可采用非文字的图画、符号、表格等,表述生动。每一个多项选择题设计出来后,基本上彼此是独立的,因而设计者可依据需要进行编排。此外,这种灵活性让多选题的应用远远超出语言测试的范围,如今,多选题被应用到各个学科,足见其实用性。
(二)多项选择题的弊端
多项选择题在实践中日益发展,但仍有许多不足之处。这也正是它在各种考试整张试卷中所占的比例逐渐下降的原因,像如今的高考、改革后的大学英语四、六级考试及研究生入学考试。过去,多项选择题所占比例为80%,如今均不同比例下降到了40%~50%,这是由于:(1)多项选择题不符合心理学和第二语言习得的原则。第一,语言测试和心理因素密不可分。无论是对于被试、测试者或阅卷者,多项选择题含机械的因素多。例如,同样的一个语言点出现在选择题里,学生在做题时一错再错的事例司空见惯,就是因为缺乏“运用”这个重要环节。第二,根据语言测验的三大理论基础:语言学和语言能力理论、语言习得和语言教学理论、测量学理论。在测试中不可忽视对语言习得的考核,而习得与日常的实践分不开,实践能力只有通过主观题型的测试才可全面测出。第三,要重新思考这个问题:多项选择题用在母语的测试中和用在外语或第二语言或目的语的测试中,其作用是有差异的。因为母语和目的语最大的差异就在于运用该语言的熟练程度。如果用一份多项选择题的试卷来同时测试母语和目的语,且分数差异不大,那么是否可得出这样的结论:母语和目的语水平相当,这显然是不行的。可见,多项选择题尤其不符合第二语言习得的规律,不能有效地达到自然运用目的语的最终目的。(2)多项选择题不能综合、全面测出一个人实际运用语言交际的能力。首先,听、说、读、写四大技能在教学中
是可分立的,但是在测试时应综合测试一个人的语言的总体能力和水平,这在某种程度上是因为人们把“教学者”和“学习者”各自认为的重点混为一谈。从外语或第二语言“教”的角度看,听、说、读、写四大技能应分别教授,但是从学习者的角度看,应是一个语言整体。多项选择题一般测的是语言点,不是语言的整体或一个面,因而有局限性。其次,从多项选择题诞生的原因分析,主要是为了解决评卷中的公平、公正和省时省力的矛盾。最后,由于多项选择题属于分立式测试,从其特点看,只是检查学生对语言项目的掌握,不检查学生综合运用语言的能力。测试中大量使用测试识别(recognition)能力的项目.不是测试产出(production)能力的项目,不能全面测出被试者真实的语言能力。
(三)多项选择题利弊研究的启示
通过以上研究综述,我们可以看出:多项选择题利、弊的研究已经十分全面、客观、透彻,这对语言测试的发展有着积极的实践指导意义。多项选择题弊大于利,在理论上是不可取的,但由于目前没有更好的题型能取代多项选择题,以适应大规模的考试,所以多项选择题仍有其应用的价值。另外,针对多项选择题的弊端,一些克服的措施已被提出,而且许多已被应用到目前一些考试中。首先,增加答案选项,适当减少多项选择题的数量等,并使其内容更加丰富。在选材上,尽量选用原版的英文读物和英语对话,像小说节选、报纸摘录、电影对白等,让学生尽可能接触到地道的英语。其次,增加新题型。如主客观相结合的题型。再次,在设计多项选择题的时候要严格遵守出题原则,如李筱菊教授在其著作《语言测试的科学艺术》中提到的九个原则[11],教师应自始至终把握测试的过程,包括题目编写、题目排列、施考、阅卷评分和总结分析。最后,多项选择题应结合新的研究理论,使其克服不能测试语言实际运用能力的弊端。
三、多项选择题的发展前景
结构主义理论认为:语言成分存在于四种语言使用模式中,即听、说、读、写四种技能。因此,在结构主义测试中,语言能力就是对语言形式的系统掌握,包括各语言成分和四大技能,考试方法可采用相应的分散技能客观测试(discrete point separate skill objective testing)方法。目前的TOEFL考试就采用这种形式,改革后的托福考试采用网考形式,对听、说、读、写能力分别进行考核。
有些人认为:多项选择题无非就是一个题干与若干题支的罗列,这是对其极大的误解。实际上,多项选择题的命题工作是一项专业性极强的工作,具有命题难度大、周期长的特点。在实际使用之前,每道题都要经过命题、审题、试测、电脑系统分析、复审以及定卷等漫长而复杂的过程。惟有如此,才能使其更准确地反映出应试者的真实能力。
不难想象,一套只有主观测试的大规模考试,其可行性、信度都会很低。况且在我国目前高校英语教学中,全部采用主观测试也难以顺利进行。抛开主观测试不一定能全面、客观地反映应试者的语言能力,就目前我国在校师生比(约1:130)而言,如果大学英语测试采用主观测试题,那么我们的教师们只能整日埋头于阅卷工作之中,而根本没有时间去钻研教学方法,更别提进行科研工作。
另外,目前多项选择题测试方法已经有了一套完善的统计分析手段,如项目分析(item analysis)、分数等值(score equating)处理、题库(item banking)建设等,而其他测试则暂时还缺乏这些分析手段。这都说明其具有较强的可行性。
对多项选择题之研究,今后应多关注其他理论与多项选择题的交叉研究,具体体现为:(1)语篇衔接与英语多项选择题。语篇是指真实的人在真实场景中使用的语言。Halliday and Hasan认为:语篇是语义单位,即语篇不是形式单位,而是语言运用的基本单位。语篇分析的目的是“解释”,即揭示语言运用的基本规律。语言测试,特别是标准化考试的目的就是测量人们的“实际语言能力”[12],即测试人们利用语言运用的基本规律来理解及建构连贯语篇的能力。正是在这点上,我们能找到语篇分析和语言测试的结合点。语篇衔接理论在英语多项选择题设计中的运用,扩大了多项选择题设计的语境——由句子扩大到语篇层次,这更接近使用中的语言。因此,更能准确地测试出考生“运用语言的能力”,从而更接近语言考试的目标。从这种意义上看,其测试效度更高。(2)关联理论与英语多项选择题。关联理论是关于人类交际的理论,它关注的中心问题是交际和认知,它的核心内容是关联性和两条关联原则。这两条关联原则是:关联的认知原则——人类认知倾向于同最大程度的关联性相吻合;关联交际原则——每个话语(或推理交际的其他行为)都应设想为话语或行为本身具备最佳的关联性。很多人认为多项选择题无法测试表达型的语言技能,不能测试学生的交际能力。如果把关联理论运用于多项选择题测试可推动对学生语言交际能力的测试,使之逐步完善。在多项选择完形测试这一题型中,应试者作答的过程就是一种言语交际活动,命题人和语篇作者是交际者,应试者则是交际对象。关联理论能够解释这种交际活动中交际双方的认知心理过程。命题人假定应试者有足够的认知能力、也愿意付出努力去回答所有问题,应试者利用语篇和选项等语境线索构建理解语篇的认知语境,通过选择和推理,寻找符合语境的最佳选项。如此,使得英语多项选择题能更有效地测出学生的英语语言能力。
四、结论
多项选择题是英语教学活动中经常使用的一种测试方式。但是,目前社会上对其批评之声不绝于耳,我们应保持清醒认识,理性地看待多项选择题在英语教学中的反拨作用,认识其在当今语言测试方面无法替代的地位与作用。
当然,在目前存在两派论争的形势下,多项选择题将走向何方,这是我们应认真思考并积极应对的重大课题。反对者告诉我们,多项选择题在某些方面还存在不可忽视的缺陷,应不断地改进和完善,使其能全面测量出应试者的真实语言能力。不过我们还应意识到,多项选择题这一客观测试方式极大地推动了大学英语教学的发展,开发了学生思考和解决问题的能力;同时,客观测试能够通过提供教学反馈信息,从而进一步发现问题、解决问题,对英语教学的发展与中国民众的英语总体水平提高具有不可忽视的作用。因此,在目前尚无更为理想的测试方法的情况下,多项选择题仍为不可或缺的一种语言测试手段,特别是在像中国这样一个考试人口大国。
参考文献:
[1]BAKER O. Language Testing [ M ]. London: Edward Ar-nold, 1989:29-35.
[2]SPOLSKY B. Measured Words[M]. Oxford: OUP, 199.5:25-26.
[3]ROBERT L. Language Testing [M]. London: Longmans,Green and Co Ltd..1961:20-42.
[4]刘润清.语言测试和它的方法[M].北京:外语教学与研究出版社。2001:21-22.
[5]潘之欣.语言测试中的多项选择题型[J].外语界,2001,(4):67-68.
[6]张新元.大学英语测试质疑述评[J].外语界,2004,(2):67-69.
[7]刘艳.从大学英语四级考试改革看多项选择题的利弊
[J].广东技术师范学院学报,2006,(2):116-117.
[8]覃敏.英语测试中的多项选择题[J].成都教育学院学报,2005,(9):115-116.
[9]汤艳.从外语教学方法的变革看外语测试方法的变革[J].浙江海洋学院学报:人文科学版,2002,(6):74-77.
[10]李丹.多项选择题在英语测试中的应用研究[J].教育与职业,2006,(11):135-136.
[11]李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,1997:202-272.
[12]杨惠中,WEIR C.大学英语四、六级考试效度研究[M].上海:上海外语教育出版社,1998:122.