时唯皓
(西安外国语大学英文学院 陕西 西安 710128)
过去,二语习得和语言测试被认为是应用语言学领域的两个不同学科。但自20世纪80年代以来,越来越多的人开始研究二者之间的共性,即二者之间的接口问题研究。二语习得研究的重点侧重于学习者如何习得第二语言以及第二语言自身的发展。但语言测试不再是对学习者语言能力发展过程的研究,而是对学习者学习语言结果的研究。语言测试和第二语言习得属于同一个领域,即语言学习。他们有着相似的目标——理解语言学习过程,评估语言学习过程,并寻找改进语言学习的方法。从对这两个领域的进一步研究当中,不难发现它们之间有着微妙的关联性。
语言测试,它的主要目的是基于一定数量的试题对其进行抽样评价,从而可以得出关于被试的言语行为,最后通过量化研究方法来预测被试所获得的语言知识能力。
语言测试有一些功能:首先,它可以评估教学并提供反馈信息,同时它可以对人才进行评价,为政府机关或者用人单位提供重要的依据从而帮助其选拔出优秀人才;其次,语言测试是语言教学研究和语言研究的重要手段,其涉及教、测、评几个方面,可以帮助学习者和教师更高效的学习和教学;最后,语言测试可以促进母语教学,扩大母语的影响力。Bachman[1]提出了他的语言能力模型,并展示了如何使用这种模型来支持语言测试。纵观国内外关于语言测试的研究,大多都是研究信度和效度方面,近些年对于等级量表的研究逐渐兴起。本文第四部分将从二语习得的角度探讨与等级量表效度之间的关联性。
根据Ellis[2]的观点,第二语言习得主要是研究学习者在习得第一语言后如何习得或学习另一种语言。它是指在习得母语之后,对任何其他语言的习得。一些人将外语学习和第二语言习得区分开来,前者通常用来指在课堂外不使用该语言的语境当中来学习该语言,比如在英国的纽卡斯尔学习法语;而另外一些人用二语习得指那些在课堂之外使用他们所学语言的语境,比如在英语国家当中大家都学习英语并且在课堂之外大家都是用英语进行交流。二语习得作为一门独立的学科可能形成于20世纪60年代末70年代初,人们从社会学、心理学、语言学等角度对其进行研究。它描述了学习者的第二语言特点、发展变化、第二语言学习的共同特点和个体差异,分析了影响第二语言习得的内外因素等。
语言测试和第二语言习得属于同一学科,即语言学习。他们有着相似的目标:了解语言学习的过程,并对其进行评估,从而寻找改进的方法。因此,这两个学科之间存在着相互影响、共享和贡献的关系。Bachman and Cohen[3]提到,怎么样形容和阐释二语习得和语言测试研究过程中的不同之处,是这两个领域的研究者们共同关心的要点。从整体上看,有三个方面亟须应对:首先,二语学习者在语言能力方面有哪些区别?语言测试中这些区别又如何表现?其次,关于这两个研究领域,它们所采取的策略差别体现在哪里?最后,给定的任务和语境不一样,这种情况下学习者的语言学习和语言测试又有什么不同之处?
我们知道Bachman和Cohen的研究领域横跨语言测试和二语习得,在他们两人的研究当中也提到了关于语言测试和二语习得之间的差别。首先,我们想要区分二者之间的不同之处在哪里,就要弄清楚这两个领域各自研究的重点在什么地方。第二语言习得研究的重点是侧重于学习者如何习得第二语言以及第二语言自身的发展。但语言测试不再是对学习者语言能力发展过程的研究,而是对学习者学习语言的结果的研究。从研究的视角来看,既然二语习得研究的重点在于学习者的学习过程,那么它采取的是一种动态的观点;相反,语言测试的研究者们关注的不再是学习者学习能力的过程,而是其学习结果,因此它所采取的研究视角是一种静态的观点。语言测试重点研究的是学习者习得的最终结果,也就是说学习者最终达到的语言能力呈现出什么样的状态,以及它的组成因素有哪些部分又或者说包含了哪些学习策略。纵观国内外关于二语习得的相关研究,不难发现,关注点大多在于主要影响因素有哪些,比如说动机、年龄或者性别等等,学者们的研究重点在于想发现学习者的学习过程是什么样子的。
Chapelle[4]从语言测试的角度阐释了第二语言习得领域的结构,并讨论了如何检验构念效度(construct validity)。第一步提出假设往往是二语习得研究的一般思路,第二步再依据实验的结果对其进行验证和假设。语言测试中的效度理论和效度测试方法对二语习得的研究有很大的帮助,同样,二语习得的实证研究也可以运用到语言测试当中。
Tarone[5]选定二语习得中的另一个概念“中介语”对其进行研究,从这个概念的角度来探讨二语习得与语言测试之间的关系。中介语(interlanguage)的概念通常被定义为:处在学习过程中的二语或外语学习者构建的语言。通常我们把它看成是处在目的语和母语之间的语言。中介语和目的语相比较还不够完备,但我们也不能想当然地认为中介语就是由母语简单翻译过来的,另一方面,也不能把中介语当作是母语和目的语之间的一个过渡阶段或者仅仅是由二者简单混合得到的一种语言类型。中介语是一个动态的语言系统,因为无论我们学习哪一种语言,都是从低级到高级、从简单到复杂的一个逐渐深入发展的一个过程。学习者所处的语境不一样,中介语的系统也会有相应的差异,同样的,学习者在语言表达方面的流畅度和准确度也会有所区别。为了确切的检验二语学习者的语言能力,语言测试的研究者们应该关注中介语在二语学习者的学习过程中如何变化的。研究中介语对语言测试有以下几个方面的启发:第一,语言测试研究者可以思考是什么样的语境对学习者中介语发生变化起到了影响作用;第二,语言测试研究者不能盲目地遵循第二语言习得提出的理论,因为这些理论当中有的对中介语变化的因素考虑不周到;第三,中介语发生变化的同时,语言测试也会对每个考生营造不同的“语境”,即每个考生会面临不同语言测试带来的影响;第四,中介语处在一个不断变化的情景中,所以被试者在测试中的语言能力并不能准确地反映出他们的常规语言能力。所以关于这几个方面研究者们还亟须改进。
Shohamy[6]从Studies in Second Language Acquisition和Language Testing这两个研究领域的国际著名期刊中选取了10篇文章。根据结果显示,在二语习得的文章当中并没有涉及关于语言测试的内容,只有少数文章有所提及;而在语言测试的很多文章中我们能看到关于二语习得的相关研究,但Shohamy并没有发现二语习得研究对拓宽语言测试的方法和手段有什么样的重大影响。在推进语言测试能顺应学习者个体差异上,二语习得也没有起到明显的作用。Shohamy在关于二语习得与语言测试有何种关联上,以电子邮件的方式对10位专家学者进行采访,不过其中只有一位专家提到二语习得和语言测试存在关联性。Shohamy以话语分析为例探讨了语言测试和二语习得之间的关系及二者是怎么互相影响的。在她看来,语言测试和二语习得之间的关系,不是说某一研究领域主导另一个,而是说这两个相互独立的分支却起到了一个相得益彰的作用。一方面,二语习得对语言测试的研究起到了一定的帮助作用。主要有以下几个方面:第一,首先我们要很清楚地知道语言测试的目的是什么,它是对学习者的语言能力起到了测量的作用以及学习者的语言能力包含哪些部分,而二语习得研究的成果在一定程度上对这个问题起到了推波助澜的作用;第二,二语习得研究中的一些任务可以应用到语言测试当中;第三,研究在一开始就已经提到了二者的关注点是有差异的,二语习得研究的是学习者学习语言的过程,但是影响二语习得的因素又有很多,比如年龄、母语迁移、学习策略等,同样的,这些差异对被试的测试行为也会产生一定程度上的影响。另一方面,语言测试对二语习得的研究也起到了一定程度的作用,有以下几个方面:第一,语言测试的研究者们提出了语言能力模型,而这个模型可以作为语言测试和二语习得双方的参照物;第二,二语习得研究者们提出关于学习者或是学习能力的假设,而语言测试的研究成果可以用来检测其提出的假设;第三,语言测试中的效度检验方法对二语习得的研究也是有很大的帮助。
一直以来语言测试研究的重点是对关于信度和效度的研究,信度(reliability)就是可靠性,它采用的是用同一种方法对同一个对象进行调查,从而判定最终的稳定性和一致性是否保持一致。而效度(validity)说的就是有效性,指的是借助测量工具或某种方式和手段是否能够精确地测量出需要被测量的事物的程度。在这一小节当中,我们既然要讨论从二语习得的角度来看等级量表的构念效度,那我们首先要弄清楚两个概念:量表和构念效度。杨惠中和桂诗春[7]提到,我们既然要制定一套属于亚洲统一的英语能力等级量表,那么就要从各个方面多角度地对语言等级量表的每一个等级做出明确的规定,比如说语言交际功能、语言技能等等。2014年9月3日国务院发布的《关于深化考试招生制度改革的意见》明确提出,要加强外语能力评价体系建设,推进考试内容和形式改革。在经历了三年多的实证研究和充分论证之下,经国家语言文字工作委员会语言文字规范标准审定委员会审定,《中国英语能力等级量表》于2018年2月12日由教育部、国家语委签发。教育部于2018年4月13日正式发文,并于2018年6月1日开始在全国实施(中华人民共和国教育部、国家语言文字工作委员会,2018)。[8]到现在为止,关于量表的版本已经发布了中文版和英文版,与《欧洲语言共同参考框架》等能力标准和雅思、托福等国际知名考试的对接也基本完成。但量表从制定到发布到应用到方方面面尤其是教学中还需要制定者和践行者们在实际的运用中不断地完善。关于量表的验证和修订可以说也是一个延续不断的工作,所以从事这方面的科研工作者也需要从各方面不断跟进,从而使量表发挥它应有的作用。[9]
构念效度(Construct Validity)。是指测量结果体现出来的某种结构与测值之间的对应程度。构念效度分析所采用的方法是因子分析。它最关心的问题是:量表实际测量的是哪些特征。在评价构念效度时,研究人员要试图解释“量表为什么有效”这一理论问题以及考虑从这一理论问题中能得出何种推论。Brindley[10]讨论了二语习得视角下如何看待等级量表的构念效度。我们首先对等级量表下一个定义,它是用来描述学习者语言能力高低的一种办法。以美国ACTFL和ILR为代表的等级量表都是基于行为主义的量表。它不是根据主观看法去评价一个人的语言能力,而是对人们在现实生活中怎么运用所习得的语言从而评判学习者的语言能力,并给出整体的级别。对于这种模式,有人支持,有人反对。但是在Brindley看来,他本人是支持这种观点的。不过与此同时,他也指出了第二语言学习者语言能力的发展是否与等级量表的描述相符,目前还没有足够的证据来证明它的合理性。他认为,无论是从事二语习得还是语言测试的研究者们都不应故步自封用单一的角度来看待等级量表的有效性研究,而是应该持有一种多角度、多方面的观点来看待彼此的关联性。
研究从语言测试和二语习得的研究范围展开,讨论它们之间的异同点、接口问题的相关研究等。不难发现,它们之间在某些方面确实存在着一定的关联性,但是因为这方面的研究还有很多不足之处,二者的实际应用也存在着很大的局限性。很难解释为什么会出现这种情况——有共同目标的两个学科以如此孤立的方式运作;同时也很难理解这种情况是如何在跨学科研究的发展趋势中持续下去的。就语言测试研究而言,应当借助二语习得理论的最新发展,拓宽其评估手段及评估更多的语言成分;就二语习得研究来说,应当借助语言测试的统计方法验证其提出的猜想。因此,语言测试和二语习得的研究者应加强彼此间的交流,只有这样才能真正促进两个领域的深化研究。