黄 雷
(肇庆学院 外国语学院,广东 肇庆 526061)
程式语(formulaic Language),又常被译为语块或预制语言等,已成为二语习得研究的重要问题。研究者们对于程式语的关注在最近几年里达到了一个新的“井喷”(Wray, 2012)式的高度。他们从语言学、语料库语言学、语用学、语言教育和心理语言学等角度对程式语进行研究,内容涉及各种类型的程式语,包括固定搭配、词串和习语等,研究既有对理论框架的讨论也有实证研究。核心问题在于探究本族人和二语学习者在理解和运用程式语过程中所经历的认知过程,涉及语言的存储,表征和提取(Ellis et al., 2015;Myles et al., 2017)。很多研究表明,程序语在语言使用过程中发挥着重要的作用,有一定的心理现实性(Wray, 2012)。
最近两年的研究呈现出几个趋势:(1)在关注各种类型程序语的同时,更为关注基于频率的程式语(词串,lexical bundles);(2)研究手段趋于多样化,既有学者通过语料库以及口头完成对话等手段考察程序语的产出,也有学者通过心理语言学在线阅读的方法探讨程序语的理解;(3)研究者更为深入地探讨程序语的习得同二语句法和语用能力发展之间的关系。
本文从三个方面综述国外近两年(2016—2017年)有关二语程式语的研究,包括程式语这一概念的重新界定,程式语与二语语法能力的发展,以及程式语与二语语篇能力的关系。
虽然程序语已成为二语习得研究中一个非常重要的话题,但研究者们对于程序语这一概念仍有不同的理解,其研究往往针对不同类型的程序语得到不同的结果。Wray(2012)发现,在针对程序语的不同研究中,研究者们使用了多达40种不同的术语,使得这一研究领域显得混乱。不少学者试图针对程序语建立规范的术语和标准,但由于不同研究有各自的侧重点,并且各自选用了不同的鉴别标准,使得其研究结果缺少可比性(Gonzalez Fernandez et al., 2015)。
不同术语的使用体现出研究者不同的研究角度。比如使用语块(chunk)一词时,多为心理语言学角度的研究;而语串(clusters)一词则暗示一种语料库语言学角度的研究。近些年来,虽然程序语(formulaic language or formulaic sequence)逐渐成为一个大家普遍接受的统称(Weinert,2010; Wood,2015),但程序语究竟是一个什么概念仍没有统一的共识。一方面,研究者们使用“程序语”这一术语指代本族人和二语学习者接触到的习语和固定搭配等语言结构(Conklin et al., 2008, 2012; Underwood et al.,2004),而另一方面,同样的术语“程序语”也可以指代语言使用者作为一个整体存储和提取的语言单位(Hickey,1993; Weinert,1995)。正如Wray(2012)所说,一些研究者研究习语和固定搭配时,默认它们作为一个整体被语言使用者存储和提取,实际是将程序语的不同方面进行了混淆。这种术语使用的混乱给研究者们的设计和结论都带来了一定的影响。
很多二语习得研究都忽视了一个根本问题:程式语对于本族人和二语学习者来讲并不是同一个概念。对本族人来讲,作为一个整体存储和提取的程序语是以他们的语言产出为参照的。二语学习者的情况有本质的不同。很多习语或惯用表达并不能被二语学习者作为一个整体进行存储和处理。这一点可通过他们在口语表达时的停顿和错误看出(比如“it’s raining/…pause…/dogs and cats”)。另一方面,对他们来讲已能自动处理的“程序语”也许含有一些错误(比如使用“on the other hand”作为万能的语篇标记手段),显然同本族人的“程序语”不是一个概念。
Myles等(2017)针对现有二语程式语研究中概念使用的问题,认为应从两个角度来界定程序语这一概念:(1)语言学视角或学习者外部视角,即学习者接触到的包括习语和固定搭配在内的外在语言结构。他们用“语串”来指代这一概念,并将其定义为“某种语言里作为惯用表达方式存在的多词结构。其特点是语义或句法上不规则,并且其组成成分频繁同时出现”(Myles et al., 2017:10)。(2)心理语言学视角或学习者内部视角(learner-internal),即学习者处理这种语言结构时经历的认知过程。用“处理单位(processing units)”来指代这一概念,定义为“能够帮助语言使用者节约处理资源、具有语义功能的多词结构。他们在大脑中作为一个整体存储,并有高度的自动提取特点”(Myles et al., 2017:10)。
这两个角度互相独立又相互关联,成为程序语概念里不可忽视的两个方面。他们还指出,鉴于之前研究中存在的一些缺陷,非常有必要从理论层面区分程序语的两个方面,否则有关程序语的研究难以走出概念上的误区。虽然大多数研究只针对程序语的某一方面,却声称其结论具有普遍的适用性,这显然是不合适的。他们进一步提出,在二语习得研究中,应停止使用“程序语”这一术语,而使用两个不同的术语进行替代(语串和处理单位)。
我们认为,Myles & Cordier(2017)提出的程序语概念的两个方面在二语习得研究中尤为重要。大多数针对二语学习者的程序语研究都将程序语看成是学习者外部的语言结构。他们研究了二语学习者如何使用和处理习语(Irujo,1993)、习惯表达(Foster,2001)、固定搭配和词串(Chen et al.,2010 ; Laufer et al.,2011)。结果大多表明,二语学习者对这些语言结构的习得和使用没有本族人那样准确和自如(Forsberg,2009)。
相比学习者外部视角的程序语(语串),学习者内部视角的程序语(处理单位)应当在二语习得研究中有更重要的位置。学习者内部视角的程序语将其看成是学习者接触语言材料过程中使用的心理语言单位(psycholinguistic units)。相比其他语言结构,程序语更容易被语言使用者进行处理,并作为一个整体进行存储和提取。程序语的这两个方面虽然互相联系,且有重叠的地方,但却是完全不同的两个概念,必须在研究中加以区分(Myles et al., 2017)。比如,本族人在使用“It is time to”时,可以将其作为一个整体进行处理,而二语学习者会说:“It is…uhm.…time to”。很明显,在语言产出时,二语学习者临时这些词语组织在一起,没有像本族人那样作为一个整体提取。也就是说该程序语对于具体二语学习者没有心理现实性。现有研究都将这两方面混为一谈,认为本族人能作为一个整体存储和提取的程序语,对二语学习者也一样,因此这些研究会引来各种误解,其结论也无法令人信服。
二语学习者接触到的语言输入有限,“处理单位”的自动化进程尚未完成(或仅部分完成,或将错误的语言结构进行了自动化)。鉴于以上原因,我们进行相关研究时应避免使用二语学习者不熟悉的习语和固定搭配,而应选用他们会经常接触到的语言结构,这样才可能准确考察要研究的内容。同样,我们要从二语学习者自身的语言产出中考察程序语结构。至于这些结构依据本族人的标准是否是程序语(学习者外部的程序语)并不重要。
二语习得研究的一个核心目标是考察二语学习者如何习得、存储和提取语法知识(Shantz, 2017)。目前主要有两种观点:基于使用(usage-based)的习得观和基于规则(rule-based)的习得观。前者认为二语学习者语法能力的发展源于他们的语言输入。语法能力的发展是学习者自身的认知机制同语言输入相互作用的结果(Bybee, 2006; O’Grady, 2005)。基于规则的习得观认为语法能力由一系列抽象和内在的规则组成。学习者接触语言输入时,会激发其本身具有的语法机制(Lardiere, 2008, 2009)。因此语言习得并不依赖于学习者的认知机制。
小波变换的阈值去噪过程中,选取合适的阈值和恰当的分解层次是保证良好去噪效果的首要条件。为避免因阈值选取不合理而影响信号去噪,本文在对微流控芯片信号去噪过程中引进能量元的方法,通过能量元放大有用信号和噪声小波系数之间的差异,在阈值选取时有更大的裕度[11],更容易选取较为合理的阈值。
另一方面,程式语可以用来考察学习者的语法知识同语言输入的关系,尤其是高频出现的语言结构(基于使用)同抽象的语法规则(基于规则)之间的关系。针对二语学习者处理程式语的研究表明,他们对于目标结构的频率确有一定的洞察能力。但与本族人相比,他们无法区分更为细微的频率差别 (Siyanova et al.,2008),这也许同他们有限的语言输入有关。然而,探讨程式语的频率同二语句法能力关系的研究还很少。
Shantz(2017)和Bardovi-Harlig 等(2017)分别从语言输入和输出两个角度探讨了程式语同二语句法能力发展的关系。
Shantz(2017)考察了母语为汉语的英语学习者在线处理词串(Lexical Bundles)*词串是程式语的一种,是高频出现的语串结构(Biber et al., 1999)。同其他的程式语(比如习语)不同的是,它们在句法和语义上具有可分割的特点(比如“I thought he was”),因此词串具有十分特殊的身份。的情况。实验试图探讨基于使用的习得观同基于规则的习得观哪个更实用于二语语言处理的过程。按照基于使用的习得观的观点,语法能力受到二语语言输入里的统计特征(频率)的影响。因此,在进行在线语法依赖(grammatical dependencies)处理时,目标结构的频率会对处理产生一定的影响。也就是说,频率高低会对二语学习者进行的语法判断产生影响。相反,按照基于规则的习得观,语法能力的发展和语法信息的处理只依赖于抽象的语法规则。因此对于目标结构的语法判断不会受到词串频率的影响。
Shantz(2017)研究结果显示,本族人阅读违反语法实验句的时间显著长于符合语法的实验句。他们阅读高频词串的时间显著低于低频词串。语法规则性同词串频率之间没有交互影响。作者认为,对本族人来讲,语法信息的处理主要依赖基于语法规则的信息,而不是基于使用(频率)。
二语学习者的情况与本族人略有不同。词串频率对于阅读时间有显著的影响。无论是否符合语法,高频句阅读时间都要快于低频句。这一点同本族人的情况一样。不同的是,语法规则性这一因素在二语学习者中没有达到显著,这说明,二语学习者阅读符合语法的实验句同阅读违反语法的实验句在时间上没有显著差异。将二语语言水平因素加入实验设计之后发现,语法规则性、词串频率同语言水平三者之间存在交互作用。对于高水平组和低水平组,语法规则性和词串频率对阅读时间都有显著的影响。也就是说符合语法的实验句阅读时间明显短于违反语法的实验句,高频实验句阅读时间明显短于含有低频实验句。中间水平组的情况略为特殊,未发现语法规则性对处理时间的影响。
作者认为,二语学习者的句法知识随着学习经历的加深,语言输入的增加,逐步地发展和完善。对于低水平的学习者而言,语法处理机制还不健全,语言输入的处理主要基于频率的分布。很显然,违反语法规则的实验句在正常的语言输入里出现频率很低,因此阅读时间要更慢。随着语言水平的提高,中间水平组的被试经历了更多的语言输入,其自身中介语语法体系不断发展,频率和语法规则在他们身上产生一种特殊的制约关系。高水平组的被试更加接近本族人,他们依赖基于规则的句法信息处理语言输入,因此语法规则性对他们的阅读产生了显著影响。
我们认为,Shantz(2017)的研究主要存在两点不足。首先,作者在实验中设定符合语法的实验句同其违反语法的对照句具有相同的频率。这显然有逻辑上的问题。因为符合语法的词串“I thought he was”同违反语法的词串“I thought he were”在语言输入中的频率会有显著的区别。作者自己也提道:“对于低水平学习者而言,语法处理机制还不健全……很显然,违反语法规则的实验句在正常的语言输入里出现频率很低,因此阅读时间要慢于符合语法规则的实验句。”(Shantz, 2017:22)
其次,作者在实验设计时强调要探讨基于使用的习得观同基于规则的习得观的适用性问题,但是并没有能够合理解释语法规则这一变量对于二语习得者在线处理的影响,尤其是中等语言水平学习者的复杂情况。
Bardovi-Harlig 等(2017)从语言产出的角度,采用口头表达和书面造句的任务,考察了二语学习者在具体语境里使用习惯表达(conventional expressions)*习惯表达是程式语的一种,包括习语(idioms)、复合词(compounds)和固定搭配(collocations)等。的情况。
同Shantz(2017)一样,Bardovi-Harlig 等(2017)在实验设计时考虑到二语句法能力发展的二种观点(基于使用的习得观和基于规则的习得观)。依据基于使用的习得观,因为程式语是二语学习者语言输入的重要组成部分,是其句法能力得以发展的主要原因,所以不论一语习得还是二语习得,学习者都可以从含有程式语的语言输入中提炼分析出目标语的语法结构。依据基于规则的习得观,语法能力的发展主要依赖那些可分析性的语言输入(analytic input),同程式语没有关系。
Bardovi-Harlig 等(2017)研究结果表明,二语学习者在习得程式语时,会将程式语的关键词(Lexical core,比如“Sorry I’m late”中的“Sorry”)及其出现的语境存储在中介语体系中。遇到合适的语境,他们尝试使用目标程式语。结果显示他们都正确使用了关键词(比如“sorry”),而关键词之外的其他部分呈现出多样性和创造性。随着语言水平的提高,他们使用程式语时依旧保留了关键词,但对其他部分进行了改变,逐渐接近本族人的表达。这也体现他们中介语语法体系的发展过程。
Bardovi-Harlig 等(2017)的重要贡献在于表明,二语学习者未能准确使用程式语,并不表示程式语在他们大脑中没有表征。相反,他们能够识别合适的语境,并不断尝试将头脑中的程式语提取,结合自己的中介语知识进行表达。这正好与Myles & Cordier(2017)谈到的学习者内部的程式语一致,应当同学习者外语的程式语(以本族人为参照)区分开。以往的研究多以诱导性的填空或选择为任务,无法深入考察程式语在学习者中介语里出现的形式。Bardovi-Harlig 等(2017)的实验要求被试按照自己的需要进行语言产出,为研究他们的中介语语法特点提供了直接的途径。
很遗憾,我们认为Bardovi-Harlig 等(2017)仍没能回答“基于使用的习得观”同“基于规则的习得观”之争的问题。主要原因在于他们选取的程序语为习惯表达,非常依赖具体的语境。虽然它们是本族人首选的表达手段,但在学习者日常的语言输入里未必有很高的频率,未能满足“基于使用的习得观”对频率的要求,因此失去了同“基于规则的习得观”比较的意义。
最近几年,有不少研究考察语言水平考试中考生的表现,探讨水平不同的学习者语言输出中体现的结构和语篇等特点。Kennedy和Thorp (2007)从雅思考试考生的回答中提取出文本,考察了其中的反问句、情态句、话语标记、从属句及并列句等,并分析了其中的连贯和衔接(coherence and cohesion)等语篇特征。研究表明,相比低分考生,高分雅思考生很少使用词汇语法标记(lexico-grammatical markers,比如“however”),数字型标记(enumerative markers,比如“firstly”),以及从属连词(subordinators,比如“because”)。
Chen和Baker (2010)采用了结构和功能的分析法,比较了二语学习者同英语本族人在学术写作中的语言使用特点。结果发现,相比本族人,二语学习者更多使用一些语串结构(比如夸大地域范围的“all over the world”),而很少使用典型学术写作中的表达(比如名词和介词词串,“the extent to which”和“in the context of”)。Staples 等(2013)考察了三组水平(高,中,低)不同的托福考生使用词串的情况。结果发现,低水平考生更多使用了词串,尤其是考试指令中包含的词串;然而从功能的角度分析,水平不同的考生对词串的使用大致相同。之前研究的一大问题在于,缺少严格和统一规范的标准考察二语学习者的语言水平(尤其是写作水平)并进行高低水平的分组,这使得研究结果缺少说服力。
Chen & Baker (2016)考察了母语为汉语的英语学习者在写作中使用词串的情况。他们采用语料库统计和语言专家评审相结合的研究手段。独特之处在于,为确保能够准确考察被试的写作水平,从而研究语言水平对程式语使用的影响,研究者采用了一些高风险语言测试常用的严格并完整的评估手段。
二语学习者的写作文本来自《朗文学习者语料库》(LongmanLearnerCorpus(LLC)),由其中的说明文和议论文组成。评分和分组根据欧洲共同语言参考标准(CommonEuropeanFrameworkofReference)中规定的B1, B2和C1三个水平。
通过分析写作文本,Chen & Baker (2016)考察了二语学习者使用的词串在语篇功能方面的特点。讨论围绕三种常见的语篇功能:指示(如“at the end of”)、立场(如“It is possible to”)和组篇(如“in addition to”)。指示功能方面一个明显的特点是低水平组B1过度使用了表示数量的词串(如“a lot of people”),尤其是含有“a lot of”及“many”的词串。相反,高水平组C1很少使用的表示数量的词串,更接近学术写作的风格。立场功能方面,低水平组B1更多使用含有“I think”的词串来表达观点。而高水平组C1更多使用由“It”引导的从句表达观点和态度(如“it is not easy”以及“it is very difficult”)。组篇功能方面,低水平组B1更多使用“If”引导的表示条件的词串(如“if you want to”以及“if you don’t know”)来展开话题。高水平组C1则使用了各种不同类型的词串来组篇(如“in order to”,“how to deal with”以及“to cope with the”)。
总之,低水平组使用的语串中出现了很多的动词(尤其是“be”),人称代词(“I”)以及表示数量的单词(尤其是含有“a lot of”以及“many”的词串)。高水平组则更多使用前置词和名词/介词语串进行表达,更加书面语化(如“it is true that”,“one of the most”以及“the end of the”),更接近学术写作风格。B2作为中间水平组,表现出一种从B1到C1过渡阶段的特征。他们对于词串的使用介于正式与非正式语体,以及口语会话与学术写作之间。
Chen & Baker (2016)最为重要的一点是其测试写作水平并进行水平分组所采用的严格的标准和步骤。他们参照欧洲共同语言参考标准,从语言发展的角度将语言测试研究和二语习得研究结合起来,考察不同水平的二语学习者使用词串的不同,从而探讨二语语篇能力的发展。不同于Staples 等(2013)的完全定性研究,Chen & Baker (2016)采用定性和定量研究相结合的方法,也是这类研究中的一个突破。
本文选取的几个研究是这两年比较有代表性的二语程序语研究。他们中既有对程序语概念本身进行的理论探讨,也有采用语料库和心理语言学手段进行的实证研究;既研究二语学习者对语言输入的理解和判断,又研究他们口头和书面形式的语言产出。尽管在实验设计方面还存在一些问题,这些研究有助于我们更进一步了解二语学习者语法和语篇能力的发展,以及程式语在二语习得过程中扮演的角色。当然,有关二语程式语还有很多未解的问题,还需要今后的研究去进一步探索,揭开其神秘的面纱。