中国英语学习者词串效应研究

2018-09-13 11:59:48上海旅游高等专科学校上海交通大学俞理明

外语教学理论与实践 2018年3期

上海旅游高等专科学校吴云上海交通大学俞理明

1. 引言

在语言学领域，人们很早开始关注“语块”(formulaic language)的存在。这种语言单位结构固定且反复出现(Wray, 2002)。在心理学领域，Miller(1956)提出了信息处理过程中的“结块”(chunking)概念。通过将信息组织成较大的处理单位，人们可以克服处理资源的不足，增加信息处理的速度。习语(idioms)和固定搭配(collocations)作为语块结构，在过去得到广泛研究。研究者们普遍认为，习语和固定短语结构在语言处理过程中作为一个整体进行存储和提取(Wray, 2002)。桑紫林和张少林(2013： 40)考察了中国英语学习者语块处理方式，验证了语块认知加工趋向于整体处理的假设。

Biber & Conrad (1999)指出，强大的语料库工具的出现使得研究者能够在庞大的数据库中找到高频出现的语言材料。这些反复出现的语言结构在我们生活中广泛、系统地存在着，且不为人们所察觉。词串(lexical bundle)的概念也由此产生。它指的是出现频率极高、结构不一定完整、连续的多词结构(multi-word sequence)。虽然词串“lexical bundle”一词最早出现在LongmanGrammarofSpokenandWrittenEnglish一书中(Biber et al., 1999)，但其概念可以追溯到Salem(1987)针对法国政府文献的语料库研究的“重复切分”(repeated segments)。 Butler(1997) and Altenberg (1998) 使用“recurrent word combinations”表达了相同的概念。这里我们采取Biber等(1999)关于词串的选取标准：在百万词里至少出现10次以上的两词、三词或者四词结构，以及百万词里至少出现5次以上的五词结构。比如，“I don’t know whether”, “got nothing to do”和“in the middle of the”等就是一些常见的词串。

Biber & Barbieri (2007： 269)认为词串有以下区别于语块的特征。一是它们基于语料库统计出频数，因此极为普遍；二是它们的意义可通过其组成部分推断出，没有习语那样约定俗成的特点(比如，“do you want to”,以及“I don’t know what”)，习语并不能称作词串，因为它们的出现频率不够高；三是它们结构上通常是不完整的，很多词串跨越两个不同的结构单位：他们常常开始于某个结构单位，而最后一个词却是另外一个结构单位的开始。比如，“well that’s what”以及“in the middle of the”。Biber等(1999)的研究发现，口语语料中仅有15%的词串是结构上完整的，而在学术语料中仅有5%的词串是结构上完整的。

词串作为高频率出现的语言结构，在语言处理中是否能够像习语一样作为一个整体进行提取和存储，仍然没有一个明确答案。相关的研究也很少。本研究旨在通过线上阅读测量反应时间的实验考察英语本族人和二语学习者对词串结构的处理情况。本研究线上阅读实验所采用的词串都基于它们的高频数，并且大多结构上不完整。

2. 研究背景

1) 二语学习者的隐性词汇知识

近年来，研究者开始关注二语学习者的隐性知识(implicit knowledge)，并探讨其同显性知识(explicit knowledge)的区别。Ellis R.(2006： 95)认为，隐性知识不同于显性知识，他们存在于学习者的潜意识中，是一种过程化(procedural)的知识。隐性知识在日常语言使用中被轻而易举地快速提取，但无法通过语言来描述或者归纳。显性知识通过有意识有目的的学习活动获得，包含语言使用者所学过的各种语言知识，可以通过语言来描述和归纳。

显而易见，隐性知识最为重要的特点在于它是一种潜意识知识，可以被快速地、毫不费力地提取。很多研究者从句法角度探讨了二语学习者的隐性句法知识(Clahsen & Felser, 2006)。他们开展了线上阅读的心理语言学实验，结果发现二语学习者无法像英语本族人那样对实验材料中的句法信息进行有效的处理，不具备本族人的那种隐性句法知识。

长期以来，研究者认为词汇知识本质上是一种陈述性的显性知识，永远不会变成隐性知识(Sonbul & Schmitt, 2013： 125)。Ullman (2001)在其提出的陈述/过程的语言知识模型中认为词汇知识是陈述性的(declarative)，而语法知识是过程性的(procedural)。同样，Hulstijn (2007)认为词汇知识是基于符号的、显性的知识。这种观点将词汇知识看作是对形式和意义的简单存储，因此有关隐性词汇知识的探讨和研究一度被忽视。

Ellis N.(1994)是第一个探讨隐性词汇知识的尝试者。作者认为词汇知识包含两个部分： 1) 通过有意识的学习活动习得的有关单词形式和意义的关系及单词间的语义联系；2) 通过潜意识学习活动获得的使用单词的能力(输入和产出)。Ellis R.(2004)认为，虽然单词的形式和意义是学习者显性知识体系中十分重要的一部分，但将单词在合适的语境中使用的能力则是隐性知识的体现。Sonbul & Schmitt (2013)认为，鉴于研究手段的局限，以往的二语词汇研究多关注词汇的广度、深度和组织等显性知识。近几年来，随着心理语言学研究手段的丰富，研究者们展开线上阅读的实验方法，探讨学习者的隐性词汇知识(Jiang & Nekrasova, 2007)。

本研究试图通过线上阅读测量反应时间的实验，探讨中国英语学习者实时处理基于频率的多词结构的能力。本质上是考察他们的隐性词汇知识，并与英语本族人的情况进行比较。

2) 二语词汇习得中的频率效应

在心理语言学研究领域里，频率效应一直被认为是语言处理过程中最具影响力的因素。那些经常遇到的单词会更快地被识别(Rastle, 2007)，也更容易被处理(Bybee, 2007; Baayen, 2007)。为了解释词汇处理中的频率效应问题，研究者们提出了各种各样的理论模型(Carroll, 1999)。

然而，频率效应在二语习得中的作用仍是一个争论的话题。比如，一些二语习得研究发现，面对高频出现的目标语词汇结构，二语学习者并不能够像本族人那样熟练处理。Ellis N. (2006)认为，二语习得过程中有众多的影响因素，因此频率效应并不像在一语习得和使用中作用那么强。Wray (2002)认为，二语学习者更多采用分析型的方法来学习和使用第二语言，因此无法像本族语者那样利用频率效应处理和使用语言材料。其他一些研究(Siyanova-Chanturia, Conklin & van Heuven, 2011; Durrant & Schmitt, 2010) 表明，虽然二语学习者在目标语最终成就上距离本族人有一定的差距，但他们在某种情况下也会对频率效应表现出一定的敏感性。

为了研究词串这种多词结构的频率效应问题，我们的实验材料包含(1)和(2)这样的句子。

(1) He sat in the middle of the bullet train.

(2) He sat in the front of the bullet train.

句(1)中的词串“in the middle of the” 在BritishNationalCorpus中的频率为每百万词出现15.3次；而句(2)中的非词串结构“in the front of the”的频率只有每百万词0.4次。我们要回答的问题是，这两句话中多词结构在频率上的差异对于人们处理这两句话是有怎样的影响。如果词串被作为一个整体进行处理，那么句(1)的处理应当比句(2)更快更容易。

3) 以往有关词串的研究

由于缺少合适的实验手段，很多年来研究者将目光集中在分析词串的语言特征，而不是考察实际的语言输入和产出。一些学者对词串在学术和口语环境下的语篇功能进行了研究。比如Biber等 (2004) 将词串分为三类：表达情感和态度的意向词串(stance bundles)(比如“it is important to”和“I want you to”)，揭示上下文关系的语篇组织词串(discourse organizers)(比如“on the other hand”和“as well as the”)和联系具体或抽象事物的指代词串(referential bundles)(比如“is one of the”，“in the form of”和“as a result of”)，以及口语中表达礼貌和询问等功能的特殊会话词串(special conversational bundles)(比如“thank you very much”，“what are you doing”和“I said to him/her”)。其他研究者试图探讨词串的频数标准。Biber & Barbieri (2007)认为只有百万词语料里出现超过40次的结构才能称为词串。Hyland (2008)认为是20次，而Simpson-Vlach & Ellis (2010)则认为10次即可。再比如，国内学者刘青等人(2010： 157)对大学生非限时英语作文的词串做了语言特征归类研究。石慧敏(2013： 364)基于语料库语言学对词串的语言结构和功能进行研究。两者都提出了词串在处理方式上采用了整存整取的特征，但是均未做实证性研究。

近年来，一些研究者开始通过心理语言学手段考察语块的处理，他们大多选取形式固定并且意义约定俗成的习语和固定搭配(Yamashita & Jiang, 2010; Wolter & Gyllstad, 2013; Sonbul & Schmitt, 2013)。词串尽管出现频率高，但因为结构不完整，意义上也不约定俗成，往往被研究者忽视。

Jiang & Nekrasova (2007) 通过语法判断实验发现英语本族人和二语学习者对于三词结构词串(比如“the fact is”)的反应速度要快于对应的非词串结构。其实验结果证明了词串可以作为一个整体，在语言处理中发挥作用。Schmitt, Grandage & Adolphs (2004)进行了多词结构(比如“in the middle of the”，“it was going to”)的产出实验，但没有发现频率对这些多词结构产出活动的影响。Nekrosova (2009) 利用完形填空和定时听写的实验，考察英语本族人和二语学习者对词串的产出情况。结果发现，二语学习者不能够像本族人那样写出实验预期的词串，证明他们在词串的掌握上还存在不足。

Tremblay等(2011)是目前唯一通过线上阅读实验考察词串处理的研究者。他们通过三个测量反应时间的实验研究了英语本族人对于词串的实时处理情况，结果发现受试处理含有词串“in the middle of the”的句子(句1)要快于处理含有非词串“in the front of the”的对应句(句2)。其结论是，词串虽结构不完整，但在语言处理过程中能作为一个整体进行存储和提取。因此句(1)包含5个单位(i.e., I + sat + in the middle of the + bullet + train)。由于频率上的差异，非词串不能够作为一个单位进行存储和提取，因此句(2)包含了9个单位 (i.e., I + sat + in +the + front + of + the + bullet + train)，因而处理速度慢于词串结构。然而，二语学习者能否像本族人那样，在实时处理含有词串的语言材料时将其作为一个整体进行存储和提取，目前还没有相关的研究。

4) 线上阅读实验句的呈现方式

Schmitt和Underwood (2004)研究了语块的线上处理。该研究的出发点为：含有语块的实验句应当比不含有语块的实验句有更快的处理速度，因为语块作为一个整体在大脑中进行存储和提取具有一定的效率优势。实验采用了一词一词的呈现方式。屏幕上每次只呈现一次。受试者通过按键来阅读下一个单词。该研究没有发现语块的处理优势。Schmitt & Underwood(2004： 187)认为，这种结果是由于一词一词的呈现方式引起。因为我们在实际阅读时，通过使用预期等方法跳过某些单词，而在词-词呈现的实验条件下，受试者不能够自然地进行语言处理。

正是由于以上原因，Tremblay等(2011)拓展了研究的呈现方式，包括词-词呈现、部分-部分呈现和整句呈现。他们的实验证实，呈现方式不同对于线上阅读确有一定影响。词串效应随着呈现单位扩大而加强。本研究也借鉴了Tremblay等(2011)的研究，实验采用三种不同的呈现方式。

3. 研究设计

1) 研究问题

本实验以Tremblay等(2011)的研究为基础，考察词串效应在英语本族语者及中国英语学习者中的心理现实性。与以往实验不同, 我们增加二语学习者的英语语言水平这个因素, 主要探讨以下三个问题：

(1) 实验材料的不同呈现方式(词-词呈现，部分-部分呈现，整句呈现)对实验结果有怎样的影响？

(2) 英语本族语者能否像Tremblay等(2011)在他们的实验里那样经历词串效应?

(3) 高水平、低水平英语学习者是否与英语本族语者存在显著差异?

2) 受试

参加本实验的受试为某重点大学理工科专业二年级的120 名本科生。按其刚通过的大学英语四级考试成绩分为两组，450—500分的60人为低分组(平均分473.60；标准差11.89)， 600—650分的60 人为高分组(平均分623.50；标准差12.42)。独立样本t检验显示，两组受试成绩差异显著(p<.01)。因为本实验主要采用阅读任务，我们提取出两组受试的四级阅读成绩。独立样本t检验显示,两组受试的四级阅读成绩同样存在显著差异(p<.01)。本研究另设60名母语为英语的美国留学生为对照组。

低分组60人，高分组60人以及本族语者60人。随机分成3组，每组包含低分组20人，高分组20人以及本族人20人，分别进行本研究的三个实验。

3) 实验材料

本研究的20个实验句采用Tremblay等(2011)针对英语本族语者进行的线上阅读研究中的实验句。词串的频率由BritishNationalCorpus的口语语料库获得。我们采用Biber等(1999： 992-993)对词串/非词串的划分方法，即每百万词至少出现10次的四词结构和至少出现5次的五词结构为词串，而出现频率低于上述标准的四词或五词结构为非词串。

每个实验句包含词串句和相对应的非词串句两种情况，如(1)和(2)。非词串对应句同词串句仅有一个单词不同，这个词也称为关键词(pivot word)。非词串句在设计时尽量保证其长度小于词串句，且关键词频率高于词串句。这样的话，如果词串句处理快于非词串句，那么这种词串效应的获得是源自处理和提取的过程，而非其他的因素所致。

(1) I sat in themiddleof the bullet train.

(2) I sat in thefrontof the bullet train.

在线阅读实验包含60个句子。前10句为帮助受试熟悉计算机操作的练习句, 随后是随机混合的20个实验句和30个与实验无关的填充句，以避免受试发现实验目的并采取固定阅读策略。

每个实验句包含词串句和相对应的非词串句两种情况，而两种情况仅一种出现在20个实验句中，且出现机会均等。20个实验句与30个填充句随机混合，每句后设一个与句子内容相关的问题，以确保受试认真完成在线阅读任务，并努力去理解句子的含义。

4) 实验程序

受试反应时间及问题回答情况通过Psyscope Version 1.2.5.收集。屏幕上每次只呈现实验句的一个词(实验1)、部分(实验2)或整个句子(实验3)。受试读完后按鼠标阅读下一个词、部分或者句子。下一项目出现时，前一项目随即消失。每个实验句后都有一个与句子内容相关的问题。受试按“y”键回答“Yes”，按“n”键回答“No”。

实验2里采用部分-部分的呈现方式。词串/非词串之前为第1部分，包含2到3个单词；词串或非词串本身为第2部分，包含4到5个单词；其余的语句为第3部分，包含2到3个单词。句(3)到句(5)分别代表了实验1到3中实验句的呈现方式。有下划线的部分为词串/非词串部分，是实验的考察重点。而斜体的单词是每个词串/非词串部分的关键词。

实验1：词-词呈现

(3) a词串句： I — sat — in — the —middle— of — the — bullet — train.

Question： Did I sit in an underground train?

Answer： No.

(3) b非词串句： I — sat — in — the —front— of — the — bullet — train.

Question： Was he sitting in the train?

Answer： Yes.

实验2：部分-部分呈现

(4) a词串句： I sat — in themiddleof the — bullet train.

Question： Did I sit in an underground train?

Answer： No.

(4) b 非词串句： I sat — in thefrontof the — bullet train.

Question： Was he sitting in the train?

Answer： Yes.

实验3：整句呈现

(5) a词串句： I sat in themiddleof the bullet train.

Question： Did I sit in an underground train?

Answer： No.

(5) b 非词串句： I sat in thefrontof the bullet train.

Question： Was I sitting in the train?

Answer： Yes.

4. 研究结果

1) 实验1：词-词呈现

被试：前面提到的低分组20人，高分组20人以及本族语者20人参加实验1。

实验结果：本实验中，我们只考查词串及其对应的非词串部分的反应时间。只有当受试答题正确时，该句的反应时间才被保留，做下一步分析。超过受试所在组平均反应时间2.5个标准差的数据被剔除，各受试组被剔除的数据在高、低分组和本族语者对照组中各占2.41%、2.01%和 1.79%。1名低分组受试、2 名高分组受试因反应时间数据不完整也被剔除。最终各组的有效受试人数分别为低分组19名、高分组18名、本族语者20名。各组受试的平均反应时间和标准差如表1所示。

表1. 词-词呈现实验各组受试平均反应时间(单位：秒)

本实验中自变量为词串类型，有两个水平(词串和非词串)，这两个水平是相互关联的，即每个被试均接受两个水平的处理。本研究的因变量是反应时间。只有当被试答题正确时，该句的反应时间才被保留，用于下一步分析。我们采用配对样本t检验对各组受试分别进行统计分析。结果显示，低分组两种实验条件反应时间差异不显著(t1[18]=-.217,p>.05;t2[19]=-.205,p>0.05)[注]我们按照心理语言学的惯例汇报主体分析(Subject Analysis)结果t1和项目分析(Item Analysis)结果t2。,高分组两种实验条件反应时间差异不显著(t1[17]=.199,p>.05;t2[19]=.187,p>0.05)，本族人两种实验条件反应时间差异同样不显著(t1[19]=.413,p>.05;t2[19]=.397,p>0.05)。

值得注意的是，低分组被试非词串条件下阅读时间短于词串13毫秒(13ms)。虽没有达到显著水平，但同我们预期相反。高分组(6ms)和本族语者(11ms)非词串条件下阅读时间长于词串条件，同我们预期相同，但没有达到显著水平。实验1表明，二语学习者在词-词呈现实验条件下，处理词串和非词串两种情况的反应时间无显著区别。这种结果有两种可能的原因： 1) 他们还未具备相应的隐性词汇知识，无法在线上阅读的实验中应用或激活头脑中的词串知识，因此无法体现词串处理的优越性；2) 实验1采用词-词呈现的实验方式，而这种方式同我们的自然阅读方式不同，可能会妨碍受试者正常阅读实验材料，因此无法实现实验的预想。

本实验中英语本族语者同样没有表现出词串处理的优势，这一结果同Tremblay等(2011)的研究结果不同，与Schmitt和Underwood (2004)的研究结果一致。因此需要我们进行后面的实验继续进行考察。

2) 实验2：部分-部分呈现

在日常生活中，我们很少一词一词地去阅读句子。部分-部分的呈现方式体现出一种更为自然的语言处理方式。

被试：参加实验2的受试为没有参加实验1的低分组20人，高分组20人以及本族语者组20人。

实验结果：同实验1一样，我们只考查词串及其对应的非词串部分的反应时间。经过考察受试答题正确与否以及平均反应时间是否在2.5个标准差之内，各受试组被剔除的数据在高、低分组和本族语者对照组中各占1.42%、1.29%和1.07%。2名低分组受试和1名本族语者受试因反应时间数据不完整也被剔除。最终各组的有效受试人数分别为低分组18名、高分组20名、本族语者19名。各组受试的平均反应时间和标准差如表2所示。

表2. 部分-部分呈现实验各组受试平均反应时间(单位：秒)

本实验中自变量为词串类型，有两个水平(词串和非词串)，这两个水平是相互关联的，即每个被试均接受两个水平的处理。本研究的因变量是反应时间。只有当被试答题正确时，该句的反应时间才被保留，用于下一步分析。我们采用配对样本t检验对各组受试分别进行统计分析，结果显示：低分组两种实验条件反应时间差异不显著(t1[17]=1.557,p>.05;t2[19]=1.664,p>0.05)，高分组两种实验条件反应时间差异显著(t1[19]=2.181,p<.05;t2[19]=2.179,p<.05)，本族语者的两种实验条件反应时间差异同样显著(t1 [18]=2.626,p<.05;t2[19]=2.543,p<.05)。

实验2不同于实验1之处在于实验材料为部分-部分呈现方式，更接近自然的阅读方式。结果显示，低分组受试阅读词串部分快于非词串部分(100ms)，但差异未达到显著水平。因此我们仍然不能确定低分组受试是否利用了头脑中的隐性词汇知识。高分组(138ms)受试和本族语者受试(137ms)阅读词串部分快于非词串部分，且均达到了0.05的显著水平。证明他们在处理实验材料时，激活了头脑中有关词串的隐性知识，因此在阅读词串部分时能够节省处理资源。

同样，实验2体现出部分-部分呈现方式比词-词呈现方式更有助于阅读者提取并激活头脑中的隐性词汇知识，是更为自然的呈现方式。高分组和低分组在实验2中的不同表现证明，不同语言水平的二语学习者具有的隐性词汇水平不同，他们在阅读语言材料时的处理方式也存在差异。低水平学习者不具备高水平学习者的隐性词汇知识，因而不能够采用更有效的处理方式。

3) 实验3：整句呈现

被试：参加实验3的受试为没有参加实验1和2的低分组20人，高分组20人以及本族语者20人。

实验结果：经过考察受试答题正确与否以及平均反应时间是否在2.5个标准差之内，各受试组被剔除的数据在高、低分组和本族语者对照组中各占1.33%、1.29%和 1.15%。1名低分组受试和1名高分组受试因反应时间数据不完整也被剔除。最终各组的有效受试人数分别为低分组19名、高分组19名、本族语者20名。各组受试的平均反应时间和标准差如表3所示。

表3. 整句呈现实验各组受试平均反应时间(单位：秒)

本实验中自变量为词串类型，有两个水平(词串和非词串)，这两个水平是相互关联的，即每个被试均接受两个水平的处理。本研究的因变量是反应时间。只有当被试答题正确时，该句的反应时间才被保留，用做下一步分析。我们采用配对样本t检验对各组受试分别进行统计分析，结果显示：低分组两种实验条件反应时间差异不显著(t1 [18]=1.098,p>.05;t2 [19]=1.113,p>0.05)，高分组两种实验条件反应时间差异显著(t1 [18]=2.237,p<.05;t2 [19]=2.241,p<.05)，本族语者两种实验条件反应时间差异同样显著(t1 [19]=3.044,p<.01;t2 [19]=3.101,p<.01)。

实验3采用整句呈现的方式，是最为自然的实验条件。本族语者受试两种实验条件反应时间差异(404ms)达到了.01的显著水平，这同Tremblay等(2011)的研究结果一致，验证了词串作为一个整体，在语言线上处理时具有的心理现实性。高分组受试在.05水平上体现出了显著差异(637ms)，虽然没有本族人受试体现出的差异明显，仍证明他们具备了相应的隐性词汇知识。这一点也将他们同低水平组(386ms)区别开来。

5. 讨论

1) 线上阅读研究中实验材料的呈现

线上阅读作为心理语言学里常见的一种实验方式，出现在很多研究中，主要考察受试实时处理语言材料时采用的处理和分析机制。采用怎样的语言材料呈现方式一直以来都是一个在探讨的问题。究竟是采用词-词呈现，部分-部分呈现，还是整句呈现，同实验的研究目的息息相关。

本研究的重点在于考察词串效应在二语学习者和英语本族语者实时处理语言材料时的心理现实性。结果表明，词串效应的强度随着语言材料呈现方式的变化(词-词呈现，部分-部分呈现，整句呈现)而逐渐增强。在这种变化过程中，受试者有更多的机会利用预期来跳过某些单词。在词-词呈现的实验中，受试被迫要关注每一个单词；而在后面两个实验中，受试者能够利用预期跳过某些单词，加快处理的速度，而这种情况在整句呈现的实验3里得到了最充分的体现。本族语者和高水平组受试在词-词呈现方式下，没有体现出词串效应。但在部分-部分呈现和整句呈现的条件下，他们处理词串的速度要明显快于处理非词串的速度，验证了词串效应的心理现实性。本研究的结果表明部分-部分呈现和整句呈现是更为自然的阅读方式，有助于受试应用和激活头脑中的相应机制，对语言材料进行更为有效的处理。

同样，在词-词呈现的实验1中，受试需要阅读每个单词后按键。因此按键次数要多于其他两个实验，这也许是词串效应不明显的原因。按键次数对于实验结果究竟有多大的影响，还需要以后的研究进行考察。

2) 词串效应在本族语者和二语学习者的心理现实性

同Tremblay等(2011)的研究结果一致，本研究证实了词串效应在本族语者中的心理现实性。在我们的实验材料中，尽管非词串部分在长度上短于词串部分，且关键词(pivot word)在频率上高于词串部分的关键词，但本族语者受试仍更快地处理含有词串的语言材料。他们在实时处理语言材料时，能够应用相应的处理机制，证明了词串效应的心理现实性。

二语学习者的情况要更为复杂一些。高水平的学习者同本族语者一样，体现出词串效应；低水平学习者虽然处理词串部分时间上短于非词串部分，但差异不显著。不同于以往研究过的习语和固定搭配(Schmitt & Carter, 2004; Sonbul & Schmitt, 2013; Wolter & Gyllstad, 2013)，词串在结构上不完整，也没有约定俗成的意义，但高水平二语学习者的表现说明，他们能够像本族语者那样，将词串作为一个整体进行存储和提取，这一点也将他们同低水平二语学习者区别开来。

3) 对二语习得研究和二语教学的启示

本研究证明，词串虽然结构上不一定完整，但由于频率高，因此在语言处理中有一定的作用。这种将词串作为一个模块进行存储和提取的能力是一种实时语言处理的能力，是一种隐性的词汇知识。不同于显性词汇知识，隐性词汇知识是在语言使用过程中处理语言材料的一种机制。在本研究中，高水平的二语学习者能够在实时语言任务中，提取并激活头脑中的相关词汇结构，从而有效地处理含有词串的语言材料，这也为二语习得中的隐性词汇知识提供了证明。而词串的准确有效使用有助于二语学习者更熟练地掌握目标语，达到或者接近本族人的语言水平。本研究的结论有利于引导更多的研究者从事隐性词汇知识的研究。

我们在二语教学中大多主要帮助学习者获得显性语言知识，但长期以来，我国外语教学普遍割裂了外显学习(explicit learning)与内隐学习(implicit learning)的联系(阳志清等，2006： 25)，对于学习者能否获得隐性知识并不关心。本研究表明，隐性知识相对于显性知识，在语言处理过程中更为重要。正因为词串在语言处理中的独特作用，我们在二语教学中应当有意识地帮助学习者学习这些高频词串。通过不断的语言输入和输出的练习，帮助学习者逐步形成隐性的词汇知识，培养学生的目标语语感(戴雪梅，2005： 51)。

4) 本文的不足之处

本研究在实验设计上的不足之处是我们无法保证所有的目标结构都满足词串的结构不完整特征。比如实验句“If workers don’tworryabout it nothing will happen.”中的目标结构“don’t worry about it”便是一个结构完整的词串。我们的理想状态是所有目标结构都是结构不完整的词串，因为这样的结构会更有说服力，然而这个理想状态确实很难办到。事实上，结构完整的词串在各种口语和书面语语料中也有一定的分布(Biber, 1999)。这一点还需要今后的研究加以改进。

此外，本研究并未考察呈现方式和英语水平之间是否有交互作用，因为本研究的三个实验分别考察三种呈现方式(词-词呈现，部分-部分呈现，整句呈现)，虽然有一定联系，但是彼此独立的，参与3个实验的被试也不相同。今后的研究应通过实验设计的改进对这种交互作用进行探讨。

6. 结语

我们的研究结果表明，本族人语言使用者的大脑将词串作为一个整体进行存储和提取，支持了Biber等(1999)关于词串是一个词汇单位的说法，证明基于频率的词串在语言处理中发挥着特殊的作用。一些学者(Jiang & Nekrasova 2007)指出语言的结构单位不仅仅包括词素(morphemes)，简单词汇(如skate, black, board)，复合词汇(如skater, blackboard),习语(如by dint of, by the skin of his teeth)，还应当包括词串(如in the middle of the)这种基于频率、结构不一定完整的语言单位。我们如何将词串同其他语言单位进行区别，如何构建更全面完整的语言单位体系，很值得进行更深入的研究。

本研究对二语习得者的词汇处理进行了探讨，发现高低两个水平组表现不同。我们认为，高水平学习者在学习过程中有着更多的输入和输出的练习，因而能够具备相应的隐性词汇知识。但是，相关研究仍很少，究竟如何培养二语学习者的隐性词汇知识，如何培养学习者的内隐学习能力，还需要研究者进行更多的探索。