周思佳
(南京师范大学 文学院,江苏 南京 210097)
词汇的习得是人类语言习得的一个重要步骤,在研究词汇习得的过程中,许多研究者都不约而同地把目光投向儿童早期出现的词汇飞跃现象。词汇飞跃(vocabulary spurt,word spurt或vocabulary explosion等)是词汇发展的里程碑,它表现为儿童在独词阶段后期出现的词汇快速增长,此时儿童的年龄约为一岁半,其词汇量大致达到50-100个 (曾涛,2012)。
词汇飞跃对语言能力具有非常重要的影响。其一,按Janette Chow等(2017)的说法,在词汇飞跃期间,儿童词汇-语义系统中新增的词汇知识是语义抑制机制出现的重要动力。在心理词库中加工大量单词很可能使孩子无法良好地建立单词之间的联系,语义抑制可以帮助儿童抑制自身关注与当前无关的信息,这就使得儿童在早期能够更有效地进行学习。其二,Meaghan V.Parladé和 Jana M.Iverson(2011)认为词汇飞跃与儿童的交际协调有关。所谓交际协调即表情、手势与语言等的协调配合。他们通过录制18名儿童在词汇飞跃之前、期间以及之后的表现,发现在词汇飞跃期间儿童交际行为的整体协调度下降。此外,词汇飞跃还关系着儿童认知能力的发展,因此,对词汇飞跃现象进行研究具有特殊的认知意义(曾涛,2015)。
目前对词汇飞跃的研究主要集中在国外,国内的研究较少。就汉语词汇发展的研究现状而言,以往研究主要关注早期词类分布、发展趋势和使用频率(曾涛,2014)。本文对自2008年以来国内外研究词汇飞跃现象的文章进行综述,内容包括词汇飞跃现象的证据和成因。
对于词汇飞跃现象,不少学者都注意到它的存在并予以记录,但关于该现象是否具有普遍性的问题一直存在争议。为此,以下学者提供了证明。
Frédéric Dandurand和Thomas R.Shultz(2010)采用了一种数据分析方法,即自动最大值检测(Automatic Maxima Detection,简称AMD)来考察词汇飞跃现象是否存在。自动最大值检测是一种自动测量变量或其他导数函数的最大值的技术,增长飞跃以变化率的局部增加为显著特征,它在时变测度的一阶导数中为最大值。研究者将AMD方法应用于一个在线数据库中20个孩子的数据。在这些孩子出生的第二年,父母列出了孩子每天使用的词汇及其出现的语境,包括先前就被使用过的单词,语言模仿行为被排除在外。最终结果发现,20名儿童呈现出多样化的词汇飞跃,不过他们的词汇飞跃在数目、出现时间和幅度上都存在明显不同。
Galeote et al.(2011)进行了一项横向比较研究。他将患有唐氏综合症的儿童和心理年龄与之匹配的正常儿童进行比较。参与实验的正常儿童被分为7组,年龄分别为9、12、15、18、21、24和27个月。 他们观察到,在其心理年龄为18和21个月时,口头词汇的急剧发展紧随早期的渐进发展之后。这种发展模式不仅存在于正常儿童之间,患有唐氏综合症的儿童也呈现出相似的发展模式。
Hernández Padilla,Eduardo y Alva Canto和 Elda Alicia(2015)对8名儿童在日常活动中产出的口头话语进行了记录和分析,每周一次,历时16个月。他们把这些儿童分成两组:高产出儿童与低产出儿童。从第27/28个月开始,研究者发现两组儿童的回应模式存在区别,这说明他们运用不同的词汇学习策略。同时实验结果证实了词汇飞跃现象的普遍存在。
在对26名患有唐氏综合症的儿童进行的实验中,Danielle te Kaat-van den Os,Chiel Volman,Marian Jongmans以及Lauteslager(2017)发现了三种不同类型的词汇发展模式:最低限度的词汇增长;无飞跃式的词汇增长;飞跃式的词汇增长。这些儿童的年龄为18—24个月,实验时间为18个月,每月进行测量。研究者使用Lexi问卷对词汇发展进行检测。Lexi问卷是一份以语言发展调查为基础的荷兰问卷,也是一种用于检测儿童表达的父母报告工具。这份问卷包含263个词汇和11个句子,通过年幼荷兰儿童的早期语言发展情况得出。除此之外,父母还被要求记录孩子产出的Lexi问卷未曾提及的单词。他们界定词汇飞跃的条件是:在连续两个月内至少出现20个新单词;这两个月的平均词汇增长率超过先前四个月平均词汇增长率的两倍。
而Sissal M.Rasmussen和Dorthe Bleses(2018)在对法罗儿童所进行的词汇习得横向比较研究中,也发现了儿童产出词汇量的飞跃。他们采用MacArthur-Bates交际发展目录(MBCDI)让父母填写相应报告。实验数据以在线收集的方式进行,包含1135名儿童的数据,其年龄范围为8-36个月。在实验过程中,父母分别记录儿童能够理解的单词和能够产出的单词。研究显示,法罗儿童经历了词汇增长的飞跃期,这些飞跃期出现的时间有所不同,大致出现在孩子16-18个月大时,最晚的出现在20个月大时。
以上实验均采用了父母记录或父母报告的方式收集数据。由于此种方式所采集的样本量较大,因此能够有效确保实验的合理性和可靠性。其中,部分实验还采用了标准条目予以辅助,如Lexi问卷和MacArthur-Bates交际发展目录。标准条目的优点是能够帮助父母梳理所观察到的词汇,以及提醒他们一些儿童常用的但容易被忽视的词汇。然而与此同时,父母记录或报告的方式也存在明显的缺点。早期词语反映了儿童当时的语言水平,其语言面貌并非完全与成人一致,例如可能存在发音近似于成人表达或具有潜在意义的儿童词语。与专业观测人员不同,父母可能缺乏相关专业知识来辨别可能的早期词汇。此外,由于观察角度、记录持续性等的不同,不同父母的记录结果可能存在相当大的差异,这将直接影响实验结果。
关于词汇飞跃现象的成因,不少学者从各自的角度提出了多样化的解释。本文主要从认知学和语言学两个方面进行介绍。
Julien Mayor和Kim Plunkett(2008;2010)呈现了早期词汇习得的模型。他们认为,主要有两种因素促成了儿童早期的词汇习得:范畴能力和共同注意活动。早先建立的范畴能力是词汇习得的先决条件;共同注意活动的数量与儿童整体的词汇量相关。在这两种因素的作用下,词汇的习得速率会大大提高,但潜在的神经机制并没有发生变化。
在早期词汇发展中,儿童利用范畴能力帮助他们习得和扩充词汇。通过范畴划分,儿童开始学习对不同事物进行分类并逐渐形成对事物的概念。曾涛和邹晚珍(2012)利用个案跟踪语料考察了汉语儿童的范畴层次词汇发展情况。研究记录了两名长沙儿童两岁前名词产出中各类范畴层次词汇,特别是基本层次词汇的发展情况。语料由两位专业研究人员收集,采集密度为每周1次,每次持续约1小时。研究结果发现,两名儿童名词层级的发展主要表现在下位词的逐渐增加,均出现在17个月左右。下位词的增长时间与词汇飞跃期非常接近,也就是说,儿童下位词的增加很可能是其词汇量飞跃的直接原因;而下位词增加则是范畴划分能力提高的结果。
曾涛(2015)还考察了其他可能导致词汇飞跃的因素:命名洞察力。研究者从儿童命名洞察力发展的角度来探讨词汇飞跃背后的原因,主要基于两个考虑。首先,在儿童早期习得的词汇中,表示物体类别的词占了最大比例,由于命名洞察力是指突然意识到每一个物体都有其相对应的名字,那么命名能力的迅速提高很可能是物体类别词汇迅猛增加和词汇飞跃突显的一个关键因素。其次,儿童交际或名词记忆等方面的能力可能和其早期的语言同时发展,且它们可能是儿童语言发展的伴随结果。由于只有命名洞察力是一种快速获得语言符号的能力,因而这种能力最有可能引发儿童词汇量的剧增。
曾涛采取的研究方式是个案跟踪和控制实验手段。个案跟踪记录了五名长沙儿童在1—2岁期间语言发展的情况,五名受试的语料由专业人员收集,采集密度为每周1次,每次约为1小时。该研究对命名洞察力的考察主要参照儿童对“什么”问句的言语反应和自发命名,其中对前者的判断标准是儿童的语言回应与该问题所需达到的相关句法范畴、语义特征或信息内容的要求相契合,而后者的标准则是儿童在自然语境中自发而非模仿的语言产出。个案研究表明,儿童在75周(18个月)之前,每月新习得的词汇量均小于15个,而75周之后,他们都经历了一个词汇飞跃的阶段;与此同时,他们在第73周前对“什么”问句的言语回答非常少,从第75周左右开始,儿童得体的言语回答次数迅速增加。可见,这一时期儿童的语言发展经历了一个质的飞跃,他们可能突然意识到词汇可以匹配到对应的指称物。
由于个案跟踪的语料偏重语言产出,很难测试儿童对早期词汇的理解,因此研究者还通过控制实验采集数据,以进一步考察儿童命名洞察力的发展情况。控制实验共收集了100名12—24个月大的儿童的数据。首先,研究者参照《汉语沟通发展量表》(2008),发给受试父母问卷,获取不同年龄段受试儿童的产出词汇量。接着,研究人员对受试进行单独语言测试,并记录其产出情况。研究采用图片命名的方式测试汉语儿童对“什么”问句的回答以及完全模仿和选择性模仿的情况。结果表明,儿童在75周之前,词汇量小于10个,而75周之后,他们都经历了一个词汇飞跃的阶段;与此同时,他们在50周时“什么”问句的言语回答数为0,从第64周开始,正确回答的次数才迅速增加,达到3.8,到75周时平均值已达10.7。可见,75周左右是儿童命名能力快速发展的时期,此时儿童对成人问句的回答次数急剧增加,他们迅速意识到词语可以用来指称事物。
可以看到,无论是个案研究还是控制实验,其结果都表明词汇快速增长的时间和命名洞察力出现的时间具有同步性。曾涛认为,由于词汇飞跃更多地表现为一种外在现象,而命名洞察力是一种内在能力,外在现象通常是内在能力的某种表现,内在机制对语言习得起更为关键的作用。因此,是命名洞察力很大程度上促进了词汇飞跃的出现。就该研究中的受试儿童而言,正是由于受试儿童在18个月左右获得了命名洞察力,他们才在这一时期经历了早期词汇的快速增长。
此外,上文提到的Danielle te Kaat-van den Os等人(2017)对患有唐氏综合症的儿童所进行的实验还利用Bayley-III-NL考察了被试儿童的认知水平。Bayley-III-NL是一种设有参考依据的标准化工具,用于评估1—42个月大儿童的总体发展,包含三种刻度:认知刻度、语言刻度及运动机能刻度。该研究仅使用了Bayley-III-NL的认知刻度。他们发现,拥有最低限度词汇增长的孩子的平均认知刻度分数明显低于另外两组孩子的刻度分数,说明有更高认知水平的孩子表现出更大的词汇增长。
Colleen C.Mitchel和Bob McMurray(2008)通过引入随机模型来解释词汇飞跃为何产生。McMurray(2007)早先设计了一个原始模型,具体操作如下:首先,模型中的每个单词都被赋予一个难度值Di(Di以习得时间来衡量);接着,在每个时间段内,模型为每个未被习得的单词累积一个点,当这个未被习得的单词跨越其阈值后,它就算被儿童成功习得。通过建构该模型,McMurray得出结论:只要单词是以并行的方式学习的,并且容易的单词比中等难度的单词少,词汇飞跃必然发生。这个模型表明,不再需要任何专门的词汇学习机制来解释词汇增长的加速。此后,Colleen C.Mitchel和Bob McMurray(2008)对原模型进行扩展,他们引入了该模型的一个随机版本,结果再次证实了McMurray(2007)的观点。
关于词汇飞跃产生的原因,还有一种解释是早期习得词汇的有关知识将有助于新词汇的学习,这也被称为影响学习。根据这种理论,儿童最初是不认识任何单词的,因此学习进程非常缓慢;但随着儿童习得越来越多的词汇,新单词的学习变得愈发简单,是早期习得词汇促进了学习的加速。 Claire Delle Luche,Samantha Durrant,Caroline Floccia和Kim Plunkett(2014)也通过考察发现,儿童可以提炼口头词汇的含义,并且对单词间的语义联系非常敏感。他们认为,在儿童进入词汇飞跃阶段之前,他们就已经开始建立基于分类联系的语义系统雏形。
事实上,已提出的一些机制就属于影响学习机制的范畴,例如通过互斥性形成的快速映射能力。根据这种主张:让孩子们面对几个他们知道名字的物体和一个不知道名字的物体,在听到一个新单词后,他们通常会利用自己对某些已有名称对象的知识,来选择未命名的对象作为指示物。这为词汇的加速习得提供了一种解释:随着儿童知道的名称越来越多,它们出现在合适情景下的可能性也就越大。此外,在词汇飞跃之前和之后都观察到了快速映射,这表明快速映射导致的加速是基于影响作用,而不是突然发生。
Julien Mayor和Kim Plunkett(2010)也持有类似的观点。他们提出内在因素是词汇飞跃的主要原因。其中,快速映射的出现可以解释儿童出生第二年后习得速度加快的原因。并且他们还通过考察排除了几个无关因素:单词频率、单词长度以及语音复杂度。根据两人的观点,自然语言中单词频率的分布类型无法导致词汇飞跃现象的产生;单词长度也并非必要因素;而语音复杂度同样不适用于解释词汇飞跃现象的成因。
影响学习并不局限于互斥性理论,对话语的切分也属于影响学习的范畴。除了早年提出的有关研究外,近些年,Robert E.Owens(2011)指出:对言语的切分,或者将程式语分解为几个部分,与大约20个月大的儿童的词汇激增是一致的。所谓程式语,是指在日常对话中经常被使用的口头表达或未经分解的语块。作为记忆单元,程式语通常以完整的话语形式发挥作用。例如,一个孩子可能会多次使用“See ya,bye!”来结束与他人的互动,但他从不使用该表达中的单个单词。对一些孩子来说,程式语代表了一种从整体到部分的学习策略。当然,虽然程式语有助于最初的词汇增长,但儿童如果不进行切分也可能会限制其语言的发展。
关于影响学习与词汇飞跃之间的关系,Colleen Mitchell和Bob McMurray(2009)曾采用建模的方法进行考察,他们得出不同的结论。在模型中,他们把早期习得单词存在积极作用或消极作用的情况纳入考虑。具体方法如下:每当一个单词被习得,就增加积极/消极因子C,使得剩余单词所积累的知识被轻微地调整。如果C是正数,那么每当一个单词被习得,剩余单词所积累的知识就增加,这将为影响学习理论提供支持;反之,如果C是负数,这就模拟了干扰,即每个单词会降低新单词的习得速度。最终结果证明,影响学习虽然能够改变词汇加速增长的时间和形态,但并不能造成词汇飞跃现象的产生。另一方面,儿童确实存在此类行为并且有诸多证据提供支撑,因此这似乎表明,影响确实是学习的一个组成部分,但它不是加速词汇习得的基础。也就是说,两者之间并不存在因果关系。
Ping Li和Xiaowei Zhao(2013)利用DevLex-II模型探索了词汇飞跃现象。为了提供对词汇飞跃现象的计算解释,Li等人(2007)训练了一个DevLex-II模型来学习从幼儿的CDI词表中提取的591个英语单词。该模型包含了词汇发展过程中学习和表达的几个关键特征,包括多个用于模拟对同一项理解和产出的SOM模型,以及词汇项的真实语音和语义输入模式。根据Ping Li和Xiaowei Zhao,词汇量快速增长阶段的出现可能是由于模拟网络对音位序列、单词语音和语义的结构化表达的缓慢学习,以及对词汇这些特征之间的映射的学习。此外,模拟结果表明,词的频率越高,或词的长度越短,词汇飞跃出现的时间越早。
从以上研究中我们可以看出,认知学的解释和语言学的解释互相交叉,难分难舍。要想对词汇飞跃现象作细致全面的讨论,离不开各行各业的探索。同时我们也可以看到,词汇飞跃是各种因素综合作用的结果,这可能是一个非常复杂的过程。虽然不同学者从各自领域提供了专业化的分析,但总体而言还存在一定局限。
首先,对于语料的采集,曾涛(2012;2015)采用了个案分析的方法。语料由受过训练且熟悉被试儿童的专业人员采集,采集频度为每周一次,每次一小时。相较于父母记录的方式,这种方式的优点是保障了采集语料的正确性。但与此同时,也可能出现遗漏语料的情况。其次,国外许多学者纷纷利用建模的方式,试图对词汇飞跃现象进行解释。这为我们提供了具有可操作性、可验证性的可视化步骤。但另一方面,模拟结论很大程度上依赖于模型本身,错误模型的运用或错误参数的选择都有可能导致错误结论的产生。以至于我们看到,在以上研究中就有不同研究者得出了截然相反的结论。此外,大部分学者着重于对产出词汇的飞跃研究,只有少部分学者探讨了理解词汇是否同样也存在飞跃现象的问题。这部分研究表明,无论是儿童早期所理解的词汇,还是其能够产出的词汇,都存在飞跃的阶段;并且,所理解词汇的飞跃时间往往早于所产出词汇的飞跃时间,这或许能为儿童对词汇的理解通常先于产出提供证据。最后,不同研究先后证明了影响词汇飞跃的因素,但值得注意的是,有关系并不意味着存在因果关系,如何保证该因素能够解释词汇飞跃现象为何出现,还需要更加谨慎地对待。
我们不妨猜想还有其他因素也可能导致词汇飞跃现象的产生,例如感知能力、运动机能、注意力、记忆力的发展等。虽然此前也进行过一定的研究,但随着专业化技术的进步和新的理论成果的取得,对于这部分的考察也应当重新被纳入考虑。
儿童早期的词汇飞跃现象对于语言的发展具有重要作用,它不仅是词汇的飞跃,也为句法、语义的发展做了准备。对该问题的研究将有助于我们理解儿童语言习得的相关问题。它需要我们从认知学、语言学、神经学、心理学等多角度进行探索,而伴随各学科理论和技术的进步,该问题的研究也将因此受益。