马宇石,曹迎,方玉琼,周文婷,武子祺,顾介鑫,2
作者单位:1.江苏师范大学语言科学与艺术学院,江苏徐州221009; 2.语言与认知神经科学江苏省重点实验室,江苏徐州221009
口吃是一种常见言语障碍,世界卫生组织(World Health Organization,WHO) 1977年将口吃定义为一种言语节律障碍,在说话过程中口吃者知道自己希望说什么,但却因为不随意的音节重复、停顿、延长以致在表达时出现困难。Beitchman等[1]发现学龄前儿童口吃患病率为2%,大约80%口吃的学龄前儿童能自行痊愈,但另一部分儿童则会将口吃延续到成年。Prasse等[2]进一步指出口吃按其成因不同可分为获得性口吃和发展性口吃两类,前者由脑损伤引起;后者指儿童时期出现并且持续到成年仍不能恢复的口吃,且随时间增长,口吃症状严重并出现伴随性动作。本研究主要关注发展性口吃(下简称口吃)。
细缕口吃发生原因的研究,1993年Postma等[3]提出口吃者话语出现中断系缘于言语计划阶段词汇选择时激活的词条过多,无法有效选择目标词条(lemma)。1997年Smith等[4]发现口吃的发生频率跟所产出话语的长度及语法复杂度相关,并在口吃多因素模型中指出口吃成因不能归结于某一单独因素,即口吃是说话者言语监控系统不利或某些言语功能缺陷导致的。与之相似,2000年Anderson等[5]也认为语音编码并非导致口吃的唯一因素,口吃者在句法编码、词义提取、语音编码和运动执行等方面都可能存在缺陷。就已有实验研究来看,Byrd等[6]、Weber-Fox等[7]证实口吃者确有语音编码缺陷;但也有研究反对语音编码缺陷,Melnick等[8]、Pellowski等[9]、Hartfield等[10]即认为口吃者有词义提取缺陷。因此,Smith等[11]指出大多数口吃研究均认为口吃不能用单因素理论来解释。
就现有研究来看,口吃产生原因的多面性,除了言语产出中涉及句法、语义、语音等因素,还可能与个体差异(或者说不同的口吃亚型)有关。例如,Andrew等[12]即较为全面地总结了1995~2016年发展性口吃神经影像学研究,区分不同技术手段(功能性核磁共振成像、脑电图、脑磁图和经颅磁刺激等)和不同口吃人群(成人、儿童),总结得出该特殊人群在言语任务和非言语任务中成人和儿童口吃者均表现出大脑结构和功能上的异常。但该综述缺乏从语音、句法和语义等语言学视角的分类总结。李德高等[13]虽大概总结了成人口吃者的语义、句法和语音加工的异常情况,但缺少儿童口吃、国内口吃研究的介绍。
需要指出的是,虽然Juste等[14]发现年龄阶段(儿童、青少年、成人)不影响口吃者言语不流畅程度,Khodeir[15]也指出口吃的发病年龄与口吃的严重程度无关;但从语言知识来看,儿童与成人一般在量和质上均存在差异。因此,下文将区分儿童与成人(在有相应研究分类的情况下),从语音、语义、句法三个方面,言语产出和理解两个角度,以系统地归纳出汉语发展性口吃语言障碍的原因。陈莹等[16]总结了发展性口吃的物理治疗方法,包括电刺激治疗、磁刺激治疗和生物反馈治疗等。这些物理疗法一般是通过兴奋或抑制某一语言功能脑区的功能,使得口吃者原本异常的脑激活模式趋近于非口吃者,从而达到口吃矫治目的。但语音、语义、句法的脑功能区分布不一[17],从“精准”口吃矫治要求来看,细化到不同语言部门的口吃探因研究亟需进行。
1.1 语音产出研究 从不同的影响因素出发,研究者提出多种口吃者言语编码的理论模型,并从不同角度分析口吃者言语编码的缺陷。下文将先介绍两种较为常见的口吃言语编码障碍的理论模型,便于后续介绍相应的汉语发展性口吃研究。
1.1.1 语音产出异常理论模型 ①内隐修复假说:内隐修复假说(covert repair hypothesis, CRH)由Postma等[3]提出,是针对口吃的最具有影响力的心理语言学模型。这一假说以Levelt言语产出模型为基础[18],认为口吃产生的原因是口吃者正确计划言语的能力受到损伤,主要表现为在语音编码过程中反复修复错误而导致口吃。在语音编码中,片段(音素)被选择出来构成音节,几个片段可能竞争一个特定的音节槽,被最大限度激活的音节将会被选择。在口吃者中,语音片段激活扩展得比非口吃者慢,竞争同一音节槽的几个音节成分在同一水平上激活需要更长的时间。同时,说话者又希望以“正常”的速度说话,这就增加了片段误选的机会。言语监控器在片段被发声之前探测到并纠正错误,这种内隐的修复错误干扰了正常语流并表现为不流畅。据这一解释,言语声音的重复、延长、停顿是言语计划中内隐修复错误的副产品。②执行和计划模型:Howell等[19]提出执行和计划模型(the execution and planning model, EXPLAN)。该模型把知觉系统和言语系统看作是独立的,言语计划和执行分别反映在语言层面和运动层面两个平行且相互独立的处理过程。与Levelt言语产出模型相反[18],EXPLAN模型将从执行产出向中央控制系统以及修正和再启动言语计划这一反馈回路排除在外。有时,只有部分语言传递计划能在执行前准备好,此时说话者会继续运用部分计划尝试说话。据EXPLAN模型,如果执行的时间足够长,那么言语计划系统可以在当前语言片段执行结束时准备好下一语言片段,从而达到流利地表达。而当计划过程处理速度相对慢于执行过程时,就会导致这两个过程协作失调,引发言语不流畅行为,即口吃者的不流畅言语是因为言语计划和运动执行的协作失调时所采取的补救措施的表现。此外,该模型还指出实词的语言特征(包括意义、语用色彩、发音等)比虚词复杂,其所需的计划时间也相对较长;当前一语言单位执行完成,后面的实词计划还未完成,说话人就会通过停顿或重复前面相对简单的虚词来延长这一实词的计划时间,因此尽管是虚词被重复,但实际计划失败的是实词。以上两个心理语言学模型都认为口吃产生与口吃者自身言语计划不足相关。但是,内隐修复假说认为言语产出过程存在监控机制;而执行与计划模型则不支持这一观点,它认为口吃的产生是由计划和计划执行时的不同步导致的。
1.1.2 汉语口吃语音产出研究 目前,汉语口吃的语音产出研究主要集中于成年口吃。一些研究支持EXPLAN模型。徐杏元[20]通过语音启动命名(出声说出)任务,着重考察汉语音节中韵母的语音编码能力,发现相较于非口吃者,口吃者命名目标字的反应时更长,在目标字前呈现的韵母不同的音节时(有认知压力)更容易出现错误,表明所受的阻碍作用更大。柳安坤[21]在句子阅读中采用眼动追踪(eye-tracking)技术,通过眼音距(eye-voice span, EVS),即朗读句子时仪器记录到眼睛注视点时间点至受试者发音之间的时间长度,考察口吃者言语计划单元的问题。结果发现,相比非口吃者,口吃者对朗读材料的加工效率较低,在每次眼跳前的注视中获得的信息相对较少,需要更多小的言语计划单元来完成对阅读材料的言语加工;但在默读时却无显著差异。肖二平等[22]采用外显发声任务,分两种条件朗读不同语音复杂度的句子(绕口令句vs非绕口令句;声母绕口令vs 韵母绕口令):限时条件下要求受试者尽可能快地朗读;而不限时条件下要求受试者尽可能流畅且准确地朗读。结果发现,口吃发生频率在限时条件下高于不限时条件,朗读绕口令句高于朗读非绕口令句,且朗读声母绕口令句高于朗读韵母绕口令句,这表明时间压力、语音复杂性均影响口吃者句子水平的语音编码。另一些研究则支持CRH模型。张积家等[23]同时对声母、韵母、声调进行考察,通过不出声地命名图片的同时进行语音监控实验(即判断图片名称相应音节的声母/韵母/声调,与听觉呈现的声母/韵母/声调是否一致),发现口吃者对声母的监控与非口吃者相比无显著差异;但在监控韵母、声调时,口吃者的反应时显著长于非口吃者。不同于上述研究关注音节内构成,岳源等[24]关注音节水平的音段编码,采用图片-词汇干扰实验范式,通过对图片即时命名、延迟命名任务,考察口语产出中音节和(音节下)音段在单词语音编码的不同阶段。结果发现,与图片同时呈现的词,对说出图片名的促进效果发生于口语词汇产生中的音韵编码阶段(音节下水平);对说出图片名的抑制效果则可能发生于语音编码发音阶段(音节水平)。值得注意的是,CRH模型在儿童口吃研究中受到了质疑。赵黎明和刘奕伶[25]关注儿童口吃者在言语产出中抑制能力是否正常,该研究采用心理学实验中常用于抑制能力研究的、出声反应的 Go-Nogo任务,通过降低 Nogo刺激(不同于Go刺激,Nogo刺激需要受试者反应)数量占比来增加反应抑制的难度,检验口吃儿童在言语产生中的抑制控制是否存在异常。结果发现,汉语口吃儿童与非口吃儿童相比抑制控制能力相当,作者认为口吃儿童在言语产出时对发音运动的反应抑制不存在缺陷。
1.2 语音感知研究 一般来说,言语产出在一定程度上受制于言语理解的水平。在语音感知研究中,CRH模型在音段感知上得到了证据支持,在音段边界感知上却迎来相左的实验证据。就成年口吃者的言语理解研究来看,在音段、超音段语音感知上,有研究发现汉语口吃者异常于非口吃者。李纪桥[26]采用功能性磁共振成像(functional Magnetic Resonance Imaging, fMRI)技术,通过听觉语音感知判别任务范式,发现成年口吃者在判别音段(声母、韵母)时,相比非口吃者右半球有更强激活,但在判别超音段信息(声调)时,却未发现类似于非口吃者的双侧额内侧回激活;且口吃者对声母、韵母、声调感知判别的正确率均显著低于非口吃者。作者认为口吃者在语音感知上即存在困难,脑区激活差异所反映的脑功能异常可能是其背后的原因。但在音段边界感知上,有研究却发现口吃者与非口吃者相似。李卫君等[27]采用事件相关电位(event related potential, ERP)技术,通过词汇判断、短语结构判断两种任务,考察口吃者加工听觉呈现的歧义短语(动宾/偏正歧义结构)内部韵律边界的感知,发现在反映韵律切分的闭合正偏移 (closure positive shift, CPS) 这一脑电成分上,口吃者与非口吃者相比不存在显著差异,作者认为口吃者对口语韵律边界感知无缺陷。
2.1 语义产出研究
2.1.1 儿童口吃 从Levelt词产出模型来看[18],语义准确提取是言语产出的关键环节。Pellowski等[9]评估了词汇语义启动对英语口吃儿童图片命名任务中言语反应时的影响。在这个任务中,受试儿童在三种不同条件下看相同的一组图片:①无启动,即在目标图片显示前无语音提示;②语义相关启动,即在目标图片显示前听觉呈现语义相关的单词;③语义不相关启动,即在目标图片显示前听觉呈现语义不相关的单词。结果发现,与无启动条件相比,在图片命名前呈现语义相关的单词会导致非口吃儿童命名的反应时更短;但口吃儿童却没有表现出类似的促进效果。作者推测口吃儿童可能在词编码的语义提取方面存在缺陷。在国内,廉淼清[28]研究了词汇选择的计划广度(即人在开始发音之前对想要表达的内容进行词汇选择的范围)对儿童口吃的可能影响。该研究以语义组块抑制效应为观察指标,考察口吃儿童在产生并列名词短语(“N1和N2”,N为名词)时词汇选择的计划广度。所谓语义组块抑制效应[29],指受试者在说出系列呈现图片的名字时,语义同质条件下(系列图片之间语义相关)图片命名反应时长于语义异质条件(系列图片之间语义无关),出现语义抑制效应。结果发现,非口吃儿童在并列短语的第一个名词(N1)产出上即发现语义组块抑制效应,而口吃儿童却没有。作者认为这表明非口吃儿童在并列短语产生过程中词汇选择计划广度覆盖了第一个名词(N1),而口吃儿童词汇选择计划广度小,未覆盖第一个名词;词汇选择计划广度小是儿童口吃的原因之一。需要指出的是,与国外研究相比,汉语儿童口吃尚欠缺直接针对词编码的研究。
2.1.2 成人口吃 当口吃者成年后,在言语产出中是否依然存在语义加工缺陷?若存在,该语义加工缺陷在言语产出中的哪一阶段发生?陈穗清等[30]通过图-词干扰范式考察汉语成年口吃者语义编码情况,对上述问题做了探讨。在实验一中,图片和干扰词同时呈现,干扰词分语义相关、无关两类,受试者需忽略干扰词直接命名物体图片(基本水平命名),或忽略干扰词说出图片所表事物的类属(类别水平命名)。结果发现,在类别水平命名中, 口吃者与非口吃者都表现出语义促进效应;而在基本水平命名中, 口吃者在语义相关干扰条件下所受到的干扰比非口吃者大,作者认为这反映了口吃者语义加工存在缺陷。在实验二中,干扰词和图片刺激相继呈现,要求受试者忽略干扰词,尽可能快速而准确地说出图片名称。结果发现,相较于干扰词在图片呈现前200ms呈现,干扰词在图片呈现前100ms呈现、干扰词与图片同时呈现时, 口吃者的语义干扰量比非口吃者的更大。作者认为口吃者在言语产出的早期阶段,语义加工较非口吃者延缓,即口吃者语义干扰效应发生在言语产出早期阶段。另外,言语产出过程中口吃者语义、语音信息提取的次序及表现也倍受学界关注。吴秀华[31]使用ERP技术,通过Go-Nogo范式考察了汉语成年口吃者词汇产出过程中语义、语音信息的提取过程。实验一考察词汇产出过程中语义信息的提取进程,实验二考察词汇产出过程中语音信息的提取进程。结果发现,就偏侧准备电位(lateral readiness potential, LRP)成分来看,口吃者跟非口吃者一样,在实验一Go任务中潜伏期短于实验二的Go任务,作者认为这表明汉语成年口吃者在词汇产出过程中语义信息的提取先于语音信息。同时,口吃者实验一Go任务的潜伏期比非口吃者的长,作者认为该结果反映口吃者语义信息的提取要显著慢于非口吃者,这可能是造成口吃的原因。
2.2 语义理解研究 国外研究发现,口吃者到成年后在语义理解上仍然是有缺陷的。例如,Web等[7]通过ERP实验,发现英语成年口吃者在语义违反句(语义不搭配)加工的时间进程上与非口吃者相似;但相较非口吃者,由语义异常诱发的N400波幅则明显较低。该结果表明英语成年口吃者在语义加工精细程度上仍弱于非口吃者。在国内,尚未见到有关语义理解深度的研究,但有一项成年口吃的研究尝试从注意分配视角探讨口吃者语义加工水平较低的原因。吴国伟[32]采用fMRI技术考察注意分配对汉语成年口吃者语义加工的影响。实验中,图片上呈现的双字词,图片所示物体与双字词内容相关(无抑制)或无关(有抑制),受试者需判断该双字词是否属于某一特定语义类别。结果发现,汉语成年口吃者抑制条件下语义一致性判断反应时长于无抑制条件,且在双侧前扣带回喙侧相比非口吃者有更强的负激活;但非口吃者未发现抑制/无抑制这一条件间的差异。作者认为这可能反映了口吃者在抑制条件下语义检索能力因前扣带回喙侧功能缺陷而受到影响。此外,值得注意的是,Anderson和Conture[5]从句法-语义界面的角度,指出儿童口吃者的语义发展可能落后于他们的句法发展,认为口吃儿童语言系统成分之间的不平衡可能导致他们难以维持正常的言语流畅度。
3.1 语法产出研究 国外关于口吃语法研究主要集中在句子的长度和复杂性上。Kleinow等[33]让受试者重复所听到的句子以研究话语长度和句法复杂性对口吃的成人言语运动稳定性的影响,通过分析英语成年口吃者的下唇运动记录发现口吃者的运动稳定性比非口吃者低,句法更复杂时口吃者的语言运动稳定性降低,但不影响非口吃者;话语长度对两组受试者的下唇运动稳定性都没有影响。与之相反,另一项英语口吃者复述研究却得出句子复杂性不影响口吃者复述的结论。Kenneth[34]让受试者复述四种不同复杂程度的句子来研究句法结构对说话者言语开始时间(speech initiation times, SITs)的影响,结果显示四种句子类型中的SITs没有显著差异。相比国外,汉语口吃研究在句子长度上的探讨欠缺,且在句法复杂度上的研究亦不够精进。国内关于口吃的语法研究较少。宁宁等[35]比较不同语法复杂性(复合名词,如“长颈鹿”;动宾短语,如“踢足球”)的三音节词语图片命名,发现图片名称的音节数一样时,语法编码难度对成人口吃者的影响更大。作者认为这表明在言语产出中,口吃者于句法编码过程可能存在缺陷。与口吃成人相比,口吃儿童多于功能词而非实词上表现出口吃[36]。
3.2 语法理解研究 在国外,Smith等[4]即已提出口吃的多因素模型,认为口吃者在句法编码、语义信息的提取、词素提取等方面都可能存在缺陷。Peters等[37]也指出言语流利性受各种语言加工的影响,包括语言能力(如词汇量大小、句法形式的数量)和语言行为(如组词、 造句)。但截至目前,有关汉语口吃的句法理解研究尚未发现。
在生成语言学中,言语产出需要说话人依据句法规则从词库里取词生成句子,Chomsky[38]指出在该过程中,句子的语音由语音表达式(phonological form, PF)解释,语义由逻辑表达式(logical form, LF)解释。作为一种言语产出障碍,口吃可能的原因可从句法、语义、语音,以及词库方面来分析。整体而言,汉语口吃研究已有一定规模,发现口吃者:①在语音产出上表现出明显的障碍,在音段、超音段感知上亦表现出缺陷,但在音段边界感知上却未表现出不足。②在语义产出、语义理解上均较非口吃者表现出不足。③在句法产出上较非口吃者表现出困难,但句法理解上因未发现相关研究,情况不明。与国外研究相比,国内口吃有关语义、句法的研究主要关注短语、词这两个语言层级;但按口吃成因的有关话语长度、句法复杂度等多因素解释[4-5],并对照西方语言口吃者有关句子产出的研究[33-34],至少需要拓展到句子这一语言层级。
另外,需要特别指出的是,言语产出是一个系统过程,涉及句法、语义、语音及词库间的相互联系,虽已有有关句法-语义界面的口吃研究[5],但仍不足以从语言部门界面角度,系统揭示口吃的原因,今后应更多关注句法-语义、句法-语音、句法-词库等界面在口吃探因中的影响。