李晓琳,张斌龙,樊瑞文,徐敏杰,黄幸,舒鑫,李昌明,谭中建,常静玲
1.北京中医药大学东直门医院,a.神经内科;b.放射科,北京市 100700;2.中国中医科学院广安门医院,北京市100053
脑卒中占全球所有残疾调整生命年(disability-adjusted life years,DALYs)的5%,占所有死亡人数的10%[1-2]。失语作为脑卒中的主要并发症,可导致患者自信心下降、睡眠障碍、反应迟钝,并伴情绪低落、焦虑等不良情绪[3]。人类语言发生和损伤过程中的心理变化和认知机理研究为当今研究难点与热点[4]。关于失语症管理的国际最佳实践共识声明指出,“应该为失语症患者提供强化和个性化的失语症治疗,旨在对沟通和生活产生有意义的影响”[5]。因此,对失语症患者的个性化治疗至关重要。
言语的产生是一个复杂的过程,需要感觉系统以及运动系统相关功能综合协调配合才能产生正确的语言方式。近年来,语言产生主要从心理语言学和运动控制两大传统理论进行研究[6]。其中心理语言学对于语言各个层面的恢复机制探讨一直是国内外研究的热点,词图研究范式在心理语言学研究中得到广泛的应用。通过不同形式的图片和词汇组合设计成不同的语言任务,可以应用于不同损伤类型失语症的评估和康复,其中,刺激的性质、如何介入任务、治疗师与患者的互动、反馈类型以及给予的提示成为任务设计的关键环节。
认知神经心理学在失语症的治疗中占关键地位,可极大地降低治疗师的治疗选择,基于认知功能表达和处理过程清晰详细的假说,人们可以拒绝未经理论证实的治疗策略。
图词范式(picture-word interference,PWI)是由Stroop任务发展而来,既往研究大部分通过该范式来探索口语产生的过程[7-9]。Stroop 任务由不同颜色以及不同文字组成,是心理学研究的经典任务之一,常被用于研究冲突加工的神经机制。在经典的Stroop实验中,被试的任务是命名字的实际颜色同时忽略字的意义。在一致条件下,字的意义和颜色相同(如红色的“红”字);在不一致条件下,字的意义和颜色不同(如红色的“蓝”字);在中性条件下,则呈现着色的字符串(如红色的“XX”)或者着色的、不具有颜色含义的中性汉字(如红色的“格”字)。与一致条件、中性条件相比,被试在不一致条件下的错误率更高、反应时更长,此即Stroop干扰效应[10]。
经典的图画词汇干扰范式是呈现图画和干扰词,要求被试忽略干扰词,尽可能准确而迅速地说出图画的名称。PWI效应被定义为语义相关和不相关的干扰词条件之间图片命名延迟的差异[11],一般在PWI中会包括两个自变量:图画与干扰词之间的关系、图画与干扰词呈现之间的时间间隔。除此之外,图片的种类及词汇的性质和种类也会影响其在失语症评价及治疗中的作用。
由于失语症的治疗方法种类繁多、差异显著,不同的治疗方法反映对失语症损伤性质及治疗目标的不同认识。这种多样性不仅反映患者个体的症状多样性,还反映治疗师治疗方法的不同。本文介绍几种常见的语言任务刺激通路及刺激模型,旨在为失语症治疗设计有针对性的语言任务提供参考。
实时功能磁共振成像(functional magenetic resonance imaging,fMRI)应用与语言任务相结合的方式正在日趋增多。Sreedharan等[12]通过实时fMRI结合神经反馈训练对卒中后失语(poststroke aphasia,PSA)患者的脑活动进行探索,可以实时看到语言区域的活动,使患者有动力去锻炼语言区域。对患者语言功能区的调节机制进行探讨,神经反馈训练之前的预训练包括图片命名任务(只联想名字,但不大声说出来),屏幕上显示对象命名,通过按下左右键从两个选项中选择正确的名字;该图片命名测试与基线模块测试以及上调模块测试穿插进行,测试神经反馈训练对PSA 患者的表达与理解过程方面的改善程度。Sims等[13]通过对慢性失语症患者进行语义处理任务,以确定书面语义特征是否与图片匹配,或两个书面单词是否相关,结合fMRI发现,尽管原始定义相关的脑区受损严重,但左侧额下回、额盖部和三角部是仅有的与行为准确性相关的区域。此外,双侧额上回、额中回、前扣带等额叶区域在传统语言区域(包括额下回、颞中回、额上回和角回)受损时,似乎可以作为辅助网络,通过视觉识别书面语义特征来证实与特定语言任务相关脑区的关系。也有研究通过阅读任务进行卒中后语言障碍患者的语音恢复研究,fMRI扫描过程中执行事件相关语义匹配词图任务,要求受试者大声朗读单词,发现成功的单词阅读与左角回中较高的血氧水平依赖(blood oxygen level dependent,BOLD)信号相关;而在错误的试验中,双侧后下额叶皮层和前扣带回皮层等脑区的BOLD 信号更强。此研究证实,角回是语义网络中的关键节点[14]。这些针对视觉呈现的语言任务,探索了阅读、命名、口语表达、书面表达以及语音等相关脑机制[15-18]。
有关听觉语言刺激的研究显示,语言性声音刺激时,听觉中枢和语言中枢均有激活,显示的脑功能区与功能神经解剖学中的功能区划分较一致。人脑接受语言性声音刺激时除了单纯听觉对声音的获取,还包括语言的刺激以及人脑对与其有关的语义概念的存取。听觉性语言刺激下,众多听觉、语言皮层区共同参与活动,以左侧为主,说明左侧大脑半球在听觉语言的处理中是优势半球,且半球内各脑区间有相互协同作用;右侧相关功能区也有参与,两半球间也有协同作用。Griffis 等[19]运用多模态MRI数据分析方法,以慢性左半球脑卒中患者为研究对象,对听觉语义决策过程中区域组织保留程度与功能性MRI激活之间的关系进行研究,结果表明,保留左后颞顶叶结构与任务诱发语义网络功能之间存在联系;在慢性脑卒中患者的语义加工过程中,这些区域的损伤可能导致非典型任务诱发反应。Wilshire 等[20]通过研究听觉呈现词图匹配任务,通过控制音素在目标词汇与图画之间的位置,发现在图画呈现前150 ms或后150 ms内,目标词汇会促进命名的效率,表明单词的开始音素比结束音素启动的要晚,但是尚不清楚这些影响是否真的在语音检索的层面上反映促进作用。除了自然语言状态下及PSA 患者运用听觉通路下的语言任务进行研究[21],一些研究也通过听觉呈现的语言任务评估语言功能障碍患者的相关语言功能,进行术前手术定位[22-24]。
声音象征主义是指一个声音产生某种印象(如音素p与小的印象相关联),可能是词义联想的心理基础。在这项研究中,受试者被要求比较标准刺激和目标刺激的视觉大小,同时听假定会产生较大或较小印象的音节。刺激反应一致性是指目标大小与音节印象的一致性。行为数据显示,受试者在不一致条件下的反应时间比在一致条件下的反应时间长,表明他们倾向于将物体的大小与特定音节联系起来。使用fMRI来评估任务期间的大脑活动,发现在不一致的条件下,大脑中与语义和语音过程相关的区域(分别为左侧颞中回和右侧颞上回)都被激活。表明这些区域与声音象征的不一致有关。
Venezia等[25]研究颞上沟在特定模态和多模态语音条件下的功能组织,在fMRI设计中,让受试者接受听觉、视觉和视听同呈的语言刺激,以及听觉和视觉非语言控制刺激,结果表明,听觉和视觉的语言表征分别在前、后颞上沟语言处理通路中逐渐细化,并可能整合到中部颞上沟语言处理通路中,中部颞上沟语言处理通路对呈现模式内和跨呈现模式的较为抽象的语音信息更敏感。Xi等[26]设计单模听觉、单模视觉和具有语义信息的双模视听刺激的fMRI实验,通过记录三种任务相关的fMRI数据以及静息状态下的fMRI数据,利用fMRI技术,结合图形理论分析,构建任务相关和静息状态下的功能脑网络,并对其拓扑网络特性进行了定量表征,结果表明,处理语义视听刺激的功能脑网络的拓扑结构受注意力调节,并且具有高效率等特点,可以有效保持多感官处理的功能分离与整合的最佳平衡。
文本语义分布模型是基于出现的上下文粗略估计词汇的语言学意义的计算模型,例如,“金字塔”和“骆驼”是相关的,因为它们同时出现在相似的段落中;“骆驼”和“驴”是相关的,因为它们都发生在“骑马”的上下文中。因此,“骆驼”可以从语义上表示为一个载体,列出骆驼与其他一组单词共同出现的频率(例如在“金字塔”与“骑马”得分高的地方)。通常,基于文本的模型由数百万个单词文本库构建而成,许多方法被用于这种模型的建立,在实践中,它们通常间接地表示单词的共现,而不仅是单词的计数。基于文本的语义模型已被广泛应用于解释与具体概念相关的fMRI数据[27-30]或者具体的名词/动词[31],抽象概念、句子[32]和故事[33],也与fMRI数据结合进行语义研究[34]。然而,它们在捕捉无法从文本中学习的经验成分方面的机制研究能力有限。
基于图像的语义分布模型表示单词的视觉识别(如狗长什么样)是基于图像的统计数据,在基本层面上,可以通过考虑由颜色/形状片段(又称“视觉词”)在图像中的排列来理解,这与文本词排列成文档的方式非常相似,可以列出与形成相应图片的不同视觉片段的共同呈现。因此,建筑与坚硬的边缘及石头纹理联系在一起,而哺乳动物则与圆形的边缘以及皮毛联系在一起。基于图像的模型已被应用于识别与名词相对应物品的视觉外观相关的fMRI激活研究[28]。当然,基于图像的方法只可用于能通过图像建模的概念相关。
有研究结合文本和特征规范数据的优点在行为实验中进行研究[35],基于图像和文本的模型被融合在一起,以帮助解释与名词相关的fMRI数据[28]。文本及特征表现被结合应用于句子阅读中引出的模拟fMRI实验。视觉数据和行为属性以一种联结方法结合在一起,在可视化对象命名研究中将可视化处理转换到语义处理[36]。
这种模型是基于体验者对单词及其所参照对象的报告或者评级。参与者要么使目标词与研究者解释的语义特征相关联,要么语义特征被提前确定好,参与者针对这些概念特性的重要程度进行评估[37]。在后一种情况下,参与者可能对“闪电”与“视觉”、“听觉”、“动作”和“情绪”的关联程度进行0~6 分的评分。那么“闪电”可以作为这4 个指标的载体。这种特征规范模型可以用来解释名词和动词的特定损伤[38]和行为任务中的语义效应模式。因此,这个模型有助于解释与具体概念相关[39]以及描述事件的句型[40-41]的fMRI数据。然而,虽然特征规范模型适合于测量语义表征的单模态或者跨模态特征,但是它对于面向语言学的抽象概念方面没有优势。
由生物神经网络启发得来,模型通常由多层节点(类似于神经元)组成,这些节点通过权重(类似于突触)相互连接。传统的模型都是经过训练的,在输入层显示的单词与其在输出层显示的语义属性之间进行映射[42]。语义属性可以由研究者或行为规范来决定。训练是通过一个适应连接权重的优化过程来完成的,概念习得模型通过训练处理后得到,并对训练后的权值模型进行展示。传统的联结模型在大脑活动探查方面的应用有限,虽然有些研究应用联结模型来解释神经疾病中的功能连接数据[36,43],但是,联结模型是基于文本以及影像数据形成的(包括深度学习图像模型[36]),因此在应用于卒中语言障碍的探查中作用有限。
分类项目模型以成分的类别表示概念,例如,“猫”可以表示作为二元载体,分别属于“哺乳动物”和“动物”的类别,大规模的分类体系是人工汇编的。分类项目模型已经应用于具体词汇的学习[44]以及对电影中与对象/动作相关的内容进行预测建模[45]。但是它不太适合应用于经验性成分或者不属于明确类别的抽象性概念,例如“道德”这类词。此模型可以结合fMRI用于揭示词汇概念加工在大脑区域中的重要性[18,46-47]。
随着认知心理学、认知神经学研究的不断深入,人类语言发生过程中的心理变化和认知机制备受关注[4]。除上述语言模型以外,心理学家还提出了相关的模型和理论假设,如激活扩散模型、符合线索理论、交互激活模型和分布式联结主义模型、词汇联想模型、认知控制抑制理论、竞争选择和反应选择理论,以及负激活效应和竞争启动效应等。现实研究中,对于任何一个模型的进一步探讨,都可以验证和排除其对语言评价模式的现实意义。语言加工是大脑处理语音、语义、语法等多层次信息的复杂过程[48]。语言的产生是不同脑区间协同作用结果,语言功能相关的脑区分布在额颞顶皮质、皮质下等广泛区域,其机制的直观显示就是脑结构与功能网络。因此,设计不同类型的语言刺激任务(听觉刺激、视觉刺激、视-听觉刺激等),观察脑激活情况,进一步分析不同语言任务对于脑区激活的差异,以及脑区激活差异与语言任务测试意义的关系尤为重要,任务态fMRI为揭示语言损伤机制提供了新方法与新途径。有研究发现在词图干扰范式中同时存在语义抑制效应和语义促进效应两种相互矛盾的效应。因此,为验证语言抑制与促进效应与脑区激活之间的影响,今后可设计基于文本和语义分布模型的词图相关语言任务,进一步为失语症的评价与治疗提供新的试验范式。
未来,在失语症评价与治疗过程中,言语语言病理学家、治疗师和其他专业人士所面临的挑战是确定针对个体特定障碍的有效修正术,强调治疗不仅是关于任务和材料的使用,而是一种任务、心理语言学概念传递以及治疗师和患者之间的相互联系的组合,临床上获取这些信息的途径和对其应用的理论模型的理解程度是不同的。现阶段对于失语症的评定及治疗方案已不再局限于医学范畴中针对功能点的传统模式,而是向认知神经心理学寻求更有针对性及精准的方法。虽然现今语言及康复领域对于部分失语症的评定及治疗方案仍有分歧,但由于神经电生理及影像学的发展,不同脑区的功能分布逐渐被探索、验证,从而更好地指导失语症患者的康复方向及结局预见。