张笑非,杨 阳,钟 宁
(1.北京工业大学信息学部,北京 100124;2.江苏科技大学计算机学院,江苏 镇江 212003;3.磁共振成像脑信息学北京市重点实验室,北京 100124;4.北京林业大学人文社会科学学院,北京 100089;5.前桥工科大学生命科学与信息学系,群马 前桥 371-0816,日本)
词语的视觉识别是阅读过程中的重要环节,个体在阅读过程中虽能够轻松识别词语的视觉表征,但词语的正字法结构与其语音及相关语义的映射匹配加工涉及非常复杂的认知加工过程[1].神经影像学研究发现,相对于其他类型的刺激,位于左侧颞枕后沟(left occipital-temporal sulcus,LOTS)的视觉字形区(visual word form area,VWFA)在接受单词类型的实验刺激时,其在血流动力学上会表现得更加活跃[2].Coslett等[3]研究认为,大脑顶叶在语义处理中起着重要作用,特别是对于主题(thematic)关系而言;在这种关系中,来自多个感觉和运动领域的信息会被进行整合.早期定义的VWFA拥有对单词敏感的双侧视觉区,然而,White等[4]研究发现,双侧单词表达出现在左腹枕颞叶皮层的2个不同区域中,即VWFA和腹枕颞叶皮层的较后区域.Cohen等[5]研究发现,健康被试在接受视觉词语识别任务时,单词条件相较辅音字符串条件会激活双侧后扣带和左角回等区域的皮层,而辅音字符串条件相较单词条件会激活左枕顶叶、右枕顶叶、右后中央、右下回等区域的皮层.因此,视觉词语识别中的辅音字符串和单词会分别涉及左右脑的多个大脑区域.Stevens等[6]基于独立功能定位(individual functional localization)、多体素模式分析(multivoxel pattern analysis,MVPA)、及高解析度静息态功能连接分析技术的组合对VWFA进行了研究,证明了VWFA非常适合于对实义单词进行词法处理.本文试图对任务态视觉词语识别任务下的脑功能网络进行研究,特别是进行视觉上实义单词识别和辅音字符串识别时左右脑功能网络的拓扑性质差异,对理解脑网络在进行视觉词语识别时的内在连接模式具有积极意义.
45名(男23名、女22名)健康的英语单语被试者参与了此次fMRI实验[7],该实验是Duncan等[8]进行的神经导航经颅磁刺激研究中的一部分.被试的年龄为19~38岁(均龄25岁),均为右利手,视力正常或矫正后视力正常,无精神疾病史及家族史.在实验开展前,向每名被试解释了实验过程可能产生的自然反应,所有被试均签署了知情同意书,实验获得了英国国家医疗服务体系伯克郡研究中心(Berkshire National Health Service Research)伦理委员会批准.
该词语与对象处理实验旨在研究枕颞皮质(occipital-temporal cortex,OTC)的腹侧和外侧对阅读和对象的敏感性在被试自身及被试之间是否具有一致性.实验采用组块类型以最大化统计敏感性,通过视觉刺激方式让被试判断所注视图像中的内容是否和上一次的一样,即one-back方式,其中12.5%的刺激为目标.实验中使用的刺激材料分为4种:单词、辅音字符串、对象图片、加扰后的对象图片.
如图1所示,整个实验过程包括2个实验小节,被试在2个实验小节之间稍做休息.实验中的每个实验小节包含6个组块组,组块组之间间隔16 s,在这个间隔中要求被试注视被呈现的符号“+”.1个组块组包含4个组块,4个组块时段内分别呈现4种类型刺激.1个组块内包含16次同类型的刺激,每次试次为1 s,前640 ms呈现符号“+”,后350 ms呈现刺激内容,如单词“dog”或者动物的图片.如果被试在当前试次中判断所注视的内容与上一次试次一致,则按下手中的按键.
图1 视觉词语识别实验范式Fig.1 Experimental paradigm of visual word recognition
因此,整个实验2个实验小节共包含12个组块组.因为每个组块组内只包含1个单词组块和1个辅音字符串组块,所以整个实验共包含12个单词组块和12个辅音字符串组块.由于每个组块包含同类型试次16个,因此整个实验共包含192次单词试次和192次辅音字符串试次,每位被试接受这2种类型试次的用时均为192 s.
该实验的所有数据公开在OpenfMRI网站(https:∥www.openfmri.org/dataset/ds000107/)词语与对象处理项目中,其中包括了详细的实验过程信息,以及有效的45名被试的T1结构项MRI数据和功能MRI数据.
数据预处理包含2个阶段.第1阶段使用SPM[9]软件完成切片时间校正、头动校正、归一化、平滑处理.切片时间校正时,由于初始fMRI图像含35个切片,因此选择第17个切片作为参考切片,其中参数TR和TA分别为3.000 s和2.914 s.在进行头动校正、归一化和平滑处理时,使用的是SPM中的默认参数.第2阶段使用基于Python语言的神经影像开发工具NiLearn[10]完成去线性漂移和滤波,通过调用NiLearn软件包nilearn.signal.clean中的相应函数完成,并最终得到了原始fMRI数据预处理后体素尺寸为3 mm×3 mm×3 mm的nifti格式影像数据,如图2所示.
图2 fMRI原始数据及预处理后数据Fig.2 Raw and preprocessed fMRI data
如图3所示,脑功能网络的构建使用了由蒙特利尔神经学研究所(Montreal Neurological Institute,MNI)定义的脑图模板AAL[11]中的90个大脑区域.以每个AAL区域中心坐标为圆心,取5 mm半径内的体素簇作为脑功能网络中的兴趣点(region of interest,ROI),并划分为包含45个ROI的左半脑和包含45个ROI的右半脑.
图3 AAL脑图及其ROI在左右脑的分布Fig.3 AAL brain atlas and its ROI distribution in the two hemispheres
为了构造单词和辅音字符串实验条件下左右脑的功能连接网络,首先分别提取AAL左右脑中ROI包含的体素在相应实验条件下的fMRI信号,并对同一个ROI内所有体素的fMRI信号在空间上求平均.因此,在每种实验条件下,左脑和右脑分别会拥有45个时间序列.但由于相同的实验条件在整个实验过程中被分割为多个组块且时间上不连续,因此采用了Cohen等[12]提出的策略,通过将属于相同实验条件下的时间序列段进行拼接,从而得到每位被试单词实验条件下左脑和右脑各自的45个时间序列,以及辅音字符串实验条件下左脑和右脑各自的45个时间序列.通过对每位被试的每个实验条件下其中一个脑半球的45个时间序列计算Pearson相关系数矩阵,就可以得到相应脑半球的功能连接矩阵.因此,45名被试2种实验条件下,左右脑一共会计算得到180个尺寸为45×45的Pearson相关系数矩阵.
本文只考察Pearson相关系数矩阵中r值为非负数的单元,将所有非负数r值从高到低排序,按总数1%比例为阈值步长,将r值不小于阈值的边用于构造功能网络.如图4所示,每个实验条件下的AAL左脑和右脑分别会产生100个阈值下相应的脑功能网络及二值矩阵.
图4 脑半球功能网络的二值化Fig.4 Binarization of the hemisphere functional network
采用复杂网络中的4个指标来度量单词和辅音字符串实验条件下左右脑功能网络的拓扑属性,分别是度中心性、聚类系数,以及网络效率中的全局效率和局部效率[13].其中脑功能网络的度中心性、聚类系数和局部效率分别是对所有脑区的节点度中心性、节点聚类系数、和节点局部效率求平均得到.
如图5所示,当关注脑区的邻接脑区数量相同时,其节点度中心性相同;此外,如果此时邻接脑区构成的邻居网络内部连接的数量也相同,那么节点聚类系数相同.需要注意的是,此时若关注脑区的邻居网络内连接偏整合化,则它的节点局部效率更高;相反,如果此时关注脑区的邻居网络内连接偏分离化,则它的节点局部效率更低.因此,当关注脑区的邻居网络的局部形态存在变化时,其局部节点效率也会相应改变.
图5 脑功能网络局部形态度量Fig.5 Local morphological metric of functional brain network
在每一个网络稀疏度下,对45名被试得到的左右脑同类型网络指标进行统计T检验,如果P<0.01,即在当前网络稀疏度下,左右脑功能网络的复杂网络指标差异具有统计学意义,反之则差异无统计学意义.
Willard-499[14]中定义的语言网络包括9个区域(https:∥findlab.stanford.edu/functional_ROIs.html),它们在Willard-499(3 mm×3 mm×3 mm版本)中的ID及包含的体素数量如表1所示.
表1 Willard-499的语言网络Table 1 Language network of Williard-499
如图6所示,使用AAL中90个大脑区域的ROI构造脑功能网络时,由于每个ROI的半径取5 mm,因此每个ROI在fMRI上采样的体素为19个.为了将基于AAL左右脑功能网络分析的结果利用Willard-499的语言网络进行进一步解释,需要对比前者ROI覆盖的体素与后者语言网络覆盖的体素之间的空间重叠关系.
图6 AAL与Willard-499对比Fig.6 Comparison between AAL and Willard-499
分析结果如图7~10所示,给出了每个实验条件下左右脑功能网络在网络稀疏度定义域上45名被试复杂网络指标的均值(折线)和标准差(阴影),以及在网络每个稀疏度上统计对比的差异是否具有统计学意义(P<0.01).
图7 度中心性系数对比Fig.7 Comparison of degree centrality
图8 全局效率系数对比Fig.8 Comparison of global efficiency
图9 聚类系数对比Fig.9 Comparison of clustering coefficient
图10 局部效率系数对比Fig.10 Comparison of local efficiency
其中,辅音字符串实验条件下的结果显示,AAL左右脑功能网络的度中心性、全局效率、聚类系数及局部效率在所有的网络稀疏度上的差异均无统计学意义.类似地,单词实验条件下的AAL左右脑功能网络的度中心性和聚类系数在所有稀疏度上的差异也均无统计学意义,仅全局效率在5个的网络稀疏度上的差异具有统计学意义.然而,单词实验条件下的AAL左右脑功能网络的局部效率在44个稀疏度上的差异具有统计学意义.
辅音字符串和单词实验条件下,AAL左右脑4种网络拓扑指标(度中心性、全局效率、聚类系数、局部效率)存在显著差异(P<0.01)的稀疏度占比如表2所示.其中,辅音字符串实验条件下,4种网络拓扑指标存在显著差异的稀疏度占比都为0.单词实验条件下,度中心性和聚类系数存在显著差异的稀疏度占比都为0,全局效率存在显著差异的稀疏度占比为5%,而局部效率存在显著差异的稀疏度占比为44%,即AAL左脑和右脑的功能网络在局部效率上存在较大的差异.
表2 AAL左右脑网络指标对比结果Table 2 Comparison results of network indicators of AAL left and right brains %
度中心性度量了邻接脑区的数量,聚类系数度量了邻接脑区所构成的邻居网络内的连接密度,局部效率度量了邻居网络内的连接形态.结果显示,单词实验条件下左右脑功能网络之间的度中心性、聚类系数具有统计学意义差异的网络稀疏度占比很小,而局部效率具有统计学意义的网络稀疏度占比很高,说明两者在局部形态上产生了分化.相反,辅音字符串实验条件下并不存在局部形态上的分化.
如图11所示,脑图Willard-499语言网络的区域与AAL左右脑ROI存在重叠的体素,涉及的AAL脑区ROI共有5个(左脑3个、右脑2个),重叠的体素共29个(左脑18个、右脑11个).
图11 AAL与Willard-499的重叠体素Fig.11 Overlapping voxels of AAL and Willard-499
如表3所示,AAL有5个ROI与Willard-499相应的区域存在重叠体素.由于AAL左右脑各45个ROI(5 mm半径的ROI包含19个体素)、共855个体素,Willard-499语言网络与之重叠的体素占比很小.而左脑包含的重叠体素数量是右脑的近2倍,且单个ROI重叠度较高的只有左颞中回,AAL大脑ROI与Willard-499语言网络的重叠体素在左右脑具有不对称性.
表3 AAL与Willard-499语言网络重叠体素Table 3 Overlapping voxels in the language network between AAL and Williard-499
如表4所示,观察重叠体素在Willard-499语言网络的各个区域的占比,可以发现,AAL左颞中回区域与Willard-499语言网络403区域的重叠体素数量占该语言网络区域的39.47%,远高于其他4个区域重叠体素相应的占比.
表4 重叠体素相对Willard-499语言网络区域的占比Table 4 Proportion of overlapping voxels relative to the regions of Willard-499 language network
单词和辅音字符串2种实验条件下的左右脑间局部形态差异具有不同特点,具体表现在单词实验条件下,被试左右脑局部网络形态发生了较明显的分化,而辅音字符串实验条件下,被试左右脑局部网络之间的形态差异不明显.该结果可能源于大脑对单词与辅音字符串阅读加工机制之间的差异.大脑左侧梭状回中后部的VWFA在视觉阅读加工中的作用一直都是认知神经科学的基础[15].正字法加工假说认为VWFA对应视觉词汇的正字法字面表征,负责词汇的视觉词形加工;映射假说则认为VWFA对应着从词形到更高水平的语音及语义加工的映射.辅音字符串语音层面建构不合理,在语义构成规则上也不合法.当被试在对辅音字符串进行认知判断时,VWFA的视觉词形加工功能被激活,进而聚焦于视觉词汇的正字法字面表征,该结果与基于脑功能定位的传统研究结果一致[16];单词包含正字法字形特征、语音及相关语义特征,单词的识别加工是一个从词形到语音及语义的复杂映射任务.因而,被视在对单词辨识任务过程中,VWFA不仅对应视觉词形加工,同时需要与其他脑区产生相互协作,即VWFA与其他脑区相互协作形成一个视觉词汇的加工网络,通过大脑神经的结构连接实现从词形到语音或语义加工映射[17].相关研究证实,视觉词语的加工过程中,VWFA更大范围的前端部分与包括前部、中部和后部颞上回(superior temporal gyrus,STG)/颞上沟(superior temporal sulcus,STS)[18]和前颞叶(anterior temporal lobe,ATL)[19-20]在内的大面积颞叶皮层表现出了很强的连通性,同时VWFA与下纵束和颞上皮层的关键白质束也发生了较强的连通性[21].近期研究也表明:在进行视觉文字的语义分类任务时,单独定位的VWFA种子与后颞上皮质之间的功能连通性会增强[22-23].这些证据均表明:左脑对于语言的加工涉及包括正字法拼写、语音、语义等在内的多层级编码与分析,仅依靠大脑内部区域化的功能模块组织远远不够,更大程度上需要通过大脑内部大规模神经网络结构的相互连通才能完成.
大脑功能区域的活动状态与个体的语言认知加工任务表现具有高度相关性.早在1891年,Dejerine就发现大脑左角回区域有病变的患者存在阅读与拼写困难,因而大脑左角回最初被定义为专门负责语言材料形式的视觉加工[24].早期功能成像相关研究发现:大脑左角回在听觉形式[25]和视觉形式呈现[26]的语义加工过任务中均能被激活;后续神经影像研究通过不同形式的语义刺激和加工任务,进一步证实大脑左角回的激活区域在不同语义任务具有高度一致性[27-29].本文在构造脑功能网络时,脑图AAL左角回ROI与Willard-499中属于语言网络的400号脑区有重叠.
语言认知处理过程中,大脑功能区域的活动与语言文字加工效率也具有相关性.其中,视觉语义加工与大脑梭状回区域激活相关,听觉语义加工与双侧颞上回、左侧缘上回和角状回区域激活相关[30].Wei等[31]使用静息态fMRI技术,发现大脑左后颞中回区域的激活与语义加工效率有高相关性,静息态时左后颞中回脑区的血氧水平是语义加工表现的有效预测因子.更多的相关研究表明,左后颞中回不仅是对文字及图片语义信息的视觉加工[32]与听觉判断加工[33]的关键脑区,对中风及语义痴呆患者的词语语义理解也至关重要[34].通过比较高语义控制任务和低语义控制任务中大脑功能区域活动状态的元分析,研究者发现左后颞中回是高语义控制任务的主要加工区域,更高的语义加工任务能促使左后颞中回脑区更多地激活[35].本文构造脑功能时,脑图AAL的左颞中回ROI与Willard-499中属于语言网络的401号脑区的重叠体素数量相对其他区域重叠体素数量不仅最高,而且重叠体素占相应Willard-499语言网络区域的占比也是最高.
1) 视觉词语识别过程中,单词作为刺激材料时会触发人脑进行更多的语音和语义加工,虽然左右脑功能网络在全局连接密度和形态上的区别无统计学意义,但是局部形态的区别具有统计学意义.
2) 视觉词语识别过程中,辅音字符串作为刺激材料时并未触发人脑进行更多的语音和语义加工,左右脑功能网络在全局连接密度、全局形态、局部形态上的区别均无统计学意义.
3) AAL大脑ROI与Willard-499语言网络重叠区域和体素数量在左右脑的分布具有少数性和不对称性,这对基于ROI(5 mm半径)采样构造左右脑功能连接网络的指标具有潜在的影响.
4) 由于目前还没有一个面向视觉词语识别的权威大脑图谱,因此,从解剖学大脑图谱左右脑的功能连接来研究单词条件、辅音字符串条件下脑功能网络的形态差异性,为今后的研究提供了研究思路.