赵晓琦 赵丽萍 祝承 谭颖
摘 要:目前在针对自闭症的分类研究中,构建阈值连接网络时,大多因不合理的阈值设置而影响最终分类结果。为了避免传统方法阈值选择的问题,文章对自闭症患者的最小生成树脑功能网络进行了研究,报告了正常被试与自闭症患者脑功能连接网络的差异,并设计了基于支持向量机的分类模型,实现对自闭症的分类工作。文中获得的分类准确率达到81.76%,相比于传统方法具有更高的敏感度和特异性。
关键词:最小生成树;自闭症;支持向量机;辅助诊断
中图分类号:TM18 文献标识码:A文章编号:2096-4706(2021)19-0082-03
Research on Auxiliary Diagnosis of Autism Based on Minimum Spanning Tree
ZHAO Xiaoqi, ZHAO Liping, ZHU Cheng, TAN Ying
(School of Computer Science and Engineering, Southwest Minzu University, Chengdu 610041, China)
Abstract: In current classification studies for autism, the final classification results are mostly affected by unreasonable threshold settings when constructing threshold connectivity networks. In order to avoid the problem of threshold selection by traditional methods, the minimum spanning tree brain function network of autistic patients is studied in this paper, and the differences between the brain function connectivity network of normal subjects and autistic patients are reported, and a support vector machine-based classification model is designed to realize the classification work for autism. The classification accuracy obtained in this paper reaches 81.76%, which has higher sensitivity and specificity compared to traditional methods.
Keywords: minimum spanning tree; autism; support vector machine; auxiliary diagnosis
0 引 言
自閉症(ASD)是一种神经精神疾病,在遗传上高度异质的发育障碍[1]。目前,世界范围内ASD病例的数据正在逐步增加,由于其影响的人数众多,已成为现时代重要的医学难题之一。ASD的症状通常在患病前两年出现,并且长期持续、伴随病人一生,但是及时的治疗可以改善症状。因此,对ASD的早期准确诊断对于制定专门的干预措施至关重要。然而,ASD的病因复杂、症状高度异质,为其诊断带来极大的挑战性。Muetzel等人[2]研究发现,大脑的功能网络是高度可重现的,所以功能磁共振成像(fMRI)成为检查ASD中脑动力学的常用影像学方法之一。Aarthi[3]通过对大脑网络的分析和研究,发现儿童自闭症患者的脑功能网络表现出异常的局部特征。Nielsen等人[4]基于自闭症成像数据中心的fMRI数据,使用皮尔逊相关性提取了7 266个感兴趣区域(ROI)的成对功能连通性,利用线性模型分类器使自闭症患者与健康对照分类的精确度达到60%。
尽管上述研究在功能上对自闭症患者有了深入的了解,发现自闭症患者的大脑连接强度的变化与其行为特征有关。然而,大脑神经网络的整个拓扑信息是否受到异常功能连接的影响,以及如何受到影响目前尚不清楚。由于MST方法可以捕获大脑网络拓扑结构中的隐藏信息,且不会丢失过多的功能信息,所以本文利用MST方法来建立功能连接网络。为数据集中的每个被试建立独立的MST脑功能网络,并计算度、介数、离心率等指标,通过显著性差异检验提取具有显著差异的区域作为脑区特征。构建SVM分类器对自闭症患者和健康被试进行分类,辅助ASD的临床诊断。
1 数据收集及预处理
1.1 研究对象
本实验数据均来自纽约大学朗根医疗中心的公开数据集(NYU)。该数据集中共包含年龄在6岁至40岁之间的169名被试,其中74例为自闭症患者,95例为健康对照,所有被试均为右利手,并且所有患者均由专业医师利用自闭症诊断观察量表和自闭症诊断访谈诊断为自闭症患者。
1.2 数据预处理
本实验中所使用的数据集均利用西门子3T超导核磁共振扫描仪进行采集。在扫描开始之前,研究人员向参与者展示了MRI图像,并介绍了MRI扫描步骤和经验。对于儿童,在扫描之前至少完成一次模拟,保证正式扫描的正确性。服用药物的患者被要求扫描之前至少停药24小时,并在扫描期间,要求所有参与者闭眼保持放松,不能睡着,且用扫描仪监控被试的眼睛状态。
在数据预处理过程中,使用DPARSF软件对被试的fMRI数据进行预处理,具体步骤如下:针对每个被试,去除其功能磁共振图像序列前10个时间点的数据;对剩余的时间点进行时间层校正和头动校正;由于不同被试的大脑大小、形状等均不同,将被试的T1加权图像分割,用来对功能像数据配准,并将其归一化到MNI标准空间中;将空间重采样,并进行平滑处理;最后利用低频滤波(0.01~0.10 Hz)去除高频的生物噪声。在校正过程中有3例ASD患者和7例健康被试因水平头动大于3 mm而被舍弃,不包含在最终的169名被试中。
2 实验方法
2.1 最小生成树网络构建
本实验利用AAL模板将大脑分为116个脑区,其中感兴趣区域为90个,左右半脑各45个。通过上述预处理会得到一个M×N的矩阵(M为时间点数,N为脑区数),本实验中M=238,N=90。
将每个感兴趣区域作为网络中的一个独立节点,两节点之间的连接强度作为网络中的边。节点的值由平均时間序列表示,通过计算每个ROI中所有体素在不同时间点上的血氧水平依赖的算术平均值得到。通过每对ROI之间的皮尔逊相关系数,用以表示网络中节点的权重边。为了提取更加有意义的网络,本实验从获得的连接网络中删除了所有负相关的连接,将所有自相关和负相关值设置为0。
本实验中使用经典的Kruskal算法来构建最小生成树网络,此方法已经在许多研究中已经证实了其有效性。MST是一个加权图,它将所有节点连接在一起,没有任何循环,并且具有最小的权重。由于我们只对大脑网络中最牢固的连接感兴趣,因此本实验使用Kruskal算法构建了一个加权图,该图将所有节点连接在一起,并且无循环,并保证最大权重。首先对皮尔逊相关系数矩阵中所有的连接权重降序排列,然后以最大的连接权重构建最小生成树,之后继续向所构建的生成树中添加权重最大的连接,直到所有节点均连接到非循环的子网络中。在此过程中,如果添加的连接形成循环,则忽略此连接。此时最小生成树网络建立完成,包含90个节点,89条边。
2.2 特征定义
构建了最小生成树功能连接网络之后,本研究将节点的度、离心率和介数中心度定义为特征,并计算出每个被试所有节点的3个指标。
离心率被定义为:一个节点到其他节点最短路径的最大值。其计算公式为:
Ecc(v)=max{d(u,v)} (1)
其中u、v表示节点,d(u,v)表示节点u到节点v的最短路径。
在MST中,某节点连接的边的条数用度来表示。计算公式为:
(2)
其中aij代表MST中节点i和j间的连接。
介数中心度用来描述节点的中心性,是指通过该节点的最短路径的比例。更高的介数中心度表明在信息传递时该节点具有重要地位。定义为:
(3)
其中表示phj节点h到节点j的最短路径的数量;pihj表示节点h到节点j的最短路径经过节点i的数量。
2.3 脑区特征选择
针对每例被试,本实验计算了MST功能网络中每个节点的度、介数中心度和离心率。为了选取最具有区分性的大脑区域,使用双样本Kolmogorov-Smirnov检验对得到的指标进行统计分析,选择P<0.05的脑区作为判别性大脑区域,及脑区特征。
计算结果显示,不同脑区在度、介数中心度和离心率三个指标中都表现出显著性差异,这符合前人的研究结果,并再次证明可以将此三个属性作为选取特征的标准。我们选取在两组被试中组件差异显著的大脑区域作为脑区特征,共有6个脑区。与健康对照组相比,自闭症患者的左侧背外侧额上回、右侧后扣带回、左侧颞上回、左侧颞中回区域在度的属性上有显著性差异;左侧颞下回在离心率上有显著性差异;左侧背外侧额上回、右侧后扣带回、左侧豆状苍白球、左侧颞上回、左侧颞中回和左侧颞下回区域在介数中心度上有显著性差异,具体结果如表1所示。本文认为,背外侧额上回、豆状苍白球、颞上回、颞中回和颞下回等区域的异常可能与自闭症病发有较为紧密的关系。
默认网络被认为是自闭症的主要病理环路[5],而后扣带回、额上回等区域正是默认网络中的关键区域。在医学研究中,背外侧额上回的损坏会造成人神经、情感、行为和智能的障碍,而后扣带回与情绪行为活动息息相关,颞中回、颞下回的异常是导致人格改变的原因之一,并伴随记忆障碍、听觉障碍等症状[6]。本研究利用MST来分析脑网络的拓扑变化,组间差异显著的区域符合默认网络中的病理变化,与前人研究结果一致。
3 结果分析
本文构建SVM分类器,并以最常见的正确率、敏感度和特异度作为评判标准,具体结果如表2所示。
传统的方法,在提取特征时往往忽略了脑网络中的拓扑信息,具有一定的局限性。近年来,有些学者利用设置不同的阈值方法来提取全脑的拓扑特征,但是此方法受到阈值的影响,会使脑网络中出现一定的偏差,为了避免这一偏差,我们利用MST方法来构建无偏差的脑功能网络,该方法利用较低的成本保留了脑网络中的主要部分。
4 结 论
在对ASD的分类中,我们的方法实现了81.76%的准确度、84.58%的敏感度和75.33%的特异性,整体结果令人满意,而且还潜在地检测了对ASD病理敏感的感兴趣区域。本文提供了一种足够灵敏的方法,可以捕捉到自闭症患者脑网络中的细微变化,为准确诊断和预测ASD提供了有效帮助。但是在本研究中还是具有一定的局限性,首先由于实验中所使用的数据较少,使得分类结果缺乏通用性,之后可以将此方法应用到较大的ASD数据集上验证模型的通用性。其次,先前研究表明,使用不同的大脑模板定义网络的节点,会使所构建的网络展现出不同的属性,后续工作可以考虑多种模板对模型分类性能的影响。
参考文献:
[1] LORD C,RISI S,LAMBRECHT L. The Autism Diagnostic Observation Schedule—Generic:A Standard Measure of Social and Communication Deficits Associated with the Spectrum of Autism [J].Journal of Autism and Developmental Disorders,2000(30):205-223.
[2] RYAN L,BLANKEN L M E,THIJSSEN S,et al. Resting-State Networks in 6-to-10 Year Old Children [J].Human Brain Mapping,2016,37(12):4286-4300.
[3] PADMANABHAN A,LYNN A,FORAN W,et al. Age related changes in striatal resting state functional connectivity in autism [J/OL].Frontiers in Human Neuroscience,2013:[2021-08-26].https://doi.org/10.3389/fnhum.2013.00814.
[4] NIELSEN J A,ZIELINSKI B A,FLECTCHER P T,et al. Multisite functional connectivity MRI classification of autism:ABIDE results [J/OL].Frontiers in Human Neuroscience,2013,7(1):599.[2021-08-26].https://doi.org/10.3389/fnhum.2013.00599.
[5] WIGGINS J L,PELTIER S J,ASHINOFF S,et al. Using a self-organizing map algorithm to detect age-related changes in functional connectivity during rest in autism spectrum disorders [J].Brain Research,2011,1380:187-197.
[6] ROZZINI L,COSTARDI D,CHILOVI B V,et al. Efficacy of cognitive rehabilitation in patients with mild cognitive impairment treated with cholinesterase inhibitors [J].International Journal of Geriatric Psychiatry,2007,22(4):356-360.
作者簡介:赵晓琦(1997.04—),女,锡伯族,辽宁铁岭人,硕士研究生在读,研究方向:智能信息处理。