功能性磁共振成像在轻度认知障碍检测诊断的研究综述

2022-05-18 07:23安兴伟周宇涛
中国生物医学工程学报 2022年1期
关键词:特征选择大脑分类

安兴伟 周宇涛 狄 洋 刘 爽 明 东

1(天津大学医学工程与转化医学研究院,天津 300072)

2(天津市脑科学中心,天津 300072)

3(天津大学精密仪器与光电子工程学院,天津 300072)

引言

阿尔茨海默病(Alzheimer′s disease,AD)是一种不可逆的进行性神经退行性疾病[1],主要影响老年人[2],并且是痴呆症最常见的形式。有研究认为,AD 患者的大脑中积累大量异常蛋白质淀粉样斑块和神经纤维缠结,最终导致神经元失活、细胞死亡[3]。Jie 等[4]指出,在AD 症状出现之前,大脑的功能和结构已经发生了改变。患者初期临床表现为记忆力日渐衰退,语言表达出现困难,理解认知能力下降和情绪不稳定等现象[5],严重影响和限制了患者的日常生活,随着病情的不断加剧,甚至会危及患者的生命安全。Brookmeyer 等[6]在2007年指出,预计在2050年,随着全球人口老龄化的不断加剧,将会有1/85 的人受到AD 的影响,并且亚洲有大约6 285 万人受到AD 的困扰。然而,基于当前的医学技术水平,AD 的病因和发病机制尚未完全明确,缺乏有效的治疗方法,所以早期的及时诊断对临床减缓或阻止疾病的发展具有重要的意义[5,7]。

轻度认知障碍(mild cognitive impairment,MCI)是正常老化和阿尔茨海默病的过渡阶段[8-10],因此及时诊断MCI 对于AD 的预防显得十分重要。

近年来,功能磁共振成像(functional magnetic resonance imaging,fMRI)凭借其具有非侵入性、无辐射、高空间分辨率,以及对于神经退行性疾病检测的较高有效性等[11],为科研人员研究人类脑疾病的基本机制和认知过程开辟了有效的途径。许多研究将血氧依赖信号(blood-oxygen-level-dependent,BOLD)作为静息状态功能磁共振成像(resting-state functional MRI,rs-fMRI)技术的神经生理指标,应用于神经退行性疾病尤其是MCI 和AD 的诊断。在MCI 的早期阶段,大脑结构发生的变化并不显著,只伴随着一定程度的认知能力下降。fMRI 与结构磁共振成像技术(structural MRI,sMRI)相比,可以观察到大脑特定区域的功能变化;与任务态的功能磁共振成像技术(task related fMRI)相比,不需要设计复杂的实验[12],减少了实验时间,更容易获得理想的数据。因此,很多学者采用rs-fMRI 来研究MCI患者大脑功能的变化[11]。

传统的诊断方法是:通过医生多年的行医经验对患者的病情进行判断,即通过先验知识选择评价区域,进而进行诊断。该方式容易忽略研究区域之外的大脑变化,且由于强烈依赖医生的临床经验及主观判断,容易产生一定几率的误诊,这对于个体来说可能就是致命性的打击。近几年,随着计算机技术的快速发展,机器学习、深度学习等方法逐渐被应用于疾病的智能诊断。计算机辅助诊断疾病所存在的必要性有4 点:一是医学诊断过程的本身极具复杂性;二是存在大量与疾病相关的临床数据[13];三是丰富的诊断规律作为先验知识;四是计算机存储能力与计算能力快速提高。计算机辅助诊断借助功能像或结构像,可辅助医生做出更精确的诊断结果,在一定程度上避免误诊。对MCI 做出精确的诊断,并为患者提供及时的人为干预和辅助治疗,有助于缓解甚至避免患者发展为AD 的风险。

1 研究现状

目前,很多研究将机器学习和深度学习方法应用于分析AD 和MCI 复杂的神经影像数据,以完成对AD/MCI 的分类检测,其中涉及4 个部分[13],分别是特征提取、特征选择、数据降维和分类识别。本节将分别从这几部分出发,介绍应用于AD/MCI检测的研究现状。

1.1 特征提取

选择合适类型的神经影像数据和提取合适的特征,是有效提高模型分类识别能力的关键。由于MRI的广泛应用,学者们提出一系列计算指标,用于研究大脑自发振荡活动的BOLD 信号,如低频振幅( amplitudeoflow-frequencyfluctuation,ALFF)[12,14-16]、局部一致性(regional homogeneity,ReHo)[17]和功能连接(functional connectivity,FC)[18]等。

1.1.1 ALFF

ALFF 将体素的时间序列使用快速傅里叶变换转化为频域并计算得到功率谱,并将0.01 ~0.1 Hz功率谱的平方根的平均值作为每个体素的低频振幅值。静息状态下的ALFF 来自大脑神经元的自发性活动,能够代表大脑的不同生理状态,具有较高的可靠性[19]和可重复性[20],同时具有显著的生理意义。对于选择显著的脑区和合适的频带进行分析,有助于深入研究大脑发病的机制,减少在扫描过程中生理噪声和机器噪声的影响。Wang 等[16]对MCI 的研究表明,整个大脑中的ALFF 值在默认模式网络中下降,而在颞叶、额上区、枕叶和顶叶区域上升。Long 等[15]认为,MCI 患者在双侧海马体、双侧梭状回、双侧海马旁回以及左侧舌回提取出的ALFF 值明显高于健康受试者的ALEF。Tian 等[12]将0.01~0.08 Hz 的频带进一步细分成多个不同的子频带,有助于特征选择。Zuo 等[14]指出,频带范围在0.027~0.073 Hz 获得的重测可信度明显高于其他频带的值,通过该频带提取出的ALFF 与其他频带获得的ALFF 相比具有显著性差异。

1.1.2 ReHo

ReHo 借助肯德尔和谐系数,反映指定体素与周围体素的时间序列变化的相似程度。Zang 等[21]在2004年提出,大脑的活动是在一个团块中而不是单个体素,验证了ReHo 在测量脑活动方面有很高的可靠性,为研究相关的病理变化提供了可靠的理论依据。Marchitelli 等[17]指出,ReHo 在AD/MCI 与正常对照组(normal controls,NC)之间的一些脑区存在显著性差异。ReHo 值的变化表明大脑活动以及功能的异常[22-23],但是不同的变化具有不同的意义。基于MCI 患者的相关研究证实,ReHo 值的降低意味着大脑某一区域的血流量随着区域代谢率的改变而降低,ReHo 值的增加表明患者可以利用额外的认知神经资源弥补疾病早期认知功能的损失。在0.01 ~0.04 Hz 的低频ReHo 值对于大脑皮层的活动更加敏感,但是在不同频带获得的ReHo确切生物学意义还有待进一步探索[20]。

1.1.3 FC

功能连接是描述两个不同脑区BOLD fMRI 信号之间的相关程度。目前,针对FC 的研究一般通过3 种方法构建:一是基于皮尔森相关系数(Pearson correlation coefficient)的时间序列构建方法[24];二是基于典型相关分析(canonical correlation analysis,CCA)的构建方法;三是基于距离相关分析(distance correlation analysis,DCA)的构建方法。

将FC 矩阵使用Fisher Z 变换得到标准化后的FC 矩阵[18,25],以便于研究静息态大脑功能的整体特性,测量大脑不同区域之间BOLD 信号的时间同步性[26],进一步生成基于全脑的功能连接矩阵或者功能连接脑网络图。学者们对FC 的研究主要集中在两个方面:基于静态的功能连接(stationary FC,sFC)和基于动态的功能连接(dynamic FC,dFC)。静态的功能连接往往只关注整个时间序列内脑区之间的信息,忽略在整个时间序列中不同脑网络之间是如何变化的;而动态的功能连接通过使用滑动窗口策略,将整个时间序列划分为若干个重叠、等长的时间片段,从而构建每个时间片段内感兴趣区域(region of interest,ROI)之间的FC,进一步分析在多个时间片段内大脑区域之间的ROI 是如何动态变化的[27]。图1展示了单个早期轻度认知障碍(early MCI,eMCI)受试者在静息态下静态和动态的功能连接网络,dFC 通过ROI 对之间的联系可以发现大脑局部空间的依赖属性,还可以从纵向分析特定脑区的局部动态时间属性[28]。使用dFC 进行分类时,模型对滑动窗口的类型、大小以及调节步长等多个参数是敏感的[5,29-31]。

图1 单个eMCI 受试者在静息态下静态和动态的功能连接网络[28]。(a)静态网络;(b)~(g)表示使用滑动窗口方法构建的动态网络Fig. 1 The static and dynamic functional connectivity networks of single individual eMCI subject in the resting state fMRI. ( a)Static network; (b)~(g)Dynamic networks generated by sliding window approach

此外,近几年的研究表明,dFC 中包含更丰富的、复杂的、高阶的认知功能的信息[32-33],这些信息可以弥补传统sFC 的缺陷[34],解释脑网络之间的动态变化。dFC 中所存在的最大缺点就是含有较多的特征信息,增加了特征提取的难度,基于dFC 的loworder 特征对于MCI 的诊断精度不够高[28]。为了解决这一局限性,Chen 等[28]提出了采用一种基于dFC的high-order 方法,使用聚类算法将不同的ROI pairs 按照一定阈值的相似性划入不同的cluster 中,降低了特征维度,便于提取出具有区分性的特征,且对于MCI 和AD 具有较高的区分性。通过在FC的基础上进行转化,将复杂的大脑网络进行抽象化,转变为简单的网络。研究表明,脑认知功能障碍是由一系列异常脑网络所引起,与脑功能节点的异常连接有关[35]。由于大脑网络本身是一个复杂的系统,且具有Hub(Hub 是指中心节点,即某些大脑区域具有较高的聚类系数、介数中心性以及较短的路径)的分布与连接、层次性、中心性和模块性等多种网络属性。从宏观上描述不同大脑区域之间组织排列的联系情况,可以提取的特征包括最短路径、介数中心性,局部聚类系数等。Wang 等[10]通过dFC 对应到大脑信息流动过程中最重要的Hub 节点,这些节点可以有效地反映不同脑区之间信息交流的整合过程。同时,Jie 等[4]在将MCI 与NC 的脑网络转换为拓扑结构之后,设置连接强度的阈值分别为0.3 与0.5,并进行阈值化处理,最后比较发现,MCI 患者的大脑中总是有一对脑区之间的功能连接是损坏的。

1.2 特征优化

特征优化过程是对特征选择与数据降维的概括,特征选择的质量和数据降维的程度能够影响分类结果的精度[36],并对最终的识别效果起到明显的作用。

在特征优化中,通过去除小样本高维数据中噪声、冗余和不相关的特征来优选特征子集,避免模型产生过拟合,从而进行高效的分类[37]。之前的研究主要是通过3 个方面进行特征选择:基于ROI 的特征选择[18]、基于脑图谱(atlas)的特征选择[38]和基于机器学习的特征选择[18]。其中,基于ROI 和Atlas 的特征选择在一定程度上可以近似地认为是实现了数据降维,因为这两种方法都是从众多的大脑区域中选择特定的脑区进行分析。

1.2.1 ROI

基于ROI 的方法是将临床诊断经验和现存文献研究作为特征选择的依据。Wang 等[18]在研究自闭症谱系障碍(autism spectrum disorder,ASD)时,结合文献提供的MNI 空间坐标,分别将每个MNI 空间坐标作为球心,指定球体的半径生成ROI 区域。这种方法较为便捷且具有生理学意义,可以充分解释ROI 所对应的生理学与行为学意义。因为ROI是基于先验假设、根据现存的研究进行特征选择的,但往往忽略了ROI 之外的信息,所以特征选择时不能够进行更全面的评估。由于AD/MCI 患者有丧失记忆、认知与视觉等表现,并且这些功能与默认模式网络(default mode network,DMN)和视觉网络(visual network,VN)[39]等多种网络相关。研究证明,通过选取颞极、眶额皮层、颞回、海马、后扣带回和舌回等[39-40]多种与认知相关的脑区特征进行训练,所得到的模型性能更稳定,从而验证了这些大脑区域与AD/MCI 存在着联系。

1.2.2 Atlas

基于atlas 的方法是将根据预先定义的解剖标记,如自动解剖标记(automated anatomical labeling,AAL)atlas 和神经成像实验室(laboratory of neuroimaging,LONI)atlas 以及Brodmann 分区,将大脑图像分割成几个解剖区域,然后从这些特定区域选择特征。基于atlas 分析的研究表明[38],特征选择中采用不同的atlas 模板,对于分类性能的提升有着重要的意义;通过比较3 种atlas 得出结论:经过LONI 模板获得的特征在分类器模型上有更好的表现。

1.2.3 机器学习

基于机器学习算法的特征选择主要可以分为3类[26]:过滤式(filter)、包裹式(wrapper)和嵌入式(embedding)。使用统计学检验选择特征属于过滤式,通过选择低于指定阈值的体素块作为特征。例如,选择具有统计显著性(P<0.05)的特征,Salas-Gonzalez 等[41]通过使用双样本t检验的方法选择感兴趣区域的体素作为输入数据,使用分类模型进行预测。

Wang 等[18]使用的是支持向量机递归特征冗余消除 ( support vector machine-recursive feature elimination,SVM-RFE),该方法基于包裹式的后向消除的特征选择算法,通过将分类器的性能作为选择特征子集的评价标准,反复构建模型,去除最不相关的特征。最后,按照特征重要性排名,最重要的特征往往是最后去除的。由SVM-RFE 筛选出的特征子集包含有丰富的信息,可以将选择的特征推广至其他非同源数据集中,分类精确率可以达到90.86%,因此该特征选择方法具有很好的鲁棒性和泛化性。Jie 等[4]采用嵌入式特征选择算法LASSO(least absolute shrinkage and selection operator)最小化惩罚目标函数,即使用L1范数正则化稀疏化特征空间,将目标函数中大多数不相关和冗余的特征权重分配为零,通过选择非零权重的特征来实现特征选择,并不断调整LASSO 的正则化参数λ来平衡模型的复杂度和拟合优度。研究表明,LASSO 适用于存在大量无关特征的小样本数据集。

Bi 等[24]使用集成学习将随机森林与聚类进行结合,得到改进的聚类随机森林(clustering evolutionary random forest,CERF),通过对随机森林的决策树按照层次聚类,将决策树之间的相似性作为聚类准则实现优化,动态减少无关和冗余的决策树,逐步从高维特征中筛选出AD 与NC 之间最容易识别的特征。相比于使用未改进的随机森林、支持向量机分类和统计学检验等方法,该方法能成功推广至帕金森综合症(Parkinson′s disease,PD)的分类检测中,表明其对特征选择具有很强的一致性与鲁棒性。Chen 等[28]使用聚类的方法,将FC 中的ROI pairs 按照相似性划入不同的cluster,然后使用稀疏学习,从新构建的FC 中选择具有代表性的特征子集输入分类器进行决策。除了上述提到的方法外,Liang 等[42]使用梯度提升决策树(gradient boosting decision tree,GBDT)进行特征选择,GBDT通过集成一组基学习器(决策树)构建预测模型,利用已有的树的残差依次建立每棵树。GBDT 对基本梯度增强算法进行了细微的改进:将回归树拟合为负梯度后,对树叶的参数进行重新估计,使损失最小化。

1.3 识别算法

目前,在对神经影像数据进行分析的研究中,主要使用支持向量机(support vector machine,SVM)、线性判别分析(linear discriminant analysis,LDA)、随机森林(random forest,RF)、极限学习机(extreme learning machine,ELM)以及集成学习(ensemble learning)等多种机器学习算法,其中SVM被认为是目前在处理AD/MCI 的神经影像数据时具有良好学习能力的机器学习算法[18,38,43-44]。

SVM 适用于处理小样本量数据,且算法实现简单。Ahmad 等[40]把海马体、颞中回、内嗅皮层和后扣带皮层的激活体素作为特征,将SVM 与常用的算法进行比较,得出SVM 在分类AD/MCI 时是最适合的。同时,选择不同的核函数导致SVM 的分类性能具有显著性差异,但也会导致分类结果具有显著性的差异。一般来说,相比于多项式核函数,线性核和高斯核的分类效果好且精准度高。研究人员通过使用多核学习(multikernel learning,MKL)[4],分别为局部连接和全局拓扑结构属性构建向量核函数和图核函数,使用网格搜索(grid search)决定最优加权参数β 的取值。研究表明,相比传统的SVM,基于MKL 的SVM 不仅可以提高精确率,而且在特征可解释性方面更强,通过核函数的权重可以直接反映所对应的特征重要性[45-46]。集成式学习通过训练多个弱分类器的方法,最终形成一个具有较强分类能力的分类器,使得模型具有稳定的精度和强大的泛化能力。Pei 等[25]提出,使用fMRI 与基因数据进行联合判断:第一阶段基于fMRI 数据和大脑的先验知识划分出14 个ROI,并为每个ROI 分别构建线性核SVM 的基分类器,输出第一阶段的决策值;第二阶段将从基因数据中获得的特征和第一阶段的决策值作为输入特征,再次构建集成学习模型。最终结果显示,相比于一阶的集成学习性能,二阶的集成学习性能提高了大约25%。

20 世纪末,French 等[47]通过使用相同的数据集分别比较了使用人工神经网络(artificial neural network,ANN)和LDA 的分类性能,两个模型都能够有效区分正常人和患者,但是ANN 对于实际数据拟合得更好。从最近几年开始,深度神经网络在多个领域有着出色的表现。越来越多的研究者[5,10,27,48-49]使用深度学习算法进行AD/MCI 分类识别,可以大幅度提升分类性能。有研究证明[50],通过构建两个学习阶段,能够有效提高模型对于AD 的识别能力;第一阶段构建卷积层和循环层,提取区域连通性和邻近位置的特征;第二阶段建立ELM,提高模型的学习能力。Li 等[5]采用基于自适应dFC 的时空深度神经网络模型,通过自适应窗口实现对dFC 变化的及时追踪,提取fMRI 与DTI 的时空特征,在分类MCI 得到的准确率高达87.7%,同时敏感性、特异性和ROC 曲线也有不错的结果,分别为88.9%、86.5%和0.889。Wang 等[10]构建时空联合的深度神经网络模型,通过使用卷积层与循环层,分别实现了动态分割fMRI 时间序列与提取时空特性。该模型不仅二分类正确率高,而且在多分类数据上也有出色的表现,其中值得关注的是还指出有一些显著的特征存在于小脑。有研究证实,小脑会参与认知处理等过程,且与阿尔茨海默病等常见神经系统疾病存在着一定的联系[51],进一步阐释小脑某些区域的特征可以作为检测AD/MCI 的生物标志物。

有关AD/MCI 的深度学习研究结果也在一定程度上表明,利用时空信息的方法,比传统的机器学习更高效和充分。特征选择和分类识别不局限于这些算法,但是复杂的算法并不一定是性能最好的,同时模型的复杂程度会降低在其他数据集上特征选择和分类识别的泛化能力和实用性[24]。

在评估分类模型的性能时,通常采用K折交叉验证(K=5 或者K=10)。该方法不仅可以评估分类算法的性能,还可以在一定程度上减少过拟合的风险。一个模型的好坏并不限于评估分类准确率(accuracy),而是应该将精确率(precision)和召回率(recall)或者灵敏度( sensitive)和特异性(specificity)、F1-score 和ROC 曲线等多个指标纳入考虑。当数据集分布不平衡时[4],通过计算精确率与召回率的算术平均数进行评估,实现对分类模型性能的客观全面评估。

2 挑战

随着智能医学诊断的发展,机器学习、深度学习与神经影像技术的不断融合,能够越来越多地为临床医生提供一些有针对性的辅助诊断意见,进而给予患者有效的治疗。但是,目前有关AD/MCI 与NC 的二分类智能诊断仍然面临着以下挑战。

1)难以获得大量数据样本。相比于其他医学检测,fMRI 的成本较高,能够获得相关疾病的数据样本很少,导致大多数文献中的样本量小、数据分布不平衡。一般认为,小样本数据集中提取的特征不能清晰地反映不同类别之间的差异,容易产生过拟合现象,同时对于未知数据泛化能力较差;而对于样本量较大的数据集,情况与之相反。在提取特征的时候,缺乏互补的时空特征信息可能会影响脑疾病分类模型的性能[5]。

2)模型复杂度与成本开销之间的平衡。相较其他传统模型来说,深度学习模型识别率有显著的提高,约有10%;但计算机本身开销过大,训练模型时间过长,过于复杂的模型,对于分类结果的可解释性也增加了一定的难度。同时,很少有研究会将所提出的方法应用在其他非同源数据集或者其他退行性神经疾病数据集中,测试验证模型的稳定性以及泛化能力。所以,如何使模型在特征提取与选择的阶段选择关键性的特征是实现精确诊断的突破口。

3)研究中的数据模态过于单一。多模态数据融合分析是目前脑研究的一个新兴领域,现在大多数有关AD/MCI 的研究主要使用的是fMRI 数据或者简单地与人口学信息进行融合,少量的研究会结合其他的神经影像数据,极少的研究会采用与基因信息进行融合分析,进一步探讨NC 转化为AD/MCI有关大脑内源性和本质性的问题。由于不同模态之间异质性的数据可以进行信息相互补充,所以多模态融合分析能够大幅度提升分类结果,因此充分融合多种模态的数据是一个关键性的问题。

3 展望

为了降低及预防未来老龄化人口转化为AD/MCI 的风险,除了借鉴数学和计算机领域中的知识构建新模型来提高AD 及其早期阶段(即MCI)的识别之外,未来可以考虑从以下两个方面着手进行研究。一方面,将fMRI 与其他神经影像数据融合。不同的影像数据反映了大脑的不同变化指标,例如:结构磁共振成像(structural MRI,sMRI)表征皮层厚度、体积、表面积以及区域组织密度,弥散张量成像(diffusion tensor imaging,DTI)表征白质纤维束的走向和分布氟脱氧葡萄糖- 正电子体层扫描( fluorodeoxyglucose positron-emission tomography,FDG-PET)则表征大脑区域葡萄糖的代谢能力等。另一方面,将MCI 的检查关口继续前移,加强对MCI 的前期临床诊断(preclinical stage of cognitive impairment,PCI)。对PCI 的临床研究是一个发展趋势,以寻求在轻度认知障碍前期阶段的预诊和干预。例如,有研究表明,小血管病转化为轻度认知障碍的风险较高。已有研究[52]尝试,从磁共振影像来探索小血管病相对于正常对照以及轻度认知障碍的异常。例如,NC、PCI 和MCI 之间存在相关以及显著性差异的指标,因此对PCI 等的判断有可能是重要的研究趋势。另外,生物学意义上的特征选择和AD/MCI 异质性的表征也可能是未来研究的重要方向,可为实现对AD/MCI 的早诊断、早干预提供行之有效的办法。

猜你喜欢
特征选择大脑分类
正交基低冗余无监督特征选择法
分类算一算
基于词向量的文本特征选择方法研究
教你一招:数的分类
说说分类那些事
基于特征聚类集成技术的在线特征选择
Kmeans 应用与特征选择
给塑料分分类吧