刁万里 张晓玲 马蔚蔚
随着老龄化社会的到来,阿尔茨海默病(Alzheimer's disease,AD)的发病率逐年上升,给社会带来严重负担,如何对早期AD患者做出准确诊断成为研究重点[1]。根据神经影像进行AD诊断是当前该领域常用的方法之一,现在常用的脑成像技术有MRI、CT和正电子发射计算机断层显像(positron emission tomography,PET)等。在观察影像的过程中,由于阅片者的临床经验不同,存在主观差异,常常导致诊断结果出现误差。为解决这些问题,人们开始借助人工智能来分析各种神经影像,以便给临床工作者带来更精准、更快捷的诊疗,这一过程即为基于人工智能辅助的AD神经影像诊断。人工智能用于AD影像诊断的主要优势是能在前驱期甚至远在临床表现之前检测出AD[2],在早期诊断和预测临床进展方面有很大帮助。
1.1 人工智能在MRI中的应用 目前多利用结构磁共振(structural magnetic resonance imaging,sMRI)、功能磁共振(functional magnetic resonance imaging,fMRI),以及不同的fMRI序列如弥散张量成像(diffusion tensor iamging,DTI)、MRI波谱等单一或多模态数据,对AD与轻度认知功能障碍(mild cognitive impairment,MCI)分类研究,均具有一定的诊断准确度。但由于MRI波谱空间分辨率低,易受感兴趣区周围血管及脑脊液的干扰,且尚未被纳入AD诊断标准,目前鲜有基于人工智能的MRI波谱应用于AD诊断的文献报道。
1.1.1 sMRIsMRI可清晰区分灰质和白质,且可以通过三维方式来观察脑形态,是诊断AD的首选检查,因而在AD辅助诊断及病情监测中的应用最为广泛[3]。目前常用于评估结构变化的特征提取方法有密度图、皮质表面、基于海马等AD相关区域的特征提取。有学者认为内侧颞叶萎缩(medial temporallobe atrophy,MTA)可作为AD早期诊断的生物标志,且与疾病严重程度相关[4]。目前临床使用最广泛的是Scheltens等[5]提出的内侧颞叶萎缩视觉评估表,但人工视觉评估具有一定缺点,比如,不同医师之间评分一致性低,评分比较费时繁琐[6]。最近Koikkalainen等[7]研究了MTA自动评分方法,从T1加权和FLAIR图像中提取海马等成像生物标志物,建立了一个回归模型,结果显示计算机的自动评分比人工视觉评分表现更好。计算机自动评分模型的主要优势是没有随机性,可以提高不同医疗机构、研究团队和队列之间的评级一致性。在AD分类研究中,早期有研究人员使用线性支持向量机(support vector machine,SVM)以脑灰质密度图对AD和认知正常(cognitively normal,CN)进行分类,其准确率达88%[8]。另有研究人员为进一步提高分类模型的准确度、更好地适用不同的数据集,通过减少特征实现降维。如Liu等[9]使用sMRI图像结合SVM,通过以主视图集为主、侧视图集为辅来选择最具区分性的特征,测得AD/CN的分类准确率达92.51%。近年来,基于深度学习的分类模型越来越多,目前深度学习在识别复杂高维数据中的复杂结构方面表现出优于传统机器学习的性能,特别是在图像处理方面。Tufail等[10]使用深层3D卷积神经网络分类器,从sMRI上提取结构特征,对AD/CN的分类准确率高达95%,准确率诊断能力大幅提升。sMRI为AD研究提供了解剖基础,可以准确检测AD进展过程中大脑萎缩的位置和严重程度,对sMRI的分析有助于揭示MCI转化为AD的风险因素。但部分患者早期脑组织结构无明显变化,且其他因素也可引起脑结构的改变,如外伤、脑血管病等因素。同时sMRI无法显示AD患者脑功能连接的变化,对诊断AD有一定的局限性。总体来看,在AD早期阶段使用sMRI的诊断效果尚可,但仍需进一步提高。
1.1.2 fMRI 相比于传统的MRI检查,fMRI能够有效反映出组织中微观结构、血流灌注、代谢及功能等状态,可为AD患者提供脑功能活动和连接性变化[11]。fMRI有静息态和任务态,但因AD患者配合任务比较困难,使得任务态fMRI研究开展具有一些局限性。静息态fMRI(resting-state functional magnetic resonance imaging,rs-fMRI)作为一种新的功能性成像技术,可操作性强,排除了任务的干扰,可观察到脑部疾病对脑功能的破坏情况,尤其适合应用于AD和MCI的研究[12]。在早期,Tripoliti等[13]使用rs-fMRI图像,通过随机森林算法对AD和CN进行分类,其准确率只有84%。目前越来越多的学者基于深度学习开发分类模型,取得较高的准确率,比传统机器学习方法更稳定可靠[14]。Farheen等[15]在基于ResNet-18的架构,对rs-fMRI图像进行纵向队列研究,对6个疾病阶段(CN、严重记忆问题、早期轻度认知障碍、MCI、晚期轻度认知障碍和AD)的平均分类准确率达到了97.92%。与此类似,Duc等[16]开发了一种三维卷积神经网络结构,以fMRI脑图像获得的功能性三维独立分量空间图用作分类和回归任务中的特征,成功地实现对AD和CN的分类,准确率达到85.27%。虽然fMRI对AD病理生理学有独特的优点,但其在临床工作中并未被常规使用。这是由于其局限性,包括低信号和对比度噪声比,以及血氧水平信号作为神经元活动衡量标准的有效性仍值得怀疑。总体来说,基于fMRI构建的不同算法的分类模型,分类准确度相对较高,使用3D深度学习框架的卷积神经网络的新型分类模型是未来的发展方向,值得扩大样本量做更深入的研究。
1.1.3 DTI DTI的优势在于它能准确地描述白质束的运动过程和细微变化。它是唯一能显示神经系统白质束完整性的无创成像技术,已被应用于AD和MCI患者MRI扫描序列,以检测关键区域和整个大脑的白质损伤[17]。目前基于DTI图像的人工智能算法主要采用SVM,特征提取方法主要有纤维束成像、结构连接网络测量和区别体素选择。Wee等[18]采用连接网络测量的方法,将脑区纤维数量做为特征,对MCI患者和CN分类,准确率达88.9%。Nir等[19]使用追踪成像来定位纤维,计算最大密度路径的分数各向异性、平均扩散率,成功将AD患者和MCI患者进行分类,AD/CN分类准确率达80.6%,但MCI/CN的准确率只有68.3%。Dyrba等[20]采用选择有区别的体素来降低DTI数据的维数,并使用所选择的体素的扩散度量作为分类的特征,结果提示AD/CN分类准确率为83.0%,MCI/CN的准确率只有77.0%。最近Marzban等[21]采用深度学习算法结合DTI图像,AD/CN和MCI/CN的准确率分别为93.5%和79.6%。虽然基于DTI的人工智能对AD分类有了一定的准确率,但较sMRI、fMRI及PET等影像模态的准确率偏低,且DTI技术本身存在一定的缺点,比如,虽然DTI成像和神经病理学之间存在关联,但目前还不能使用DTI指标来可视化疾病的进展。同时,DTI技术对运动特别敏感,这可能会产生伪影,而DTI扫描时间偏长,这可能会增加产生伪影的概率,对结果造成偏差。未来我们可以通过改进算法或结合其他影像模态来提高DTI对AD诊断的准确率。
1.2 人工智能在PET中的应用 脑脱氧葡萄糖PET(fluorodeoxyglucose PET,FDG PET)上葡萄糖代谢的特征和淀粉样蛋白PET(beta-amyloid peptides PET,Aβ PET)上Aβ沉积的特征有助于区分AD患者和CN[22]。在脑顶叶、颞叶、后扣带回皮质和海马等区域中低代谢与AD之间存在关联,AD患者与健康人相比,Aβ沉积更多[23-24]。因此,使用FDG PET和Aβ PET可作为AD分类的生物标志。另外,神经成像技术的进步推动了针对tau蛋白的PET示踪剂的发展,如THK5351和THK5357[25]。这些图像有助于监测疾病的进展,但目前尚无关于使用tau-PET通过人工智能方法预测AD进展的研究。
1.2.118F-FDG PET18F-FDG PET可显示AD患者大脑皮质持续进展的低代谢变化部位及范围,在检出发生形态学改变之前的AD患者大脑病理生理变化更有优势,且研究显示18F-FDG PET对AD的诊断准确率相比单光子发射断层扫描更高[26],目前18F-FDG PET显像已被纳入新的AD诊断标准[27]。Lu等[28]采用基于深度神经网络的分类方法,仅使用单个模态(FDG PET/MR)对AD/CN的分类就获得了93.58%的准确率,比先前发表的最好的方法提高了1.28%[29]。为了解决传统分类算法对脑图像预处理的高度依赖,Liu等[30]提出了一种新的基于2D卷积神经网络和递归神经网络相结合的分类框架,该框架在将3D18F-FDG PET/MR图像分解为一系列2D切片后,学习切片内和切片间特征进行分类,并进行十折交叉验证以减少随机因素的影响,对AD和CN的分类取得了较高的准确度。在AD预测方面,Yang等[31]使用快速特征嵌入卷积结构结合18F-FDG PET/MR图像的研究表明,在MCI转化预测方面,灵敏度和特异度分别为91.02%和77.63%,为AD的预测提供了较为准确的参考模型。Ding等[32]采用基于InceptionV3架构的卷积神经网络来预测AD诊断结果,并与放射阅片者的识别能力进行比较,结果提示该算法优于放射科医师的识别能力。
1.2.2 Aβ PET Aβ是AD进展过程的主要病理变化之一[33]。一些放射性配体被用来测量Aβ沉积,例如11C-匹兹堡化合物(11C-Pittsburgh compound B,11CPIB)、18F-florbetapir、18F-flutemetamol和18F-florbetaben[34]。在早些时候,Vandenberghe等[35]使用18F-flutemamol PET扫描的所有体素的强度值作为基于SVM的AD与CN受试者的分类特征,结果显示AD/CN分类准确率为88.46%。最近,Zhou等[36]使用18F-florbetapir PET/MRI图像,采用卷积神经网络构建模型对AD进行分类,该模型区分AD/CN组的准确率为91.68%;区分MCI/CN组的准确率为87.25%;区分AD/MCI组的准确率为80.35%。
PET显像在AD的早期诊断中比sMRI具有更高的价值,随着新型对比剂的研发和定量分析方法的改进,PET显像必将在AD病因学研究,以及诊断和治疗等领域发挥更大的作用。然而,PET显像有其局限性,目前未得到广泛使用,而且价格相对昂贵,需要静脉注射放射性标记剂,比MRI更具侵入性,患者接受度低。目前不同的人工智能分类算法已经成功应用于FDG PET和Aβ PET,且均取得了较好的分类效果,希望未来有更多的研究者进行更深入的研究。
1.3 人工智能在AD多模态影像研究中的应用 AD多模态影像是指从不同角度捕捉生物标记信息,而不是由一个模态呈现,从而进一步提高分类的准确度。sMRI是这些研究的一个关键组成部分,它的特征与从各种其他模式提取的特征相结合来改进分类。在此背景下,不同的学者将基于sMRI的特征与由DTI和fMRI计算的特征相结合,根据sMRI计算的区域体积测量值和根据fMRI计算的FA已经结合用于不同痴呆类型的鉴别[37]。Hojjati等[38]通过 sMRI和 fMRI图像,基于SVM算法,对AD/CN分类的准确率达97%。sMRI、PET与脑脊液(cerebrospinal fluid,CSF)生物标志物等结合又构成另一个维度。在最近的研究中,Zhu等[29]结合了sMRI、PET和CSF生物标志物,并提出了一个基于矩阵相似性的损失函数,对AD/CN的分类准确率达95.9%,MCI/CN分类准确率为82.0%。也有学者将sMRI、PET和CSF生物标记物与基因数据和神经心理状态检查分数相结合。Khatri等[39]结合了早期AD识别的结构变化与认知评分、载脂蛋白E基因和CSF等生物标志物,对AD/CN分类的准确率达97.31%,对MCI/CN分类的准确率达91.72%。多模态影像对AD的诊断和预测具有重要意义。然而,临床上最常用的只有sMRI用于MCI和AD的诊断,其它模式MRI的使用较少。总的来说,多模态技术较单模态技术准确率有提高,多模态神经影像和CSF生物标志物相结合时,分类性能达到最佳。
人工智能在医学图像处理中的广泛应用,使得医学图像处理逐渐实现智能化。虽然目前在AD影像诊断中使用最广泛的分类算法是SVM、多核学习等传统机器学习方法,但由于传统机器学习方法多是直接根据特征对样本进行分类,很少进行特征变换或选择,使得传统的机器学习技术存在很大局限,即模型的效果非常依赖于上游提供的特征。近年来,深度学习被广泛用于AD影像诊断,特别是在图像的分类识别领域。深度学习能从高维的神经影像数据中提取有意义的特征,可以实现对特征的多次变换。笔者认为,在神经影像分类中,如何改进深度学习模型,使传统二分类转向多分类,提高分类的准确度和灵敏度是深度学习方法在该领域发展的方向之一,如果有更大的神经成像数据集可用或开发了基于现有数据的改进训练方法,未来基于深度学习的人工智能将大大提高AD的诊断准确率。
虽然目前基于人工智能的AD影像诊断研究方兴未艾,但也面临着许多挑战,主要表现在以下几方面:(1)数据量:目前大多研究为小样本,标记数据的缺乏仍然是人工智能在AD影像诊断应用发展的一个重要瓶颈。(2)目前单一模态研究居多,未充分利用多模态信息,可能是目前研究准确度较低的重要原因。(3)疾病的发展是一个连续的过程,但目前大多关于预后的研究都是二元分类问题,但同样在2年内进展为AD的患者,他们的疾病进展道路也可能出现很大差异。(4)AD异质性:目前大多数的研究忽略了AD临床异质性,应该收集更具异质性和代表性的临床人群,并在研究中进行前瞻性随访,以获得预测AD进展的更可靠的工具[40]。(5)使用患者脑图像训练这些人工智能模型可能会带来数据安全和隐私方面的伦理问题。如何更好解决以上这些问题是今后人工智能在AD影像诊断上运用并加以突破所必须考虑的。
近些年,基于人工智能的AD影像诊断研究越来越多,目前大多采用sMRI、fMRI、DTI、PET等进行MCI与AD的分类研究,尽管得到了比较高的准确率,但单一的神经成像模式有一定局限,寻求在不同脑影像上发现神经退变模式的多模态方法也越来越受到关注。这些影像形成了AD各阶段的独特成像特征,通过结合多种分类算法的输出来改进分类模型,能实现AD的早期诊断并预测疾病的发展。