脑部PET 图像在阿尔茨海默病早期诊断中的应用

2021-04-22 01:10林万云杜民
北京生物医学工程 2021年2期
关键词:脑部卷积图像

林万云 杜民

0 引言

阿尔茨海默病(Alzheimer disease, AD)是一种退行性神经系统疾病。该病是一种最常见的痴呆疾病,占所有痴呆疾病的60%~70%[1]。患有该病的患者往往会经历渐进的认知衰退、语言障碍和定向障碍。到2015年,全世界已有约300万人患有老年痴呆症,预计这一数字在未来40年将增加3倍[2]。目前还没有发现有效的药物或方法来治疗该疾病或阻止其发展,如果患者被诊断为老年痴呆症,大多数治疗方法都将无效。该病的进展是一个持续的过程,其发病过程大致可分为正常人(normal control,NC) 、轻度认知障碍(mild cognitive impairment,MCI) 以及AD。对早期AD的诊断并提前采取措施进行干预能够减缓病情,降低发病概率或推迟发病,因此对于MCI阶段的研究更加重要。当前,中国人口老龄化问题日益突出,因此AD的早期诊断和治疗至关重要,不仅可以减轻个人家庭负担,而且可以减少社会资源的消耗。

研究表明,早期MCI患者的大脑内侧颞叶开始萎缩,其中海马萎缩最为严重[3-4]。早期AD的发现和治疗,可以有效地减少患者大脑功能的恶化。已经有许多相关研究将传统机器学习方法应用于磁共振图像(magnetic resonance image,MRI)中并取得不错结果。例如,利用MRI解剖学特征的变化,提出一种使用极限学习机来诊断AD以及MCI的方法[5],以及基于MRI提取脑部海马区域纹理特征参数建立AD早期分类预测的模型[6]。还有一些研究使用基于卷积神经网络(convolutional neural networks,CNN)的端到端的深度学习方法。例如,采用2D CNN模型和2D MRI切片数据来进行AD诊断[7],以及从3D 图像中提取2.5D的数据[8-9]来进行AD的诊断。然而,脑萎缩的发生是一个渐进的过程,早期难以察觉,再考虑到正常衰老导致脑部正常萎缩的情况,该病早期引起的脑部萎缩很难被发现。MRI是结构像,虽然图像质量高,可以清楚看到脑部结构但无法反映组织内部情况。正电子发射型计算机断层显像(positron emission computed tomography,PET)是功能像,能够反映人体内部代谢情况,是核医学领域比较先进的临床检查影像技术。在AD的早期阶段海马体等区域萎缩并不明显,但是内部的代谢情况已经有较大改变,因此从PET图像中可以更好地获取相关的疾病信息。此外,由于所研究医学图像都是3D的,大脑的不同区域之间存在一定的联系,如果直接从3D图像上取2D或2.5D切片数据势必会丢失这一部分的信息,这会导致三维图像中空间位置信息无法得到充分利用。

相比于MRI,使用PET图像可以更容易获取早期AD大脑的变化。相比于传统机器学习方法,CNN方法可以实现端到端的预测。相比于2D或2.5D CNN,3D CNN可以充分利用MRI、PET影像的三维空间位置信息。MRI、PET等图像是含有大量体素的三维图像,其中大部分区域与AD关系不大[10-11],直接使用全图的话,不仅造成计算资源的浪费,可能冗余数据还会对最终结果产生影响。因此,本文拟采用基于PET模态数据的3D CNN模型,通过充分利用MRI、PET影像的三维空间位置信息,并且选取海马体附近区域作为感兴趣区域(region of interst,ROI)加快疾病识别效率,实现了AD的智能早期辅助诊断(即3年发病的预测)。总体算法流程如图1所示。

图1 算法流程图Figure 1 Algorithm flowchart

1 研究方法

1.1 数据集

本文使用的数据来自阿尔茨海默病神经影像学倡议(Alzheimer’s Disease Neuroimaging Initiative,ADNI)数据库。ADNI是一项正在进行的纵向研究,为了测试MRI、PET、其他生物标志物以及临床和神经心理学评估是否可以结合起来,用以早期检测和跟踪AD,并衡量MCI的进展。在本研究中,使用来自该数据集的T1-MRI和氟代脱氧葡萄糖(fludeoxyglucose,FDG)PET。该数据库中病例标签有AD、MCI和NC,本文主要研究MCI阶段。MCI受试者根据精神疾病诊断与统计手册(The Diagnostic and Statistical Manual of Mental Disorders,DSM)第5版标准分为进展型轻度认知障碍(progressive mild cognitive impairment,pMCI)和稳定型轻度认知障碍(stable mild cognitive impairment,sMCI),即MCI如果在3年内发展为AD,应定义为pMCI,如果没有发展为AD,则定义为sMCI,随访数据不超过3年的受试者被忽略。AD与NC是较容易区分的,在大量已发表的研究中使用深度学习方法可达90%以上[12]。而sMCI和pMCI较难区分,准确率一般为60%~70%[13]。本研究数据使用的详细情况如表1所示。注意,同一位患者如果在不同时间进行检测会有多张图片,即一位患者可以有几张不同的图像。

表1 实验中数据使用情况Table 1 Data usage in the experiment

1.2 数据预处理

使用zxhtools[14]的zxhreg和zxhtransform,将MR图像重新采样到221×257×221的分辨率和1 mm的间距,即每个像素值表示实际的1 mm距离。每个PET图像配准到各自的MR图像上,获得配对的图像。由于海马体在AD诊断中具有重要意义,所以选择海马体中心大小为96×96×48的区域进行裁剪获取所需的ROI数据块。数据可视化展示见图2。

1.3 神经网络与3D CNN

CNN是一种多层神经网络,擅长处理图像特别是大图像的相关机器学习问题。CNN通过卷积层与池化层配合,组成多个卷积组,逐层提取特征,可以将数据量庞大的图像识别问题不断降维,最终使其能够被训练。总之,CNN通过卷积来提取特征,并且通过卷积的权值共享及池化层来降低网络参数的数量级,最后通过传统神经网络全连接FC(fully connected,FC)层完成分类等任务,后续又发展出了许多先进的网络如AlexNet[15]、VGG[16]、ResNet[17]等。

3D CNN是在2D CNN的基础上改变而来,在2D CNN中,卷积核沿2个方向移动,2D CNN的输入和输出数据是3维的。而在3D CNN中,卷积核沿3个方向移动,3D CNN的输入和输出数据是4维的,主要用于3D图像数据。多出的一个维度是除了图片本身的维度外再加上一个通道数。

本文根据数据集大小及实际情况,构建了一个3D CNN,其网络结构如表2所示。该模型由4层卷积层和2层FC层组成。每层卷积层后都接有一个最大池化层来减少参数量。第一层FC层有512个结点,第二层FC层有2个节点,最后通过一个softmax层,模型输出疾病预测的标签。

表2 3D CNN的结构Table 2 3D CNN structure

图2 数据可视化展示Figure 2 Data visualization display

1.4 评价指标

评估模型性能,目前常常采用的评价指标有准确率(accuracy),特异度(specificity)、灵敏度(sensitivity)等。

式中:TP(true positive)、TN(true negative)、FP(false positive)和FN(false negative)分别代表真阳性率、真阴性率、假阳性率和假阴性率。还有一些其他常见的评价指标如受试者工作特性曲线(receiver operating characteristic curve,ROC曲线)、曲线下面积(area under curve,AUC)等。ROC曲线是以真阳性率(灵敏度)为纵坐标,假阳性率为横坐标绘制的曲线。ROC曲线越靠近左上角,AUC值越大,表明性能越好。

2 实验结果

2.1 实验设置

本文所有网络模型都是基于PyTorch编程,所有实验都在一块Nvidia GTX1080 GPU上进行。为了加速训练过程并避免局部最小值,使用ADAM优化器作为优化[18],初始学习率设置为0.000 1。归一化方式选择批量归一化(batch normalization,BN),批量训练大小设置为16, Relu作为激活函数。交叉熵损失(cross-entropy loss)作为损失函数。使用PyTorch中的nn.Linear实现两层FC层。epoch数设置为60。在训练过程中,模型的参数每5个epoch保存一次。

此外,为了避免数据泄露问题[19-20],研究组将数据集根据患者编号随机拆分以保证同一患者的所有影像数据只出现在训练集、验证集、测试集的某一个集合里。由于数据样本数量不大,为了保证原始数据集的每个样本都有机会出现在训练集和测试集中,采用10折交叉验证方法。最后,在训练集上进行训练,在验证集上选择最佳模型,在测试集上做最后的测试,训练集、验证集、测试集数据的比例是7∶2∶1。

2.2 结果

为评估设计的模型是否合理,必须选用其他模型使用相同的数据进行对比实验分析。本实验选择VGG和ResNet作为对比模型,因为这两个模型不但是计算机视觉中两个经典的模型,而且在许多分类和分割等比赛中都有较好表现,是公认的在实际中效果比较稳定比较好的模型并且实现起来也比较容易。此外,已发表论文中也有许多是用VGG和ResNet系列的模型做对比实验,因此本实验采用3D VGG11和3D ResNet18作为对比模型。为保证实验准确性,对这3种模型使用相同的参数设置。基于MRI数据sMCI、pMCI分类实验结果如表3所示。基于PET数据sMCI、pMCI分类实验结果如表4所示。ROC曲线如图3所示。

图3 sMCI与pMCI的受试者工作特征曲线Figure 3 Receiver operating characteristic curves for sMCI and pMCI

从表3可以看到3D CNN模型准确率、敏感度分别达到65.37%、69.44%,ROC曲线下面积如图3(a)最大,为65.23%,优于作为对比模型的VGG和ResNet。VGG也取得了不错的效果,特异度达到61.66%,比本文模型略高一些。从表4可以看到和表3中类似的结果,准确率、敏感度分别达到71.19%、79.29%,ROC曲线下面积如图3(b)最大,为71.09%,也优于作为对比模型的VGG和ResNet。结果表明,设计的3D CNN模型对于本研究涉及的分类任务是合理的,与另外两个模型相比,在多个评价指标上都取得了不错的结果。

表3 各模型在MRI数据上的表现(单位:%)Table 3 The performance of each model on MRI data (unit:%)

通过对比表3和表4,以及图3的结果发现,如果采用相同的模型但使用不同的数据,则模型在PET图像上的效果要比在MR 图像上的结果要好。实验结果表明,在AD的早期诊断中,PET数据比MRI更有优势。

表4 各模型在PET数据上的表现(单位:%)Table 4 The performance of each model on PET data(unit:%)

3 讨论

本研究通过设计一个3D CNN模型,分别采用MRI、PET图像进行AD的早期诊断实验。根据表3、表4实验结果可以看到各模型使用PET数据时,准确率、敏感度、特异度等指标均高于使用MRI数据时的结果,这符合本文引言中所说的,在AD早期阶段脑萎缩还不明显的时候,脑部相关区域代谢已经有较明显变化,PET是功能像正好能比较敏感地反映出这些区域的代谢变化,而MRI是结构像无法做到这一点,因此PET图像在AD早期诊断中可以获得比MRI更好的效果。Coimbra等[21]使用FDG进行PET成像检测局部脑代谢的变化,再结合传统医学评估,可以对AD进行更灵敏、准确的早期诊断。Lin[22]由MRI图像合成相对应的PET图像,进一步提高诊断准确率。Marcus等[23]等通过分析脑部PET图像中葡萄糖代谢的模式特征可以将AD与其他痴呆病因区分开,这样的结果对于本实验有一定的启发性,同时表明PET成像在评估AD病程中具有重要价值。

本模型与对比模型相比有较好的结果。因为,与大多数图像分类模型的结构相比,本研究组在第一层卷积层中使用较小尺寸的卷积核来防止过早的下采样,而ResNet在第一层使用较大尺寸的卷积核并且使用较大的步长来迅速减小输入图像的尺寸,虽然这样做可以减少参数加快计算速度,但是由于CNN在前面层主要提取一些浅层的特征,到后面层的CNN才会提取到高级的语义特征,所以在第1层使用大步长和大尺寸卷积核会导致在前面层就丢失大量信息,这可能对结果产生不利影响。本模型在越前面的层使用越小尺寸的卷积核和越小的步长,充分保留相关的特征信息。等到后面层已经提取到有效的语义层次的信息,这时就采用较大尺寸的卷积核和步长,不仅可以减少参数量,加快运算速度,还能去除大量冗余信息,避免冗余信息对结果产生不利影响。此外,在实验中使用的是ROI数据块,输入尺寸仅为96×96×48, 因此,模型在前面层使用大步长和大尺寸卷积核使输入尺寸迅速减小过多会导致严重的性能下降。还有一个可能的原因是本研究的病例样本数量只有几百个,不宜采用太深的模型,否则容易出现过拟合等问题。先前介绍中已有大量研究使用端到端CNN方法来进行疾病的诊断,并取得非常不错的结果,这表明采用CNN进行疾病的诊断具有巨大潜能。本研究所提出的方法也展示了良好的结果,对于AD的早期诊断具有一定的辅助作用,具备进一步研究的意义。本实验的不足之处在于对AD早期诊断的准确率仍有很大的提升空间,如果需要进一步提高预测结果,则需要进一步结合临床实际探索更加合理有效并且更具有可解释性的方法[例如,收集不同模态数据的信息如MRI、PET、脑脊液(cerebro-spinal fluid,CSF)、基因等信息并设计有效的融合方法融合这些信息],因此,更为具体的实验方案有待建立和实施。

4 结论

本研究从ADNI数据库获得数据后对原始数据进行相关的预处理,同时设计了一种3D CNN模型用于快速准确地对AD进行早期诊断。还对比了MRI和PET图像对于AD诊断的结果,实验结果表明脑部PET图像在AD早期诊断中具有非常好的效果,对于疾病的相关研究以及早期诊断具有重大意义。本研究样本有限,对于所设计模型的更多测试还需要进一步跟踪ADNI数据库以及对比其他深度学习方法,进一步优化实验方法。

猜你喜欢
脑部卷积图像
改进的LapSRN遥感图像超分辨重建
基于3D-Winograd的快速卷积算法设计及FPGA实现
有趣的图像诗
脑部三维核磁共振图像分析
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
12400年前“木乃伊狗”
俄国现12400年前“木乃伊狗” 大脑保存完好
压抑食欲使人笨
一种基于卷积神经网络的性别识别方法