宋娆,吴小佳,李传明,刘欢,郭大静,汤琳
阿尔茨海默病(Alzheimer disease,AD)是痴呆最常见的原因,通常隐匿起病,患者会逐渐出现记力减退和认知功能障碍等,随着疾病进展上述表现逐渐加重。由于绝大多数患者在出现典型的临床症状时,其神经病理改变已存在多年,因而AD的早期诊断尤为重要[1]。2018年,美国国家老年研究所和阿尔茨海默病协会创建了新的AD研究框架,旨在通过“ATN”生物标记物从生物学上定义AD,其中A代表β淀粉样蛋白沉积、T代表tau蛋白沉积,N代表神经变性[2]。只要同时具备A和T的证据(即A+和T+),不管临床症状有无,都可以诊断为AD。不难看出,ATN标准的提出将AD的早期诊断大大提前,有助于在AD临床前期阶段采取干预措施,延缓病情进展[3-5]。
一项针对认知正常(cognitively normal,CN)个体的长期认知轨迹的研究发现,基线为A+T+N+的CN个体在随访过程中认知功能下降的风险最高,且远远高于A+T+N-组,这可能提示N指标对于预测认知进展有重要作用[6]。以往的研究中仅使用单个指标来评估N,如海马体积或平均皮层厚度[7-9],忽略了许多重要的脑区。作为一门新学科,影像组学可以实现从全脑提取大量高通量成像特征,并对特征进行量化分析和模型构建,从而间接反映脑内病变与病理的潜在关联,有助于提高诊断及预后评估的准确性[10-12]。
轻度认知障碍(mild cognitive impairment,MCI)被认为是正常衰老与AD之间的中间阶段,是有可能发展为AD的潜在目标人群。据估计,每年有10%~20%的MCI患者转化为痴呆患者[13]。因此,准确预测MCI是否以及何时会进展为AD至关重要。本文运用影像组学方法来评估N指标,探讨基线ATN分类状态联合临床危险因素对MCI患者认知障碍进展的预测价值,并构建列线图预测模型,用于个性化评估MCI患者的认知进展情况。
自阿尔茨海默病神经影像学计划(ADNI)数据库(http://www.loni.usc.edu/du)纳入472例受试者的数据,包括认知正常(CN)被试147例、MC1患者197例和AD患者128例。在5年的随访时间内,MCI患者中有100例进展为痴呆,其余97例认知功能保持稳定,记录MCI患者认知障碍进展(从MCI进展为痴呆)的时间以及认知状态保持稳定的时间。CN被试在基线及整个随访期内均保持为CN。所有受试者均有完整的基线临床和实验室检查资料。主要指标:年龄、性别、受教育年限、体质指数(body mass index,BMI)、载脂蛋白Eε4(apolipoprotein ε4,APOEε4)等位基因(采用聚合酶链反应-限制性片段多态性方法进行APOE基因分型)、Fazekas分级(用于评价脑白质病变的严重程度,包括侧脑室旁白质和脑深部白质,分为0~3级)、CSF淀粉样蛋白Aβ42水平、CSF磷酸化tau(P-tau)水平、简易智力状态量表(Mini-Mental State Examination,MMSE)评分、阿尔茨海默病评估量表(Alzheimer's Disease Assessment Scale-Cognitive subscale,ADAS-Cog)11和13评分、临床痴呆评定量表(Clinical Dementia Rating,CDR)评分、临床活动调查问卷(Functional Activities Questionnaire,FAQ)得分、临床活动调查问卷(Geriatric Depression Scale,GDS)得分、雷伊听觉词语即刻测试(Rey Auditory Verbal Learning Test- immediate,RAVLT-I)得分、RAVLT学习(learning)测试(RAVLT-L)得分、RAVLT 遗忘(forgetting)测试(RAVLT-F)得分、雷伊听觉词语每项遗忘(percent forgetting)测试(RAVLT-PF)得分及动物词汇流畅性测试(Animal Fluency Test,AFT)得分。
T1WI采用三维磁化准备快速梯度回波(magne-tization-prepared rapid gradient-echo,MPRAGE)序列或等效序列获得。其中,261例受试者使用Siemens Trio Tim 3.0T磁共振扫描仪进行全脑扫描,扫描参数:TR 2300 ms,TE 3.0 ms,TI 900 ms,翻转角9°,层厚1.2 mm,矩阵240×256;128 例受试者使用GE 3.0T磁共振扫描仪,扫描参数:TR 7.0 ms,TE 2.8 ms,TI 400 ms,翻转角11°,层厚1.2 mm,矩阵256×256;83例受试者使用Philips Intera 3.0T磁共振扫描仪,扫描参数:TR 6.8 ms,TE 3.1 ms,TI 0 ms,翻转角9°,层厚1.2 mm,矩阵256×256。所有受试者扫描参数的相关信息于2020年经批准后在ADNI官方网站下载获得。
本研究中仅基于T1WI序列进行影像组学特征的提取。使用FreeSurfer 6.0软件(http://surfer.nmr.harvard.edu)对每例受试者的T1WI图像进行预处理及自动分割。主要过程包括头动校正,去除非脑组织、坐标变换、灰白质分割、皮质表面模型重建、区域标记、配准和统计分析。基于Destrieux Atlas图谱,提取全脑148个皮层脑区的表面积、平均厚度、厚度标准差、积分校正高斯曲率、积分校正平均曲率、内在曲率指数、折叠指数和体积;基于Desikan Killiany图谱,提取14个皮质下结构的体积,包括双侧丘脑、尾状核、壳核、苍白球、海马、杏仁核和伏隔核。最终,我们共提取1198(148×8+14=1198)个影像组学特征。
在CN及AD患者中,首先通过Mann-WhitneyU检验去除非显著性特征,采用Spearman秩相关分析去除冗余特征,阈值取0.9。接着,采用最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)、逐步回归分析及赤池信息准则法(Akaike information criterion,AIC)来确定最佳影像组学特征(图1)。最后,采用多元Logistic回归分析建立影像组学标签。采用受试者操作特性(receiver operating characteristic,ROC)曲线分析CSF Aβ42(即A)、CSF P-tau(即T)和影像组学标签(即N)在鉴别CN和AD中的诊断效能,计算曲线下面积(area under the curve,AUC)、敏感度和特异度,并确定3者的阈值作为A、T、N的阳性分界值。
图1 采用LASSO回归和5折交叉验证法筛选影像组学特征。a)影像组学特征的LASSO系数分析;b)每次折叠的均方误差曲线。 图2 影像组学特征及其回归系数值柱形图,以左侧海马旁回的平均皮层厚度的回归系数较大。 图3 基于联合模型预测概率的中位数作为临界值对MCI患者进行Kaplan-Meier分析,Kaplan-Meier曲线显示随着生存时间延长,高风险组患者的生存率呈明显下降趋势。a)训练集;b)验证集。
根据上述过程获得的阳性分界值,确定每例MCI患者A、T、N的阳性(+)和阴性(-),根据ATN结果(A、T、N结果的组合形式),将MCI患者分成8个亚组。
采用分层随机抽样方法将MCI患者按照7:3的比例分为训练集例和验证集。在训练集中,以结局和时间作为cox回归模型的因变量(认知障碍进展则赋值为1,保持稳定赋值为0;记录MCI患者认知障碍进展时间及认知状态保持稳定的时间,以月为单位),以Fazekas分级、年龄、性别、受教育年限、饮酒史、BMI、APOEε4等位基因及11项量表(ADAS-Cog11、ADAS-Cog13、CDR、FAQ、GDS、MMSE、RAVLT-I、RAVLT-L、RAVLT-F、RAVLT-PF和AFT)评分为自变量,进行单变量(P<0.001)和多变量(P<0.05)Cox回归分析,以获得与认知障碍进展相关的临床危险因子。
在训练集,分别采用单因素和多因素Cox比例风险回归分析,建立基于单独ATN分类及联合ATN分类与临床危险因子的预测模型,并在验证集中进行验证。采用一致性指数(concordance index,C-index)对模型的预测效能进行评估。此外,选取训练集中基于联合模型预测概率的中位数作为临界值进行Kaplan-Meier(KM)生存曲线分析,并基于此临界值将MCI患者分为低风险进展组和高风险进展组,并采用对数秩检验(log-rank test)比较两组认知障碍进展情况的差异。在多因素Cox比例风险模型的基础上,构建联合ATN分类和临床危险因子的列线图,采用校准曲线(calibration curve)评价列线图的拟合度。
使用SPSS 24.0软件进行统计学分析。分类变量用频数(百分比)来描述,呈正态分布的连续变量采用均值(标准差)来描述,呈非正态分布的连续变量采用中位数(上、下四分位数)来描述。对连续变量的多组间比较采用单因素方差分析或Kruskal-WallisH检验,多重两两比较采用Tukey或Nemenyi检验。对分类变量采用卡方检验或Fisher精确检验,并采用Bonferroni方法进行两两组间比较。以P<0.05为差异具有统计学意义。
AD、MCI和CN组的临床资料及组间比较结果见表1。基线时,三组之间教育年限、BMI、APOEε4基因、CSF Aβ42和P-tau水平以及所有认知量表评分的差异均有统计学意义(P<0.05)。进一步组间多重两两比较,CN组与AD组之间受教育年限以及MCI组与AD组之间BMI的差异具有统计学意义(P<0.05);APOEε4基因的组间差异均有统计学意义(P<0.05);AD组、MCI组和CN组的CSF Aβ42水平依次增高,组间差异均有统计学意义(P<0.05);AD组、MCI组及CN组的CSF P-tau水平依次减低,组间差异均有统计学意义(P<0.05);除外GDS评分和RAVLT-F评分,其余认知量表评分的组间差异均有统计学意义(P<0.05)。
表1 不同认知状态被试的临床资料及组间比较结果
经特征筛选后,最终共获得15个最佳影像组学特征用于建立组学标签,各个影像组学特征的名称和回归系数见图2,以左侧海马旁回的平均皮层厚度的权重较大。
A、T、N三个指标鉴别CN与AD的效能指标见表2。
表2 ATN指标鉴别CN与AD的诊断效能
根据ROC曲线结果,CSF Aβ42≤952 pg/mL为A+,CSF P-tau >24.38 pg/mL为T+,影像组学标签值>0.4561为N+。
根据A、T、N的阈值,本研究中MCI患者的ATN结果分为8种类型(亚组),占比最大的是A-T-N-组42例(21.3%),其次是A+T+N-组39例(19.8%)和A+T+N+39例(19.8%),其它各亚组分别为A-T+N-组18例(9.1%)、A+T-N-组17例(8.6%)、A+T-N+组16例(8.1%)、A-T-N+组13例(6.6%)和A-T+N+组13例(6.6%)。
单因素和多因素Cox回归分析结果见表3。单因素Cox回归分析结果显示,APOEε4等位基因、ADAS-Cog11评分、ADAS-Cog13评分、FAQ评分、MMSE评分、RAVLT-I评分、RAVLT-L评分、RAVLT-PF及AFT评分是认知障碍进展的危险因素。多因素Cox回归分析结果显示,APOEε4等位基因、FAQ评分和AFT评分是认知障碍进展的危险因素。
表3 训练集中各项临床特征与认知障碍进展相关性的单因素和多因素Cox回归分析结果
基于ATN分类的认知障碍进展预测模型及ATN分类结合3个临床危险因子的联合预测模型在训练集的C-index分别为0.849(95%CI:0.786~0.912)和 0.972(95%CI:0.661~0.782),在验证集分别为0.849(95%CI:0.754~0.944)和0.906(95%CI:0.661~0.782)。
联合预测模型在训练集及验证集的KM生存曲线分析结果见图3。将模型预测认知障碍进展概率的中位数0.02作为区分低风险和高风险进展组的临界值,在训练集中,高风险和低风险进展组的中位生存时间分别为36和60个月,两组间差异有统计学意义(Log-rank test,P<0.0001);在验证集中,高风险和低风险进展组的中位生存时间分别为48和60个月,两组间两组间差异无统计学意义(P=0.052)。基于ATN分类和临床危险因子绘制个体化预测MCI患者1、3、5年认知进展风险的列线图(图4),其校准曲线(图5)显示在训练集和验证集中列线图预测结果与实际观察结果之间差异无统计学意义(P=0.119、0.778),模型拟合效果较好。
图4 基于ATN分类和临床危险因子绘制个体化预测MCI患者1、3、5年认知进展风险的列线图。图5 列线图模型评估MCI认知进展的校准曲线,对角线(灰色)代表理想曲线,绿色、紫色及红色实线分别代表1、3、5年的实际预测曲线,理想曲线与实际预测曲线越靠近,预测效果越好。a)训练集;b)验证集。
本研究基于全脑的影像组学特征建立了AD的诊断模型,获得较高的诊断效能,并将其首次应用于对AD患者神经退行性变(N指标)进行评价;此外,我们联合基线ATN分类状态和认知障碍进展相关临床特征来构建预测模型,并绘制可视化列线图,有效地评估了MCI患者未来5年内认知进展的风险。
AD患者的神经损伤广泛发生于皮层和皮层下区域,MRI上脑萎缩可以反映神经退行性变的程度。Lehmann等[14]报道了AD患者双侧后扣带回、楔前叶和后顶叶的皮质厚度减小。皮层下区域如壳核、丘脑和基底节区也表现出与认知障碍相关的萎缩改变[15]。在本研究中,我们基于全脑影像组学特征建立的影像组学模型能有效区分CN和AD患者(AUC=0.998)。相较于既往研究中采用海马体积或平均皮层厚度的方法[7],本研究中获得的影像组学模型表现出更高的敏感度和特异度。通过全面捕捉脑结构的变化特征,影像组学方法实现了对神经退行性变的更准确和更敏感的评估,有助于进一步丰富ATN分类系统。
在本研究中,我们基于脑脊液和影像学标志物对MCI患者进行分组,并观察各组患者5年内的认知进展情况。其中,CSF内异常淀粉样蛋白和P-tau蛋白沉积及有神经退行性变(A+T+N+)的患者进展风险最高。在一项将ATN分类系统应用于认知功能正常个体的研究中发现,在长期纵向随访中,只有A+T+N+组中患者的认知能力下降程度始终大于A-T-N-组。[6]。另一项对主观认知下降(subjective cognitive decline,SCD)人群的研究结果显示,在5年随访期内,A+T+N+组患者的临床进展率最高,表现为从SCD进展到MCI再到AD[16]。这些结果可能表明,3种生物标志物同时异常对痴呆前阶段AD患者认知功能损害逐步进展具有重要提示作用。有趣的是,我们发现A+T-N+、A-T-N+、A-T+N+与A+T+N-组具有相似的进展风险,他们的进展风险仅次于A+T+N+组。由此我们推测,当MCI患者不满足ATN框架下的AD诊断标准(即A+T+N+或A+T+N-)时,N+的出现可能预示未来进展的高风险。
Meta分析结果显示神经心理学量表评分是MCI进展的可靠且必要的预测指标[17]。本研究结果显示基线状态具有较高FAQ评分和较低AFT评分的MCI患者表现出更高的进展风险。Huang等[18]发现,基线FAQ评分表现出比影像学特征和脑脊液生物标志物更强的预测能力,是很好的进展预测因子。此外,我们观察到基线时MCI患者中APOEε4等位基因携带者的比例介于认知正常的老年人与AD患者之间,差异具有统计学意义,且APOEε4等位基因与MCI进展密切相关。APOEε4等位基因是公认的AD易感因子,APOEε4等位基因的存在可使MCI的发生风险增加1.4倍[19],携带APOEε4等位基因的MCI患者未来5年内进展为AD的风险明显高于未携带者[20]。因此,本研究建立的预测模型中纳入的临床预测因子具有较高的普遍应用价值。
本研究初步探索了基于MRI的影像组学模型、ATN分类结果联合临床危险因子的列线图预测模型对MCI患者TTP的预测价值。通过将各危险指标的贡献率以线段的长短表示,列线图直观简洁地展示了不同ATN组合患者未来1、3和5年出现进展的概率,具有很强的可视性和临床实用性。本研究结果显示该模型具有较好的预测效能,在训练集和验证集中的C-index分别为0.927和0.906。校正曲线表明对于估计MCI患者1、3和5年的生存率,列线图估计值与实际值之间有较好的一致性。
本研究存在一定局限性:第一,本研究仍处于初级探索阶段,基于MRI影像组学的ATN分类系统能否广泛的运用于不同认知状态的人群中尚需进一步研究。第二,列线图预测模型的建立是基于ADNI数据库的一项回顾性分析,受到纳入和排除标准的限制,样本量较小,其预测性能有待于未来在多数据库及大样本研究中进一步验证。