张嘉嘉 秦 瑶 韩红娟 葛晓燕 崔 靖 白文琳 余红梅,2△
【提 要】 目的 利用Landmark模型对轻度认知障碍(mild cognitive impairment,MCI)的老年人转为阿尔茨海默病(Alzheimer′s disease,AD)的概率进行动态估计,为早期发现高危AD患者提供帮助。方法 利用312名MCI个体的纵向和生存数据构建三个landmark模型(模型1、模型2和模型3)。利用Brier得分和C指数评估模型的预测性能并选出最优模型进行动态预测。结果 模型3的预测性能较好,且FAQ、RAVLT-immediate和海马体体积是MCI转为AD重要的预测变量。在不同随访年,利用模型3和这三个预测变量预测两名MCI个体两年后转为AD的概率。MCI个体1转为AD的概率逐年下降,属于AD低危个体;而MCI个体2转为AD的概率逐年上升,属于AD高危个体。结论 本研究对MCI个体向AD转化的概率进行动态估计,可识别AD高危群体。
阿尔茨海默病(Alzheimer′s disease,AD)是一种不可逆的神经退行性疾病,也是痴呆症最常见的类型,它通常以认知障碍和身体残疾为特点[1]。由于缺乏有效的AD治疗方法,预防和延缓AD是至关重要的。轻度认知障碍(mild cognitive impairment,MCI)是介于正常认知和AD之间的过渡阶段,其特点为轻微的认知障碍,但日常生活能力基本正常[2-3]。一部分MCI个体以每年10%~15%的速度转化为AD[4],另一部分个体会保持MCI状态不变或逆转为正常认知[5]。因此,MCI群体是AD早期干预和治疗的靶向人群,早期识别AD高危群体并干预风险因素,可以预防AD的发生。
然而,认知老化是一个动态、多维且高度复杂的过程,同一个老年人在不同的时间段呈现出不同的认知发展轨迹,而且一些与疾病进展有关的因素会随着时间发生改变,因此对老年人进行预测时,需考虑其纵向轨迹和转化时间。目前,同时利用纵向和生存数据进行动态预测的模型有两种,分别是联合模型和landmark模型。联合模型不能在一个模型中同时拟合多个预测因子的纵向轨迹,只能对每个预测因子进行单独拟合[6]。当预测因子较多时,会产生很大的计算负担。而landmark模型弥补了联合模型的不足,可以把多个预测因子拟合在一个模型中实现动态预测。因此,本研究使用landmark模型在不同随访年对MCI个体2年后转化为AD的概率进行预测。
1.资料来源
本文使用的数据来源于阿尔茨海默病神经影像学计划(Alzheimer′s disease neuroimaging initiative,ADNI)。ADNI是一个纵向队列,旨在利用生物标志物、神经心理学测试和临床数据监测MCI和AD的进展。有关ADNI的各项研究和纳排标准等信息可以在http://www.adni-info.org/上找到。所有参与者在进入研究时均获得书面知情同意书,而且该研究已经在所有参与地点的当地机构审查委员会获得批准。MCI的诊断标准可以参考Petersen等人的定义[7],AD的诊断是基于国家神经学和沟通障碍研究所以及中风-阿尔茨海默病和相关疾病协会(NINCDS/ADRDA)的标准。我们的研究选取了在ADNI中2005-2019年间随访的65岁以上个体的数据,这些个体在基线时被诊断为MCI,至少有一次为期6个月的随访,而且没有其他神经心理学疾病。
2.方法
(1)预测变量
本研究的目的是应用landmark模型动态预测MCI个体转化为AD的概率,纳入的变量有4个基线变量:年龄、性别、教育年限、是否携带APOE ε4基因,由于这四个变量对AD的进展有潜在的影响,所以将他们作为协变量[8];6个纵向变量:简易精神状态量表得分(mini-mental state examination,MMSE)、阿尔茨海默病评定量表-认知分量表得分(Alzheimer′s disease assessment scale-cognition 13 items,ADAS-Cog13)、瑞氏听觉词语学习测试-即时回忆得分(rey auditory verbal learning test-immediate recall,RAVLT-immediate)、瑞氏听觉词语学习测试-学习得分(rey auditory verbal learning test-learning,RAVLT-learning)、功能活动量表得分(functional activities questionnaire,FAQ)和海马体体积。这6个纵向变量在之前的研究中被证实有较强的预测性能[9]。结局是从MCI转为AD。
(2)Landmark模型
Landmark模型是由Van Houwelingen首先提出并用于动态生存预测[10]。根据landmark方法,我们以每个随访年k(k=1,2,3,4,5)为界标点建立了5个landmark数据集(SK,k=1,2,3,4,5)。Sk数据集排除了在第k个随访年之前转化为AD的个体以及失访或死亡的个体,最后纳入MCI状态未改变的个体。使用的变量是4个基线变量以及在第k个随访年之前的6个纵向变量。在每个landmark数据集上,我们拟合了一个单独的landmark模型,为模型1:
(1)
其中,h0k(t)是在第k个landmark数据集上在时间t时的基线风险;X(k)是6个纵向变量在随访年k之前最后一次取值组成的向量;Z是4个基线变量组成的向量。但是许多MCI个体会连续几年进行随访,可能会出现在几个不同的landmark数据集中,这样会造成这部分MCI个体“重叠”,所以我们把5个landmark数据集整合为一个完整的数据集,这五个landmark数据集就有了一个共同的回归系数,使这个回归系数随着随访年k平滑地改变,得到了模型2:
logh0k(t)+β(k)TX(k)+γ(k)TZ
(2)
在模型2的基础上,我们把5个landmark数据集的单独基线风险合并为一个共同的基线风险而避免多次基线风险估计,使模型更容易解释,得到了模型3:
logh0(t)+βTX(k)+γTZ+f(k;δ)
(3)
其中,f(k;δ)是在第k个landmark数据集的landmark效应。
3.模型评价
使用Brier得分评价landmark模型的预测误差,得分范围为0~1,越接近0,表示模型预测准确性越好;使用一致性指数(C指数)评价landmark模型的预测判别能力,得分范围在0~1之间,越接近1,表示模型判别能力越好。
4.软件实现
应用统计软件SPSS 23.0进行基线资料的统计描述;软件R 4.1.0中的“dynpred”包建立landmark数据集,“survival”包构建landmark模型以及进行模型评价和预测。
1.所有MCI个体的基线信息
本次研究共筛选出312例MCI个体,其中149例在随访结束时转化为AD,中位随访时间为5年。在所有MCI个体中,男性有185人(59.29%);平均年龄是73.07岁;平均教育年限是15.89年;有175人(56.09%)携带APOE ε4基因。具体信息详见表1。
表1 所有MCI个体的基线信息
2.landmark模型参数估计结果
由表2可知,在模型1中有意义的预测变量是FAQ、RAVLT-immediate和海马体体积。FAQ得分每增加1分,转化为AD的风险增加5.6%(HR:1.056,95%CI:1.027~1.086);RAVLT-immediate得分每增加1分,转化为AD的风险降低3.5%(HR:0.965,95%CI:0.947~0.994);海马体体积每减少1mm3,转化为AD的风险升高17.3%(HR:0.827,95%CI:0.697~0.981)。在模型2和3中,FAQ、RAVLT-immediate和海马体体积仍然对MCI转化为AD有影响。
表2 三个landmark模型的参数估计结果
3.三个landmark模型预测性能比较
三个landmark模型预测性能的比较见表3。从表3可以看出,模型3的C指数最大,说明模型3有较好的预测判别能力;同时模型3的Brier得分最小,说明模型3有较低的预测误差。综上,我们认为模型3是最优的landmark模型。
表3 三个landmark模型预测性能评价
4.MCI个体的动态预测
之前的结果得出,FAQ、RAVLT-immediate和海马体体积是有意义的预测变量,且模型3是最优的landmark模型。因此,本研究用这三个预测变量和模型3对MCI个体转化为AD的概率进行动态预测。在landmark数据集中随机挑选两名MCI个体,在随访第1年、第2年和第3年时分别预测2年后AD转化率。表4是这两名MCI个体在第1年、第2年和第3年的随访信息。
表4 两名MCI个体的随访信息
图1是这两名MCI个体的动态预测图,从图中可以看出MCI个体1在随访第1年时,两年后转化为AD的概率是28.28%;在随访第2年时,两年后转化为AD的概率是24.18%;在随访第3年时,两年后转化为AD的概率是20.62%。对于MCI个体1来说,转化为AD的概率呈逐年下降的趋势,说明其属于AD的低危个体。而MCI个体2在随访第1年时,两年后转化为AD的概率是46.22%;在随访第2年时,两年后转化为AD的概率是47.03%;在随访第3年时,两年后转化为AD的概率是51.32%。对于MCI个体2来说,转化为AD的概率呈逐年上升的趋势,说明其属于AD的高危个体。
图1 两名MCI个体的动态预测
本研究首次使用ADNI数据构建不同形式的landmark模型,首先识别出三个对老年人从MCI转为AD有意义的预测变量,分别是认知量表(RAVLT-immediate)、功能活动量表(FAQ)以及影像学指标(海马体体积)。然后通过比较得出最优的landmark模型,并将其用于MCI个体的动态预测,有助于临床医生识别AD高危群体。
RAVLT-immediate作为一种神经心理学工具,可反映由AD引起的潜在病理改变,还可对患者进行记忆筛查并识别高危AD患者,是MCI个体转化为AD的重要预测因子[11-12],这与本研究结果一致。FAQ是用来衡量AD病人日常生活能力的一种量表,可以用来捕捉AD患者的功能障碍[13],还可以区分MCI患者和早期AD患者[14]。此外,本研究发现海马体体积也是AD重要的预测因子。已有研究表明,在AD患者出现明显的临床症状前,海马体已经开始萎缩[15],海马体体积每缩小1%,发生AD的风险增加1.6%[16]。虽然海马体体积有助于发现AD的早期神经病变,但是其测量需依靠MRI影像学技术,相比于前两个认知和功能量表价格昂贵,在医疗条件较差的医院不容易获得。Fleisher等人的研究结果显示,认知和功能量表比MRI技术可以更准确地预测AD的转化[8]。因此,鉴于认知和功能量表廉价、耗时短并易获取,在临床实践中可以广泛用于AD认知筛查。
Landmark模型提供了一种简便的方法动态预测MCI转化为AD的个体化概率,它是从Cox回归推理而来,克服了传统预测模型只能在单一时间点进行预测的局限。它可以在不同的时间点根据个体现有的各种测量指标来进行动态预测,而且其输出的是个体单独的预测概率,我们可以根据个体化概率来量化MCI个体关于AD的进展,判断MCI个体所处的风险,并对其进行个性化干预和治疗。对于AD低危群体,比如MCI个体1,他们不必去专科医院进行昂贵的检查,以免增加患者及家属不必要的担忧和恐惧,而需在日常生活中保持健康的生活方式,经常进行体力活动和认知训练,监测认知状态的改变。对于AD高危群体,比如MCI个体2,他们需去医院进行相关的辅助检查并早期采取一些干预措施以减缓AD的进展。
本研究还存在一些局限。首先,研究可以将其他预测变量,如脑脊液生物标志物,纳入landmark模型进行动态预测,观察预测性能是否会提升。其次,在未来的研究中可考虑对MCI个体进行亚组分析,比如分为遗忘型MCI和非遗忘型MCI,观察每组MCI个体转化为AD的影响因素以及转化的概率。最后,研究也可应用landmark模型去预测个体多阶段的转化率,比如,从认知正常到MCI或MCI逆转为认知正常。