赵雨蕾,蒋 蓉,余 艳,王 芸,周丽娟,王 芝,李文静
卒中后抑郁(post-stroke depression,PSD)是脑卒中后常出现的情感功能障碍,以情绪低沉、自责、睡眠障碍、兴味索然等为主要特征,常伴随有躯体症状[1, 2]。卒中患者在长期康复过程中的不同阶段均有可能罹患PSD[3],有研究表明,我国PSD发生率为34.9%[4]。PSD的高致残率与高死亡率严重影响了脑卒中患者的认知、神经及肢体功能恢复,导致患者的家庭与社会负担加重、生活质量下降等不良后果[5, 6]。有研究指出,采取针对性措施可改善PSD患者的结局,并在一定程度上改善患者的神经功能状态[7, 8]。因此,早期预测卒中患者抑郁情况以实施适当干预,对改善卒中患者预后、提高患者生命质量具有积极影响。在医疗领域,机器学习模型可应用于疾病诊断以及并发症的预测[9],帮助医护人员早期识别高危人群,为医护人员制定正确的管理策略和个性化的干预措施提供支持。本文对PSD的机器学习风险预测模型的研究进展进行整理和总结,旨在为PSD的风险预测模型构建与预测模型的临床应用与研究提供参考与借鉴。
1.1 概述随着计算机技术的飞速发展,医疗系统进入了大数据和机器学习时代。机器学习是一门多学科交叉专业[10],使用机器学习技术建模可以深入挖掘数据的价值,并在有效利用数据和支持临床决策方面发挥不可或缺的作用[11]。常用的机器学习算法包括K近邻、朴素贝叶斯、Logistic回归、决策树、支持向量机、深度神经网络等[12]。风险预测模型作为一种预测工具,可通过数学公式估算个体目前患某种疾病或未来发生某种结局的可能性[13],依据应用目的可将模型分为诊断和预后两种类型[14]。预后模型指被诊断为某种疾症后,对未来某一时间段内的并发症、复发、死亡等发生率进行预测[15],本文研究的PSD风险预测模型属于预后模型。如今,基于机器学习算法的风险预测模型已在医疗领域获得广泛应用与发展,能够较为精准、高效地进行疾病预测和诊断,识别高危群体,并协助医务人员及时有效地制定干预措施,进而减少不良结局的发生,提高患者生命品质。
1.2 预测模型的评估目前,研究者常采用鉴别能力来评价预测模型,其主要评判指标包括特异度、灵敏度以及受试者工作特征曲线下面积(area under curve,AUC)等。AUC值也被称作C-统计值,通常作为综合性指标评估预测模型的准确性[16, 17],取值在0.5~1,值越大表示该模型鉴别能力越高;灵敏度反映模型筛选阳性患者的能力;特异度反映模型确定阴性患者并将其排除的能力[18]。
1.3 预测模型的验证由于临床应用场景与研究对象的变化等因素,患者数据可能会呈现出不同特征,这为模型的预测结果带来干扰,好的模型应当具备一定的泛化能力来避免这种干扰。因此,完整的预测模型研究需要通过验证其内部效度及外部效度来评估模型的准确性与泛化能力[15]。Bootstrap重抽样、交叉验证等常用作预测模型的内部验证,内部验证指测试集和训练集同源;而外部验证常收集不同源、不同时间段的数据进行测试和验证[19]。
PSD的危险因素很多,筛选并确定PSD的高危因素,可以降低建模难度,提高模型预测效果。因此,基于危险因素的研究可为PSD风险预测模型的构建奠定基础。高春林等[20]总结了PSD的主要影响因素,包括卒中后病残、卒中前抑郁病史、卒中严重程度与认知功能障碍,焦虑和社会家庭支持缺失也对PSD具有一定影响。马瑾等[21]认为PSD的风险因素涵盖生理-心理-社会三个层面,具体的因素除与高春林等研究的结果一致外,还应包括脑血管病危险因素、缺氧、个性内向、独居、家庭负担重、自理能力差。张亚恒等[22]Meta分析显示,PSD的高风险因素包括瘦素含量高、高身体质量指数(BMI)、高mRS评分、基底节区梗死、额叶梗死、多病灶、家庭支持缺乏,年龄及女性。这些研究结果可为PSD风险预测模型研究在数据收集以及构建方法等方面提供参考。
3.1 卒中后抑郁Logistic回归预测模型Logistic回归是一种有监督的分类学习模型,根据因变量的数量可分为二元分类和多元分类,是反映因变量与多种影响因素之间关系的回归分析方法[23]。Ginkel等[24]采用前瞻性多队列研究方法获得410例卒中患者的社会人口学资料、心脑血管危险因素、既往史、卒中后功能评估资料等,在Logistic回归分析的基础上构建模型,内部检验得出AUC值为0.78,灵敏度和特异度分别是0.73和0.75,结果显示该模型具有良好的预测性能。研究表示该模型可协助医护人员在1周内及时预测患者未来发生PSD的风险。但该模型只进行了内部测试,缺乏外部验证支持。且该研究收集的是患者中风后1周内的数据资料,病情较重的患者被排除在外。有研究发现[25],病情越严重的卒中患者PSD诊断率越高,因此,PSD的实际发生率可能高于此研究结果,这与其他研究者[26, 27]在探究PSD发病率时所忽略的问题一致。
3.2 卒中后抑郁Cox回归预测模型Cox比例风险回归模型可对生存结局与生存时间进行分析,并可同时纳入多个因素,在流行病学的多因素生存关系分析问题当中得到较好的应用[28]。Leentjens等[29]采用前瞻性研究方法收集190例卒中患者资料,在患者卒中后1个月根据《诊断与统计手册:精神障碍》以及汉密尔顿抑郁量表行重度抑郁评估。并在第3、6、9和12个月时对患者进行随访,通过自评量表再次对患者进行抑郁评估。研究者首先以重度抑郁评估作为结果变量,基于四种社区抑郁症的危险因素(性别、既往抑郁症个人史、抑郁症阳性家族史和非卒中影响的躯体合并症)构建了Cox回归模型。而后,又在此基础上输入五种潜在危险因素(残疾,认知功能低下,半球间病变、半球内病变以及全身性血管损伤),结果证明残疾程度是唯一可以提高该模型预测性能的危险因素。但该研究在构建模型时纳入的因素有限,未考虑到其他可能会影响PSD的危险因素,如社会心理因素等。此外,该模型未说明内外部验证情况,故预测性能与临床适用性有待进一步评估。
3.3 卒中后抑郁列线图预测模型列线图又称诺莫图(Nomogram),其基于多因素回归分析,通过具有刻度的线段依照特定比例在同一平面上描绘指标,以此表示不同变量间的相关性[30]。乔嘉璐等[31]通过回顾性分析筛选出具有建模能力的5个因素,包括日常生活能力量表评分、入院当天美国国立卫生研究院卒中量表评分(national institute of health stroke scale,NIHSS)、左额叶FA值、左颞叶FA值和左前扣带回FA值。此研究内外部验证AUC分别为0.8535和0.8972,结果表明该模型具有较好的识别及预测能力,且临床适用性较好。分析此研究虽进行了验证,但构建的模型规模较小,训练数据较少,在后续的研究中还需加大训练样本量,规避模型过拟合风险。柯绪芬等[32]通过前瞻性研究法收集了321例卒中患者的资料。结果显示以下7个独立危险因素:脑力型职业、额叶病变、基底核区病变、脑干病变、丘脑病变、同型半胱氨酸水平≥15 μmol/L以及NIHSS评分≥6分,训练集和验证集的AUC分别为0.826和0.793。此外,该模型还进行内部验证,证明该模型较好的鉴别能力和预测性能。但未进行外部验证,且在收集患者资料时未考虑到社会心理因素,后续研究在纳入因素时,仍需考虑综合危险因素。Li等[27]报道了急性缺血性脑卒中患者发病3个月时PSD风险预测列线图模型。研究者通过Logistic回归分析确定以下7个强相关因子:年龄,NIHSS评分,改良Rankin评分量表,血清钙磷产品,教育水平,高血压病史和心房颤动史。该模型C-统计量为0.81,灵敏度和特异度分别为0.711和0.786,显示较好的鉴别性能。此模型进行了内部测试并进行校准,但未见外部验证结果,故今后还需对该模型进行多中心的外部临床验证,以增加其预测可靠性与临床应用价值。
3.4 卒中后抑郁树模型树模型能很好地表达非线性关系,适用于分类与回归任务,且树状方法使模型拥有更高、更稳定的精确率及可视化的预测结果,因此,树模型的使用较为广泛。决策树由一系列节点构成,可基于训练集对实例进行分类或回归;而随机森林是以决策树为基础分类器,可同时训练多个决策树,并综合分析每个决策树的结论,最终得出预测结果[12]。
Liu等[25]前瞻性地收集562例患者的资料,在Logistic回归模型的基础上转化为决策树模型,模型的AUC值为0.85,准确度、灵敏度和特异度分别为0.86、0.70、0.83。研究者认为两个模型的预测性能差别不大,但是决策树模型更为简单直观,更方便临床应用。此外,该研究还指出,社会心理因素对于在1个月内识别PSD的风险非常重要,并有助于卒中后康复。但该研究方法存在以下不足:一是该研究未纳入实验室检查等风险因素,后续研究需结合更多风险因素进行综合分析;二是未说明模型的内外部验证情况,其预测性能和临床适用性尚无法明确。罗晓舟等[33]首先在回顾性研究的基础上运用单规则算法,判别并提取出688例卒中患者并发抑郁的高危因素:病灶位置、中医药干预手段及抑郁家族史。虽然此研究样本量大,但未详细说明抑郁结果的判别标准,且病例来自不同医院,在干预手段数据记录中无法统一,因此,在做临床干预时还需进一步思考。再者,该模型仍需外部验证来为其能否适用于临床提供依据。钱淑霞等[34]将320例卒中患者作为研究对象,通过构建分类回归树模型确定以下危险因素:脑卒中病史、BMI、社会支持评定量表、多伦多述情障碍量表、汉密尔顿焦虑量表及NIHSS。此研究未运用评价指标评估模型,且缺乏外部验证,模型的预测性能与临床应用价值尚无法评价。
随着大数据与机器学习技术的发展与应用,研究者对医工结合领域的关注度居高不下,国内关于卒中患者PSD的机器学习预测模型也得到了较好的研究与发展。但由于现有研究在危险因素、研究方法、模型评估指标、验证方法等方面存在差异,无法进行较为客观的比较,且现有方法仍存在一定局限性,未来需要运用更科学、更全面和更先进的研究方法进行PSD风险预测模型的探索。首先,在纳入危险因素时,需要从多角度综合考量,并在实践过程中不断校准和更新,全方位地分析PSD的影响因素,从而为医务人员有针对性地提出干预对策奠定理论基石;其次,预测模型的准确性及临床适用性是医务人员在实际运用模型时需要考虑的指标。因此,在今后的模型构建研究中,为了提高预测稳定性、准确性和适用性,除进行内部验证外,针对不同群体的多中心的外部验证也是必要的。预测模型研究的价值除了所构建的模型本身,更重要的是其在临床中的实用和推广,这也是研究的出发点和落脚点,故预测模型构建之后的跟踪研究,需要得到研究人员更多关注。