高升润,李 芸,李雨衡,王艳庆,高成杰
术后谵妄(postoperative delirium,POD)是常见的术后并发症,老年患者发生率高,以急性注意力和认知障碍为主要表现,病因不明,可致住院时间延长、围手术期死亡率增高、永久性认知障碍等。所以术前筛查POD高危人群,尽早发现并及时进行干预,对逆转或减少POD至关重要[1,2]。机器学习(machine learning,ML)是一种根据相关算法自动构建数据模型,高效处理复杂数据的技术,ML技术的深度发展有助于开发高效可靠的预测模型工具,促进和支持临床诊疗[3],科学分析医学数据有利于早期筛查POD以改善预后。本文对POD相关ML风险预测模型的研究成果进行综述,以期为临床提供参考。
1.1 概述 计算机科学的显著进步,促使医学诊疗逐步进入人工智能(artificial intelligence, AI)时代。ML是AI学习的重要领域,通过计算机模拟人类学习现有数据或图像,根据内置模型算法,发掘新规律,总结新经验、新知识等,实现性能提升及自身完善[3,4]。利用ML构建模型,可以有效提取相关数据,深入挖掘其价值,为临床决策提供可靠依据[5],具有模型构建稳定、预测准确等优点。医学科研中经典的ML算法有线性回归、逻辑回归、决策树模型等。当前基于ML算法相关的疾病预测模型已广泛应用于医疗活动中,可以及时筛查高危人群,有效帮助医务人员及时干预,减少不良结局,提高患者生命质量。
1.2 预测模型的评估及验证 鉴别力是评价预测模型的重要指标,能够反映模型对真阳性和真阴性的鉴别能力。常通过制作接收者操作特征曲线(receiver operating characteristic,ROC)并计算曲线下面积 (area under curve,AUC)来体现,即以1-特异度(假阳性率)为横坐标,灵敏度(真阳性率)为纵坐标绘制。AUC即“C”统计量,亦称为一次性统计量,属于二分类变量,范围值在0.5~1,越接近1表示鉴别力越强,适用于内部验证模型,即先建模后验证,测试集和训练集同源。多个模型比较时常需外部验证,即收集不同源及时间段的数据进行测试和验证[6]。预测模型研究对象影响因素冗杂,研究数据呈不同特征,影响预测结果,理想的预测模型可以克服不良因素影响,能够耐受对其内、外效度的验证,具备充分的准确性及抗干扰能力[7]。
常见的POD风险预测模型按照ML算法分类有Logistic回归预测模型、列线图预测模型、决策树及集成树预测模型,基于临床电子健康记录数据(electronic health record,EHR)及应用程序的ML衍生模型也有进一步发展。
3.1 Logistic回归预测模型 Logistic回归是一种有监督分类学习模型的多因素回归分析方法,主要研究二分类或多分类变量与多个影响因素之间的关系[14]。王玉伟和李慧[15]选取200例Stanford A型主动脉夹层(Stanford type A aortic dissection,TAAD)接受手术的患者,进行logistic回归分析并构建TAAD术后谵妄风险预测模型,检验模型区分度和拟合优度。另前瞻性选取行外科手术治疗的25例TAAD患者对模型预测效能进行外部验证。Logistic回归分析显示男、年龄>54.6岁、术前血乳酸值>1.96 mmol/L、术中深低温停循环时间>35.7 min、术后住ICU时间>8.3 d、术后急性肾功能不全、术后感染均是影响患者术后发生谵妄的危险因素,该预测模型AUC、敏感度、特异度分别为0.913、0.753、0.865,验证模型AUC为0.884,敏感度和特异度分别为0.745、0.836。显示该模型可用于TAAD患者发生POD风险的预测,效果良好。
3.2 列线图预测模型 列线图是一种定量分析图,由多因素二分类回归或COX比例风险模型分析得出,属于回归方程结果的可视化表达,可以表现不同变量之间的相关性,主要是通过使用互不相交的线段以直尺做垂线的方式估算事件发生概率[16]。李繁等[17]探讨了老年患者肺癌根治术POD危险因素,并以此构建验证预测POD发生风险的列线图模型。经多因素logistic回归分析显示,年龄≥5岁、术前简易精神状态量表(MMSE)评分≤25分、术前预后营养指数<45、查尔森合并症指数(CCI)评分≥2分、鳞癌、术中低血压和手术时间≥3 h为POD的独立危险因素。以此构建的列线图模型经内部验证显示对老年肺癌患者POD发生风险具有较高的预测效能和临床应用价值。Li等[18]回顾性分析了384例髋关节置换术的老年患者,通过意识障碍评估方法将患者分为谵妄组和非谵妄组。采用多因素logistic回归分析POD的危险因素,并根据结果建立列线图。单因素分析显示高龄、糖尿病、腔隙性脑梗死、手术类型、术中失血量、电解质紊乱和贫血是POD的危险因素。多变量逻辑回归显示POD的独立危险因素是年龄、手术类型、电解质失衡、贫血等,列线图可以为老年股骨颈骨折患者髋关节置换术后的POD提供个体化预测。Chen等[19]进行的一项回顾性的研究分析显示,接受腹腔镜胃切除术的老年胃癌患者年龄、安眠药、ICU时间、白蛋白/纤维蛋白原比值(AFR)、中性粒细胞/淋巴细胞比值(NLR)是发生POD的独立危险因素,基于此五个因素构建的列线图模型AUC为0.807,可以有效预测老年胃癌患者的POD。Cox回归风险模型广泛应用于流行病学,可纳入多变量因素,对患者预后及生存关系分析更具优势[20]。黄宛冰等[21]回顾性分析559例Stanford B型主动脉夹层术后患者资料,POD的发生率为14.49%,应用LASSO回归及多变量Cox回归分析发现,年龄≥60岁、晕厥、入住ICU、入院时中性粒细胞计数>6.3×109/L、术后估计肾小球滤过率<90 ml/(min·1.73 m2)是POD的独立危险因素,基于此构建列线图预测模型,采用自助法重抽样1000次进行内部验证。结果显示C统计值为0.774,内部验证为0.762。术后1、3、7 d的AUC分别为0.776、0.771和0.778,该模型对Stanford B型主动脉夹层患者POD具有较好的风险预测效能和临床应用价值。
3.3 决策树及集成树预测模型 决策树是一种有监督学习,由训练集的某个特征决定非叶子节点,该特征的不同取值继续划分成若干个子树,直至满足某个条件不再分裂成叶子节点,整个过程可视化,能够处理连续变量及离散问题,可以解决学习中的分类及回归问题[22]。随机森林、极限梯度提升算法(extremegradientboosting,XGBoost)等属于集成树模型,是以决策树为分类器集成多个决策树结果,形成最终预测输出[23]。Liu等[24]回顾性分析了950例非脑部手术老年患者的临床信息,应用多层感知器、XGBoost和K近邻算法三种ML算法构建模型并验证,发现XGBoost表现最优,训练集中AUC值为0.982,验证集AUC值为0.924,准确度较高,该预测模型显示出较高的预测能力和临床实用性。该研究显示,POD与年龄、吸烟史、酗酒史、慢性阻塞性肺病、高血压病史、手术时间延长和术后入住ICU多因素相关。Röhr等[25]纳入1277例60岁以上计划手术和接受全身麻醉的患者,结合基本临床参数和术中脑电图特征进行回顾性分析,采用随机森林模型,通过10次重复的10倍交叉验证,结果显示脑电图特征可以改善分类,结合临床参数构建模型较单纯临床参数模型更能达到最佳效果,该工具易于应用,可早期识别有发生POD风险的患者。
3.4 衍生模型 ML可通过临床检测或监测记录数据预测高危人群,对于某些具有潜在特征性指标疾病亦能及时洞察[23]。Bishara等[26]回顾性分析了24 885例成年患者的术前EHR,根据术前风险特征开发并内部验证神经网络和XGBoost两种衍生的POD风险ML预测模型,并将其性能与传统逻辑回归开发的模型“临床医师指导”和“ML混合”及谵妄风险分层工具进行比较。POD的总发生率为5.3%,ML模型神经网络、XGBoost显著优于临床医师指导、ML混合等回归模型以及谵妄风险分层工具,神经网络、XGBoost和ML混合模型具备良好的效能,通过EHR数据及ML模型预测围手术期POD高危人群具有较高辨别力,可以实现自动化、实时的POD风险分层,改善POD高危患者的围手术期管理。Jung等[27]纳入两家医院的3980例膝关节置换术患者,一家医院的1931例患者用于开发和训练,另一家医院的2049例患者进行外部验证,使用EHR收集术前变量,最终选择年龄、血清白蛋白、术前服用的安眠药和镇静药的数量、术前服用的药物总数(任何一种口服药物)、神经系统疾病、抑郁症和跌倒风险等七项内容作为POD的关键预测因素,基于网络应用程序构建XGBoost预测模型用于筛查POD高危人群,该模型显示出良好的预测效能。POD的发生率与手术类型相关,该研究模型局限于膝关节置换术,限制其普遍性,对于基础疾病未量化其严重程度及功能障碍,该模型中可修改变量混杂因素与POD因果关系难以阐明。Wang等[28]收集术前、术中和术后变量的数据,通过R进行统计分析,利用python构建模型,将ML算法应用于微血管减压手术POD的预测,准确率达到96.7%,具备极佳的预测价值。文献[29]通过ML自动化模块提取围手术期获得的电子数据,经运算筛选出年龄、术中出血量、麻醉时间、拔管时间、ICU时间、MMSE评分、CCI、NLR等8项POD相关因素,并建立逻辑回归、随机森林、极限梯度增强树、支持向量机算法等模型,进行全自动评分,经验证逻辑回归模型可以体现围手术期POD风险变化程度,有助于POD预测及合理干预。另有学者通过网络及AI计算,结合谵妄预测危险因子开发了一款应用程序,该程序基于Ahituv的临床决策模型,包含患者数据输入、患者谵妄危险因素预测结果输入、使用简版谵妄评估量表进行谵妄评估、谵妄预防干预应用等四个模块,经验证该程序可显著提高谵妄预测能力[30]。
ML技术用于临床医学领域是当前研究热点,关于POD相关的ML预测模型的研究亦取得了积极进展,显示出独特优势及极佳的应用价值。但多数研究模型局限于某类手术POD的预测,缺乏临床推广及实用的普适性。在风险因素筛选、预测模型评估验证等方面存在诸多差异,结合临床客观检查指标构建ML风险预测模型研究较少。如何减少偏倚,进行有效的内部验证和多中心的外部验证,提高预测模型的稳定性、准确性及实用性,是将来POD风险预测模型构建研究的重点。