吴卓熙, 陈 勤, 陈 凤, 任玉坤, 王 卓, 李 洪
陆军军医大学第二附属医院 麻醉科,重庆 400037
急性肾损伤(acute kidney injury,AKI)是一种常见术后并发症,与高病死率、高发病率、住院时间延长等有关[1-2]。围术期发生缺血、交感神经系统激活、系统性炎症、肾毒性药物等均为术后AKI的促发因素,准确预测术后患者是否发生AKI并及时采取干预措施至关重要[1,3-5]。既往AKI预测相关研究多针对重症监护室中的危重患者、潜在肾毒性暴露的特定患者、心脏手术等[6-7]。关于开发重症监护室外住院患者的AKI预测模型的研究较少[8-14]。现如今,基于机器学习方法已被广泛且成熟应用于预测模型领域[15-17]。本研究旨在探讨基于机器学习方法对非心脏手术后AKI的预测价值。现报道如下。
1.1 一般资料 选取陆军军医大学新桥医院自2014年6月至2022年9月收治的24 611例接受非心脏手术患者为研究对象。纳入标准:年龄>18岁;电子病历系统与手术麻醉系统数据齐全。排除标准:介入手术,心脏手术。其中,男性12 074例,女性12 537例;年龄 18~98岁,平均年龄(57.36±13.54)岁。本研究经医院伦理委员会批准。所有患者均签署知情同意书。
1.2 研究方法
1.2.1 数据收集及预处理 用于建立模型的患者术前数据来自电子病历系统,包括:人口统计学信息、术前合并症、术前检查和检验数据、术前用药史、术前相关治疗史等。术中数据来自UEESOFT手术麻醉临床信息系统,包括:术中用药情况、患者信息、手术信息等。
1.2.2 主要结局定义 根据改善肾疾病全球结局AKI工作小组最新指南,整合RIFLE分类与AKIN分类,AKI定义为48 h内血清肌酐(serum creatinine,SCr)升高≥0.3 mg/dl或7 d内SCr增加至基线的1.5倍以上[18-20]。
1.2.3 机器学习方法 采用随机数字表法将患者分为训练组(n=17 227)与验证组(n=7 384)。采用包括逻辑回归、随机森林、支持向量机、简单决策树、极端梯度提升和集成模型在内的机器学习方法训练模型。采用受试者工作特征(receiver operator characteristic,ROC)曲线及ROC曲线下面积(area under ROC curve,AUC)评价模型的整体性能。采用沙普利可加性特征解释法(shapley additive explanation,SHAP)评估每个特征对预测结果的贡献程度[21-22]。
2.1 两组患者一般资料比较 非心脏手术后AKI发生率为11.3%(2 780/24 611)。训练组与验证组患者各项一般资料比较,差异均无统计学意义(P>0.05)。见表1。
表1 两组患者一般资料比较/例(百分率/%)
2.2 模型效能 6种机器学习方法构建的模型预测非心脏手术后AKI的ROC曲线见图1。集成模型预测非心脏手术后AKI的AUC为0.749,大于逻辑回归、随机森林、支持向量机、简单决策树、极端梯度提升单独预测。见表2。随机森林模型重要性矩阵图显示,体质量指数、术前尿素氮、术前肾小球滤过率、麻醉时长、术前平均动脉压、术前血红蛋白、年龄、术中出血量为对模型贡献度重要的前8个变量。见图2。
图1 6种机器学习方法构建的模型预测非心脏手术后AKI的ROC曲线
图2 随机森林特征重要性矩阵图
表2 6种机器学习方法构建的模型的预测价值比较
2.3 模型分析 随机森林模型中贡献度较高的20个特征的SHAP值见图3。红色代表SHAP值较高的特征,蓝色代表值较低的特征。变量的SHAP值越高, 发生AKI风险越大。20个特征中,手术相关特征有8个,分别为麻醉时长、普通胸外科手术、骨科手术、手术中总失液量、急诊手术、手术中晶体液输注总量、手术中血液制品使用量、手术中胶体液输注总量和择期手术。
图3 随机森林模型中贡献度较高的20个特征SHAP值总结图
既往针对AKI的预测模型大多集中在重症监护室与心脏手术患者中,重症监护室外非心脏手术患者的AKI危险因素及预测工具相关研究较少。逻辑回归作为筛选变量的传统方法,根据统计显著性选择进入模型的变量可能错失对提高模型预测能力极具价值的变量信息。机器学习不需设定输入变量与输出变量的关系假设,变量筛选过程完全由数据驱动而不依赖于预设规则。使用机器学习构建预测模型是一种更合理的方法[13]。
本研究结果显示,训练组与验证组患者各项一般资料比较,差异均无统计学意义(P>0.05)。这提示,数据在两个数据集中分布平均。此外,集成模型预测非心脏手术后AKI的AUC为0.749,大于逻辑回归、随机森林、支持向量机、简单决策树、极端梯度提升单独预测。这提示,集成模型预测性能最优,在单一模型中随机森林的AUC为0.747。集成模型相对于单一模型更加复杂,需要更多的计算资源和时间来训练和调优。从对结果的可解释性以及资源利用上,随机森林可能是更适合的方案。有研究报道,术中维持动脉压>65 mmHg可以降低AKI风险[14]。本研究结果显示,在随机森林模型中影响较大的前20个特征中,手术相关特征占8个。这提示,手术相关和术中变量对预测AKI具有重要价值。
综上所述,采用机器学习方法开发的非心脏手术后AKI的预测模型,可进一步加强对AKI的预防,从而优化和改善患者预后。但本研究存在一定局限性:缺少术中时序数据,例如连续逐次采集的血压、心率等生命体征;仅针对是否发生AKI进行预测模型的开发,后续研究可进一步针对AKI分级预测开发模型。