张吉妥, 胡小义, 纪木火, 杨建军
1.郑州大学第一附属医院 麻醉科,河南 郑州 450052;2.南京医科大学第二附属医院 麻醉科,江苏 南京 210011
机器学习是一门多领域交叉学科,涉及概率学、统计学、计算机科学等,其本质是对算法的研究,使计算机能够从海量数据中分析并学习规律,不断优化自身算法并对新数据进行预测[1-2]。近年来,机器学习在医疗领域的应用越来越广泛,逐渐改变着传统的医疗模式。在图像识别、大数据分析等方面,机器学习有着明显的优势和潜力[3]。
麻醉与围术期并发症是指在麻醉及手术过程中或手术后可能出现的各种不良症状,包括低血压、低氧血症、术后谵妄等,这些并发症可能与麻醉药物、手术操作、患者的个体差异以及术后护理等因素有关,严重影响患者的术后生活质量。传统的术后并发症评估方法主要依赖于临床经验、评估量表和检查指标,应对复杂情况时存在一定的局限性。然而,机器学习可以利用大规模的数据和复杂的算法模型,挖掘疾病潜在的关联和信息,从而提供更准确、个性化的围术期并发症预测。本文将介绍机器学习在麻醉与围术期并发症预测方面的应用,并对其未来前景进行探讨。
在机器学习领域中,根据数据处理的方式,通常可分为四类:监督学习,无监督学习,半监督学习及强化学习[4]。
监督学习使用带有标签的训练数据来建立模型。当输入新的数据时,算法会根据已建立的预测模型提供相应的预测值。常用的算法包括支持向量机、随机森林、人工神经网络等[5]。无监督学习则是通过对未标记数据的学习,自动发现数据中隐藏的模式和结构,从而构建模型[6]。常见的算法包括聚类分析、主成分分析等。半监督学习结合有标签和无标签数据进行学习,在少量数据标签的引导下,能够充分利用大量无标签数据来提高学习性能[7]。强化学习采用迭代学习方法,计算机会根据执行任务时获得的消极或积极的反馈,不断优化自身算法并再次执行该任务,以达到实现特定目标的最优化[8]。这些机器学习算法在不同的领域中被广泛应用,为数据分析和决策提供了有力支持。
机器学习在预测围术期并发症方面具有巨大的应用潜力。通过分析大量的临床数据,机器学习可以挖掘潜在的风险因素和关联,从而为麻醉团队提供更准确、个性化的预测能力。这种能力的提升将显著改善手术的安全性,并有助于患者在术后的远期康复过程中获得更好的结果。机器学习的应用可以帮助麻醉团队更好地评估患者的风险水平,并采取相应的预防和干预措施,以减少围术期并发症的发生。
2.1 低血压 围术期低血压是手术中常见的并发症,对患者的预后具有重要影响。长期低血压可能导致脑、心、肾等重要器官的灌注不足,增加术后脑水肿、术后谵妄、心肌缺血、肾功能损伤等不良事件的风险[9-10]。利用机器学习预测围术期低血压,可及时采取干预措施,例如调整药物使用和补充容量等,以降低低血压的发生概率,从而改善患者预后。这一应用对于提高手术安全性、降低并发症风险具有重要的临床意义。
在Lee等[11]的一项回顾性研究中,共纳入了3 301例患者,应用深度学习算法来实时预测5、10、15 min后的低血压事件,研究团队利用非心脏手术患者在术中监测的生物信号波形数据建立了分类和回归模型,分别用于判断低血压事件的发生和预测平均动脉压,结果显示,在侵入性模型中,采用多通道模型(包括动脉压波形、心电图、外周动脉血氧饱和度曲线和呼气末二氧化碳浓度曲线)的受试者工作特征曲线下面积(area under the receiver operating characteristic,AUROC)和平均绝对误差均优于仅使用动脉压波形的模型,在非侵入性模型中,多通道模型的AUROC也优于仅使用外周动脉血氧饱和度曲线的模型,并且平均绝对误差也更小。这表明,深度学习模型可基于侵入性和非侵入性监测的生物信号预测围术期低血压事件,并且多信号组合的模型性能更好。该研究结果强调了深度学习在围术期低血压预测中的潜力,并为临床医师提供了一种更准确、个性化的预测方法,以减少低血压相关的风险。
Wijnberge等[12]在阿姆斯特丹的一家三级医疗中心进行了初步的非盲随机临床试验,旨在测试基于机器学习开发的早期预警系统能否减少围术期低血压的发生。该试验纳入了行全身麻醉非心脏手术且需要持续侵入性血压监测的成年患者,患者被随机分配到接受早期预警系统的试验组(n=34)和行常规监测的对照组(n=34)。结果显示,试验组低血压的中位时间加权平均值为0.10 mmHg(0.01~0.43 mmHg)(1 mmHg=0.133 kPa),对照组为0.44 mmHg(0.23~0.72 mmHg),两组之间的中位差异为0.38 mmHg(95%可信区间0.14~0.43 mmHg,P=0.001)。与对照组比较,试验组围术期低血压的时间加权平均值显著降低。该研究表明,基于机器学习的预测系统可降低围术期低血压的发生概率,但仍需进一步的研究以评估该系统的安全性、泛化性及可推广性。
2.2 低氧血症 围术期低氧血症在全身麻醉过程中是常见的死亡原因之一,特别是在麻醉诱导过程中[13]。长期低氧血症会导致组织缺氧,增加术后器官功能障碍和并发症的风险,严重时甚至危及生命。通过预测低氧血症,麻醉医师可以采取相应干预措施,调整麻醉和手术方案,及时纠正低氧血症,从而降低患者的并发症和死亡风险。
Geng等[14]进行了镇静状态下胃肠镜检查期间低氧血症发生的影响因素研究,并建立了一个基于人工神经网络模型的预测工具。该研究纳入了220例行胃肠镜检查的患者,结果显示,体质量指数、习惯性打鼾、颈围与低氧血症存在相关性,该人工神经网络模型的AUROC为0.80,其可以在镇静状态下胃肠镜检查期间预测低氧血症,并为临床提供一种有用的预测工具。
Lundberg等[15]使用基于集成模型的机器学习方法来预测全身麻醉期间的低氧血症,并探究其危险因素。研究结果显示,机器学习模型的预测准确度超过了麻醉医师自身的预测能力,在该系统的帮助下,麻醉医师对低氧血症的预测能力从15%提高到了30%。因此,机器学习的应用可使更多高风险患者获益。
2.3 肺栓塞 肺栓塞是围术期可能出现的一种严重并发症,可导致肺循环和呼吸功能障碍,发现或处理不及时将直接影响患者的安全[16]。因此,预测围术期肺栓塞的发生对于患者的安全至关重要。
Shen等[17]使用机器学习算法对电子病历数据进行训练来预测肺栓塞发生,并进行了外部验证。该研究纳入了近2 000 000例患者的数据,在12个机构的331 268例患者(肺栓塞阳性率为3.3%)上进行XGBoost模型训练,并在其他32个机构的1 660 715例患者(肺栓塞阳性率为3.7%)上进行了外部验证。研究结果显示,该模型在训练集和外部验证集上均表现出色,平均AUROC可达到0.88。这表明,该模型具有良好泛化性,可用于肺栓塞的早期监测,并有潜力成为临床决策工具,可在临床推广使用。
2.4 心脏骤停 围术期心脏骤停是围术期最危险的并发症之一。如果不及时处理,可能导致患者永久性的脑损伤及死亡[18]。通过使用机器学习模型,临床医师可以识别围术期心脏骤停的危险因素,这为医疗团队提供了宝贵的信息,以便及时采取措施,最大程度地保护患者的生命和健康[19]。
Mayampurath等[20]比较了多种机器学习模型和传统的CASPRI评分在预测围术期心脏骤停患者神经功能恢复情况方面的表现,分析了GWTG-R注册数据库中755家医院的117 674例发生围术期心脏骤停患者的数据。研究团队利用患者的特征、病史、心脏骤停前后干预措施等信息构建了逻辑回归、支持向量机、随机森林、梯度提升机和神经网络等多种机器学习模型来预测神经功能恢复情况。研究结果显示,在预测发生围术期心脏骤停患者神经功能恢复情况方面,梯度提升机算法表现出最高的准确性,优于CASPRI评分和其他机器学习模型,该算法基于持续时间、心脏骤停时的心律、入院时的神经功能评分及年龄等重要变量进行预测。这一研究也揭示了机器学习在预测围术期心脏骤停患者神经功能恢复方面的潜力。
Lu等[21]利用机器学习方法对733 398条急诊记录进行分析,构建了能够预测急诊病房内发生心脏骤停的模型,采用了随机森林、梯度提升和额外树分类器等机器学习算法,并将其与国家早期预警评分系统、逻辑回归算法进行比较。结果显示,随机森林模型表现出最佳性能(AUROC=0.931,95%可信区间0.911~0.949),所有的机器学习模型均优于国家早期预警评分系统(AUROC=0.678,95%可信区间0.635~0.722)。该研究表明,仅基于分诊信息的机器学习模型在急诊病房内心脏骤停的识别方面具有出色的鉴别能力。如果成功应用于急诊信息系统中,该机器学习方法有潜力减少心脏骤停事件的发生。
2.5 术后谵妄 术后谵妄是一种常见的急性认知障碍综合征,表现为混乱、妄想、注意力不集中和认知功能下降等症状。在老年患者中,术后谵妄的发生率可高达65%,且与患者的短期和长期预后密切相关[22-23]。术后谵妄可影响患者的远期认知、生理和社会功能,并增加医疗费用和死亡率。因此,对术后谵妄的早期预测至关重要[24]。相对于传统的评估方法,机器学习模型可以利用大量的临床数据进行复杂的模式识别和数据关联分析,从而提高预测的准确性。通过建立个性化的预测模型,可以更好地识别术后谵妄高风险患者,为临床决策提供指导。
Wang等[25]利用机器学习方法预测微血管减压术后早期谵妄。该研究纳入了912例颅神经疾病患者,其中,24.2%发生了术后谵妄。研究中使用了决策树、逻辑回归、随机森林、梯度提升机和梯度提升决策树5种算法,通过分析相关因素发现了卡马西平使用时间、血红蛋白和尿素氮是术后谵妄的主要危险因素。研究结果显示,梯度提升算法总体表现最佳,在测试集中的AUROC为0.962,准确率为0.923。这项研究结果表明,机器学习在术后谵妄方面具有高准确性,可以为患者个性化护理提供重要参考。
Hu等[26]利用机器学习算法预测术后谵妄的发生率,以便快速识别高危患者。研究团队提取了531例全身麻醉手术患者术前及术后第1天的临床数据,筛选出与术后谵妄相关的特征,并采用逻辑回归、随机森林、极限梯度提升树和支持向量机等4种方法建立了术后谵妄预测模型。研究结果显示,在测试数据中,逻辑回归模型表现最佳(AUROC=80.44%,95%可信区间72.24%~88.64%),同时具有最低的Brier评分。这也表明该模型可以及时预测患者术后谵妄的发生。
2.6 术后疼痛 术后疼痛是围术期常见的不良反应,近20%的患者在术后24 h内会经历剧烈疼痛。术后急性疼痛的发生与多种因素有关,包括手术损伤本身的影响以及患者个人的身体状况、心理因素的综合作用。术后急性疼痛若得不到有效管理和缓解,可能发展为远期慢性疼痛,严重影响患者的生活体验[27-28]。因此,对于术后疼痛的及时预测、识别和控制对于患者的术后康复和生活质量至关重要。
Driel等[29]利用多变量逻辑回归方法开发和验证了一个预测慢性术后疼痛风险的模型。该模型筛选出4个因素,包括术前阿片类药物的使用、骨科手术、术后第14天的疼痛程度评分及术后2周内疼痛区域出现冰凉或疼痛感。该研究结果显示,在训练组(n=344)和验证组(n=150)中,分别有28.8%和21.3%的患者出现慢性术后疼痛,该模型在验证集中表现良好(AUROC=0.82,95%可信区间0.76~0.87)。这也表明,该模型能够帮助医师早期识别慢性术后疼痛的风险患者,并根据其预测结果采取相应的治疗措施。
Fang等[30]构建了一个大规模儿童疼痛表达数据库CPEC,并利用深度学习方法来对儿童术后疼痛进行评估。该数据库包含了2020年1—12月安徽省儿童医院0~14岁患儿的术前视频4 104段和术后视频4 865段,研究团队使用CPEC数据集开发了名为CPANN的神经网络框架。研究结果显示,在验证集上,CPANN的正确率为82.1%,宏观F1得分为73.9%。相较于量表评估的方法,CPANN具有更快速、更方便、更客观的优势。这项研究也展示了深度学习在儿童疼痛自动评估方面的有效性。
随着机器学习在麻醉领域的兴起,麻醉医师作为新时代的从业者,面临着新的机遇和挑战。除了熟练掌握临床麻醉技能,对于人工智能前沿知识的了解也变得越发重要[31]。然而,机器学习在当前阶段仍存在一些问题。首先,训练出的模型可能在泛化能力上存在局限性,即在不同数据集上的表现可能各不相同。其次,一些模型目前仍处于理论阶段,其在临床实践中的表现还需要进一步考察。此外,机器学习在临床上的大规模应用还需要得到麻醉领域的广泛认可。
目前,关于机器学习技术的研究和应用在不断取得进展,其中最引起广泛关注的是ChatGPT的出现。作为一种基于深度学习和自然语言处理技术的大型语言模型,ChatGPT通过大规模的训练数据学习语言的模式和规律,能够以流畅、准确的方式回答人类提出的问题。在医疗领域,ChatGPT也展示出了巨大的潜力,其能够回答患者的问题,且可在一些专业医学问题上提供高度准确和可靠的答案[32-33]。在不久的将来,这些模型或许能够与麻醉领域相结合,在机器学习算法的基础上为麻醉医师提供更为精准、个性化的围术期并发症预测,提高麻醉医师的工作效率。这一前景令人充满期待。
相信随着人工智能时代的到来,麻醉学界以及整个医学界将迎来巨大的发展变革。机器学习的应用将提升患者在医疗过程中的舒适体验,以更智能的方式为患者提供更安全、更精准的治疗。