徐 瑾,邓晓明,晏馥霞
1中国医学科学院 北京协和医学院 整形外科医院麻醉科,北京 100144 2中国医学科学院 北京协和医学院 阜外医院麻醉科,北京 100037
近年来,人工智能和机器学习取得了显著进展,特别是在图像识别、自然语言处理、生物信息学等领域。随着信息技术的发展,社会各个领域的大数据海量积累,机器学习的范围不断扩大。在医疗领域,大数据被广泛地挖掘应用并在临床疾病诊断方面取得卓越成就。麻醉领域在发展和应用机器学习技术方面具有显著的优势:各种计算机控制系统,如监护仪、药物输注系统及麻醉电子病历系统可直接连接至每例患者,实时收集大量高保真数据[1]。然而,人工智能对于现代麻醉而言并不只是简单闭环反馈控制系统。为了了解机器学习是如何从简单的方程中产生决策,引领麻醉至机器辅助时代的临床实践并解决临床问题,本文总结了机器学习的定义、算法等相关概念以及在麻醉领域的应用,概括了人工智能在麻醉领域的发展现状。
定义机器学习是一种计算机科学理论,使用统计学技术,使计算机或人工智能在不使用任何显式程序的情况下,根据大数据逐步改善给定任务的性能[2]。通过从大数据中自我学习,机器学习可以产生一个稳定的模型,并可预测另一个数据集的结果[3]。
分类机器学习的数据处理主要分为监督学习和无监督学习两种[4]。
监督学习:借助有标签的数据进行学习辅助,从而达到学习目标。具体学习过程是使用有标签的数据向算法提供示例(例如:患者特征)进行模型训练产生期望输出(例如:患者转归),并将训练好的模型用来测试新的数据(例如:来自新样本的患者特征)产生的结果(例如:预测患者转归)。在该学习方式下,初始标签数据是不可或缺的要素,进行模型训练前必须搜集。监督学习可充分发挥机器学习的泛化能力,对规则以及规律数据等进行预测。监督学习多用于处理分类问题和回归问题。
无监督学习:处理不具有标签的数据,利用计算机本身的自动化功能,发现数据中的隐藏模式和规律,完成学习过程。无监督学习不需要提前进行模型训练,机器有选择的自行学习探索,直接对样本数据进行建模分析。无监督学习多用于聚类问题的解决。
在机器学习中使用的算法种类较多,其中典型算法有以下几种:决策树、支持向量机、人工神经网络、深度学习等。
决策树根据数据集的属性,生成具有规则的树状结构的模型,对事件进行分类和预测[5]。决策树中树的每个分支是1个分类问题,树的叶节点表示对应分类的数据分割。决策树运算中分两个阶段:构造决策树以及以递归方式修剪树枝。当无法继续进行数据分割时,递归便会随之结束。决策树常用来解决分类和回归问题,在疾病的预防、辅助诊断中应用广泛,在麻醉中可用于特殊人群麻醉管理决策,如麻醉方式的选择或气道管理工具的选择[6-7]。
支持向量机是一种可对数据进行二元分类的线性分类器。其致力于构造一个最优超平面,以最小的分类错误率来分割数据[8]。在统计分类和回归分析中的应用较为广泛,可以解决文本分类及人像识别等问题。在医疗领域里,支持向量机可用于临床决策支持系统的设计中,对超声图像进行分类,辅助椎管内麻醉中穿刺定位[9- 11]。
人工神经网络通过模拟神经元及其连接来模拟人类神经系统,由一系列不同层次的神经元-输入层、隐藏层和输出层-通过权重连接构成[8]。神经元排列成层的功能类似于大脑皮层和视网膜细胞。神经网络中的每个神经元接受大量输入信号,执行输入加权和,通过激活函数得到最后输出。为了获得最佳输出,人工神经网络不断重复学习和纠错。人工神经网络把对生物神经网络的认识与数学统计模型相结合,通过数学统计学方法,使神经网络具备了类似于人的决定能力和判断能力。人工神经网络已在疾病诊断、疾病预后、医学影像处理、临床决策分析方面的应用取得进展[12]。在麻醉学领域,人工神经网络可对脑电信号进行分析,准确评估麻醉深度[13-14]。
深度学习是机器学习领域中一个新的研究方向,与传统的浅层机器学习不同,深度学习的神经网络含有很多隐藏层,机器能够自动学习数据各个层次的特征,充分挖掘数据的信息并对其进行分析处理。深度学习技术在医学领域上的卓越成就主要体现在医学图像处理分析,不需要用人工的方式去提取特征或对图像进行过多的预处理,能够充分挖掘图像中的信息,更好地提取图像中的深度特征,精准分割医学图像,从而有助于疾病的筛查和诊断。目前,深度学习在麻醉领域的研究应用相对少,可根据手术中提取的数据预测全身麻醉术后患者死亡风险。另外在麻醉药理学的研究方面,深度学习因其良好的性能和可延伸性而具有广阔的应用前景[15]。
在麻醉领域应用机器学习可对大数据进行数据挖掘或聚类分析,分析高度复杂的数据集,如患者脑电图、血流动力学信号、镇静程度、呼吸抑制或对伤害的反应,或建立1个模型或公式预测某个发生事件[16]。机器学习在麻醉学科内的研究与应用越来越广泛,已取得初步成果,主要集中在围手术期麻醉管理和术后并发症预测等方面。
围手术期管理麻醉深度监测一直是麻醉医师关注的重点问题。麻醉深度不足导致术中知晓可能会对患者造成严重的心理影响,而麻醉剂过量可能会延长麻醉恢复时间甚至对患者产生不可逆的损伤。客观、无创、可靠的麻醉深度监测是临床麻醉的一个挑战。脑电图是脑电活动的记录,包含了大脑不同生理状态的有价值信息,可作为麻醉深度监测的方法。将不同脑电信号参数结合机器学习算法,转为基于生物神经系统结构的数据处理系统,对麻醉状态进行评估,可准确量化患者的麻醉状态[13-14,17-18]。这种方法无需参考患者年龄及所使用麻醉药物,能可靠预测麻醉深度。
低血压是围手术期不良结局的独立危险因素[19]。早期识别术中低血压,采取预防措施,可改善麻醉和手术结局。Kendale等[20]为探索机器学习算法预测全身麻醉诱导后低血压的价值,分析单中心内年龄大于12岁全身麻醉患者的电子病例,以全身麻醉诱导后低血压(全身诱导后10 min内平均动脉压<55 mmHg)为主要结果,以患者术前用药、合并症、诱导用药、术中生命体征为特征建模,通过对性能最佳模型进行优化,并使用分组验证(70%数据用于训练集,30%数据用于测试集)的方式评估最终性能,证实机器学习技术可成功预测全身麻醉诱导后低血压。Hatib等[21]将机器学习技术应用于动脉血压波形监测,通过分析每个心搏周期3022个特征,创建预测低血压的算法。该算法可检测动脉压力波形的早期变化,提前判断循环系统代偿能力减弱。该研究采用ROC曲线评估该算法在预测低血压(平均动脉压<65 mmHg)的成功性,结果显示:在降压事件前15 min预测低血压的敏感度为88%(85%~90%),特异度为87%(85%~90%);前10 min的敏感度为89%(87%~91%),特异度为90%(87%~92%);前5 min 的敏感度为92%(90%~94%),特异度为92%(90%~94%)。
低氧血症会在全身麻醉和手术期间对患者造成严重伤害,其可通过一系列代谢通路造成心脏骤停、心律失常、认知功能下降和脑缺血等并发症[22]。目前没有可靠的指标用于预防围手术期低氧血症,仅可通过脉搏血氧饱和度实时监测血氧。Lundberg等[23]根据电子病例系统中的高保真麻醉数据构建机器学习系统,预测麻醉中低氧血症的发生,并在全身麻醉期间实时解释风险和促成因素。研究发现体质量指数是术前预测患者术中低氧血症的重要指标,患者术中的血氧水平对预测结果贡献最大。根据研究结果,如果麻醉医生可以预测15%的低氧血症事件,在机器学习系统的辅助下则可提高至30%,有利于更多高风险患者通过早期干预获益。机器学习系统可通过自我分析预测风险,实时发出警告,优化麻醉操作。
准确判断气管导管拔管时机是麻醉及重症监护关注的重点。拔管的方法或时机不合适,可能会导致严重的拔管后并发症甚至需要重新插管。在一项前瞻性、多中心观察研究中,研究者使用机器学习技术分析250例极早早产儿(妊娠期≤28周)拔管前的各项生理监测指标,建立预测早产儿最佳拔管状态的自动化系统。该系统将把数据采集、信号分析和结果预测集成至单独的应用程序中,用于协助临床医生确定早产儿最佳拔管时机[24]。这项机器学习框架也可用于指导全身麻醉患者术后气管导管拔管的时机选择,为患者提供更好的临床麻醉管理方案,减少围手术期并发症,改善患者预后。
术后不良事件预测机器学习算法在预测围手术期不良结局,干预和提高术后重症监护方面有巨大的潜在效能[25]。尽管大多数统计学方法如Logistic回归和线性回归等,已经证明有中等的围手术期不良事件预测效应,但其预测能力和实用性有限。机器学习技术可结合时间序列数据并从中提取患者的数据特征,因此利用机器学习技术建立预测模型可动态预测患者围手术期不良结局[26]。一项单中心研究回顾了2010例心脏直视手术和胸主动脉手术患者的基本医疗状况、麻醉和手术中相关数据,采用ROC曲线比较不同机器学习技术与Logistic回归预测患者术后急性肾损伤的能力,结果发现,机器学习技术中梯度推进机对患者术后急性肾损伤的预测能力(AUC 0.78)优于Logistic回归(AUC 0.69)且错误率更低,该机器学习算法可实时处理术中数据,并在患者心脏手术结束即刻预测患者急性肾损伤的发生风险[27]。
术后疼痛是围手术期常见并发症,超过60%的外科患者术后出现中重度急性疼痛[28]。术后镇痛不全可使急性疼痛发展为慢性疼痛,导致患者痛觉过敏和神经病理性疼痛,影响术后康复和生活质量。有效的疼痛评估对准确评估患者的疼痛程度非常必要,便于选择适当的时机给予患者进行个体化治疗方案。在一项回顾性队列研究中,研究者采用5种机器学习算法(LASSO回归、梯度增强决策树、支持向量机、神经网络和k-近邻算法),对8071例外科患者的796项疼痛相关特征数据进行分析,并对患者术后中重度疼痛进行预测。结果显示,术后第1天,患者重度疼痛的预测中:LASSO回归的AUC最大为0.704,梯度增强决策树为0.665,k-近邻算法为0.643。对于术后第3天患者中重度疼痛的预测,LASSO回归同样具有最高的精确度,AUC为0.727[29]。机器学习算法通过分析患者电子病例数据,可以准确预测术后急性疼痛的发生,预测精确度取决于采用的机器学习算法。
选择性5-羟色胺再摄取抑制剂(selective serotonin reuptake inhibitors,SSRIs)作为抑郁症患者的治疗药物,可抑制肝酶CYP- 2D6活性,降低需要通过此酶代谢进行转化而发挥镇痛作用的前体阿片药物(如氢可酮)的疗效。Parthipan等[30]采用机器学习算法,对术后联合使用SSRIs和前体阿片药物的抑郁症患者进行疼痛预测,采用10倍交叉验证法评估模型,得出术前疼痛、手术类型和患者对阿片药物的耐受性是影响术后疼痛的最强预测因子。这项研究首次提供临床证据证明,SSRIs抑制前体阿片类药物疗效,影响抑郁症患者术后疼痛控制。
脓毒症的预测极具挑战性,患者早期临床表现特异性不明显,病情易迅速恶化,如能早期预测脓毒症,则可降低死亡率。InSight机器学习分类系统可以通过患者多参数智能监护数据集,包括生命体征、外周毛细血管血氧饱和度、格拉斯哥昏迷评分和年龄等变量预测脓毒症的发生。此外,InSight系统在不可用性、显著随机数据删除的情况下,也能有效预测脓毒症的发生[31]。
Hill等[32]采用随机森林算法从全身麻醉患者电子健康记录数据中提取58个术前特征,建立预测患者术后死亡率的自动评分系统,结果发现,术前特征自动评分系统(AUC为0.932)对手术患者术后死亡率的预测优于预测术后死亡率的术前评估量表(AUC为0.660)、Charlson合并症指数(AUC为0.742)及美国麻醉师协会(American Society of Anesthesiologists,ASA)评分(美国麻醉师协会根据患者体质状况和对手术危险性进行分类)(AUC为0.866),如将ASA评分纳入术前特征自动评分系统,该系统的预测能力提高(AUC为0.936)。自动评分系统有助于在术前快速确定最有可能发生术后并发症的患者,进行早期干预,使医疗资源分配至最有可能受益的人群。
机器学习算法的分析能力极高,优于经典统计和建模方法,但其主要缺点依然是所谓的黑箱问题:机器学习算法进行数据分析是基于机器阐述的数学函数、算法或模型,理解机器学习算法中获得所研究问题的机械答案是不容易的[16,33]。对麻醉医生而言,想要理解机器学习内部机制非常困难。尽管机器学习算法在各项试验中获得了成功,但临床医生难以判断“黑箱”内部是否会出现差错,因此机器学习算法可能难以获得临床医生的依赖。机器学习虽可以从变量中预测结果,但是无法给出结果发生的原因,人们无法理解得出结果的机制,即机器学习无法回答结果是如何产生(有相关性不等于有因果关系)。最后,机器学习算法的必要前提是从患者收集大量高保真的生理监测数据。如果训练过程出现数据不完整、不稳定、偏倚甚至是错误的情况,则可能会产生错误结果,误导医生做出错误的判断。因此,必须确保获得大量高质量的数据才能促使机器学习获得成功。
机器辅助诊断系统如沃森医生等在我国快速成长,逐渐改变过去的医学模式。人工智能甚至对某些疾病诊断的准确率超出具有高水准的专业医师,且具有较高的诊断效率。尽管目前将人工智能和机器学习引入麻醉实践的最合理途径仍是在患者的常规术中管理使用药物闭环控制系统,保持稳定的麻醉药物维持。然而人工智能已经作为敲门砖进入麻醉领域,这为麻醉医生未来的发展带来了挑战,同时也是职业发展的机遇。麻醉医师不得不做好工作理念转变的准备,思考如何在未来职业的发展中立足。麻醉医师不仅要接受并利用人工智能带来的技术成果,甚至要主动转型学习,在数学、统计、计算机编程等方面进行知识储备,甚至可在感兴趣的专业方向内深入研究,进行开拓实践,而不是仅仅满足于成为智能医疗的使用者。同时也要注意人工智能自身的缺点,如无法与患者共情、无法了解患者内心对麻醉方式和手术方式的接受程度以及对智能医疗的信任程度。智能医疗的发展也促使麻醉医生更多地参与到对患者的情感交流和人文关怀。因此,在人工智能医疗发展模式下,麻醉医生要转变至可持续发展的战略,在技术、工作模式、工作理念、医疗服务方面都要符合人工智能医疗发展趋势下的标准,在探索前进的道路上勇于改变,与时俱进。
总之,随着“大数据”时代的来临,人工智能技术及信息产业将对人类健康的发展发挥巨大的推动作用,越来越多的机器学习技术将可能进入围手术期医学,影响临床决策,改善患者预后。智能化机器算法对患者的评估和精准麻醉的控制将能为患者提供更舒适的麻醉体验。尽管目前机器学习算法仍然处于上升发展阶段,在理论中、实践中仍存在诸多问题,但伴随着技术的日趋成熟必将为麻醉领域发展带来巨大变革。