宋佳雪,吴 英,彭 程,彭 倩,莫慧颖,吴容婵
1.中南大学湘雅护理学院,湖南 410000;2.中南大学湘雅医院
病人安全是医疗卫生领域的一项战略优先事项,其核心是医院不良事件的预防。在高收入国家,有10%的病人在医院治疗期间经历过不良事件[1]。护理不良事件作为常见的医院伤害之一,是指在常规治疗护理过程中发生的,可能会导致病人受到伤害、延长住院治疗时间的意外护理事件,包括压力性损伤、非计划性拔管、跌倒、走失、用药错误等[2-3]。护理不良事件的发生不仅对病人生命质量造成威胁,还增加了额外的医疗成本[4]。研究显示,约50%的护理不良事件具有可预防性[5]。为了加强护理不良事件闭环化管理,多数医疗机构建立了护理质量信息化管理平台,但平台大多仅专注于不良事件的上报和统计,依然存在预警不准、漏报不报、整改有效率低等问题[6]。随着医疗大数据爆发式增长,人工智能已经进入赋能医疗健康阶段[7]。机器学习法作为人工智能领域中的重要技术,助力于智慧医疗发展,将其应用于护理不良事件管理中可以促进不良事件精准化识别与智能分析,实现自动化质控,有望弥补当前不良事件管理中的缺陷,提高工作效率。本研究对机器学习法在护理不良事件预测、监测、评估和原因分析等方面的研究进行综述,旨在提高我国护理人员对机器学习算法的认知,为制定依托信息技术的不良事件智能化管理策略提供依据。
机器学习是一门通过学习数据中的复杂模式,利用算法建模,并通过迭代训练逐步改善性能的科学学科,经常出现在统计学与计算机科学的交叉领域[8]。目前,在护理领域,应用较多的算法有逻辑回归算法(Logistic regression,LR)、决策树算法(decision trees)、随机森林算法(random forests)、支持向量机算法(support vector machines,SVM)、人工神经网络算法(artificial neural network,ANN)等。
逻辑回归算法用于研究多个自变量对二分类因变量的影响,是医学领域应用最广泛的统计模型之一[9]。如有研究采用Lasso 回归与Logistic 回归分析相结合的方法,纳入年龄≥60 岁、功能障碍、联合服用特殊药物、无陪护人员、低血钙5 个自变量构建跌倒伤害预测模型[10]。模型可以直接看出各个特征的权重,易于理解,帮助医护人员快速识别某事件发生的高风险人群,适用于处理二分类问题。
决策树主要用于解决分类问题,是一个倒置的树状模型,由根节点、内部节点和叶子节点组成[11-12]。通过由根至叶的递归过程对数据进行分类,叶子节点即分类结果,形成一个决策树分类模型,每条由根节点至叶子节点的路径是一条分类规则。如根据住院时长(根节点)、伤口敷料感染情况、疾病诊断、住院费用等(内部节点)筛选护理机构中压力性损伤的高危老年病人(叶节点)[13]。模型建立的核心问题在于如何确定树的大小和深度,即选择分裂属性及剪枝策略。决策树结构简单,可解释性强,能够帮助医护人员从树状结构中识别出研究对象的风险指标,适于对算法背景了解较少的护理人员运用。
随机森林算法是一种基于决策树的集成分类模型,利用多个彼此独立的树学习器进行分类预测和回归预测[14]。其原理是先使用Bootstrap 方法从样本集中抽取训练集,然后在每个训练集上训练出一个决策树模型,所有树分类器投票次数最多的类别为最终的输出结果。随机森林解决了决策树算法泛化能力弱的问题,准确性高,且能在大型数据集中高效运行。
SVM 是机器学习中常见的分类器,是将数据通过内积函数进行非线性特征映射变换到高维空间,在这个新空间内求取最优分类平面的过程,要求所取平面能在保证分类精度的同时保持两侧的空白区域最大化,在处理小样本、高维非线性数据中具有一定优势[15],可用于压力性损伤预测模型、跌倒检测系统开发等方面[16-17]。
ANN 是一种模拟人脑神经系统运行方式处理信息的算法[18]。模型包括3 层,由大量节点(神经元)通过“突触”(数学上称为权重)相互连接构成[19],每层可有多个节点,每个节点都连接到前一层的节点上,但同一层的节点没有连接。第1 层称为输入层,用于接收信号,此层节点相当于回归模型中的自变量;第2 层称为隐藏层,通过调节神经元间连接权重获得最佳值[20],隐藏层节点数目决定了模型的预测精度;第3 层为输出层,生成最后的结果,输出节点即回归模型中的因变量[21]。传统统计方法(如线性回归)只涉及1 个输入层-输出层,相比之下,ANN 在处理自变量间的交互作用、复杂模式的识别和分类任务中有显著优势,且不用考虑共线性,适合复杂临床情景的建模设计[22]。
压力性损伤是住院病人最常见的不良事件之一,在全球成人住院病人中发生率达12.8%[23]。国内外已有多位学者采用不同的机器学习方法开展了压力性损伤预测方面的研究,如Cox 等[24]从重症监护医学信息数据库Ⅲ(MIMIC-Ⅲ)中提取了1 460 例病人数据,通过建立决策树预测模型,得到了9 条不同的压力性损伤风险分类规则,为护理人员采取优先、针对性的预防措施提供了依据。Nakagami 等[25]利用电子健康记录(EHR)构建了重症病人压力性损伤预测模型,结果表明模型受试者工作特征曲线下面积(AUC)为0.78~0.82,并且解决了因压力性损伤样本例数较少造成的数据类别不平衡问题。Song 等[26]采用逻辑回归算法、SVM、随机森林算法和ANN 构建压力性损伤预测模型,发现格拉斯哥昏迷量表评分、意识状态是院内压力性损伤发生最重要的风险因素,且随机森林模型的预测性能最好。国内机器学习预测研究开展较国外稍晚,曲超然[27]通过决策树模型、随机森林模型、朴素贝叶斯3 种机器学习算法建立了适合成人心血管疾病病人术中压力性损伤的预测模型,结果表明3 种模型都具有较好的预测效果,其中随机森林模型表现最好,准确率达90.91%。杨亚平等[28]通过决策树筛选出3 类急诊压力性损伤高危人群,按照风险值大小排序依次为完全不能独立、存在大/小便失禁、年龄>80 岁且水肿程度属于二级及以上,便于急诊护士依据树形图规则快速识别压力性损伤风险人群。Xu 等[29]采用多种机器学习算法开发了压力性损伤列线图预测模型,提高了模型的预测能力,与Braden 评分量表相比,模型使用的临床参数可及性更高,有利于优化护理资源配置[30]。机器学习预测模型能改善风险量化,具有更高的敏感性和特异性,可以为护理人员提供有效的压力性损伤护理决策支持。另外,基于树分类的机器学习模型在上述研究中表现较好,更适于住院病人压力性损伤预测场景的应用。
UEX 是指留置管道意外脱落(包括医护人员操作引起)或病人未经医护人员同意自行拔管[31],是影响病人安全和护理质量的重要因素,可能致使病人血流动力学并发症增加、机械通气时间延长甚至危及生命[32]。建立可靠的风险评估流程是提升管路安全的首要措施,但目前国内缺少统一的UEX 风险评估量表,UEX受多种因素交互作用影响,已有学者利用机器学习算法提炼UEX 风险因素,构建临床预测模型,应用效果显著。Hur 等[33]将6 914 例ICU 置管病人纳入研究,采用多种算法开发了重症病人UEX 预测模型,发现高龄、Richmond 躁动-镇静评分(RASS)高、身体约束不合格的病人非计划性拔管率较高。结果表明将模型嵌入电子病历系统可以动态评估UEX 风险,能够在可能的拔管事件发生前60 min 预警医护人员采取措施,最大限度地减少病人伤害。国内基于机器学习算法进行数据挖掘的应用较多,赵秀芬等[34]利用Apriori 算法对210 例鼻肠管UEX 病人进行分析,得出了鼻肠管UEX风险因素之间的关联规则,并就插管期间管理的薄弱环节采取防范措施,住院病人鼻肠管非计划性拔管率明显下降。沈鸣雁等[35]采用Apriori 算法进行数据挖掘,结合专家分析得出了与UEX 相关的13 对强关联规则,进一步为国内UEX 预警模型的开发提供了依据。综上所述,今后护理人员在管道风险管理中,可以充分发挥机器学习法从数据中获取信息的优势,及时识别工作中的薄弱环节,防范UEX 事件发生。
跌倒是医院风险管理优先事项,不仅会增加病人的疾病负担,还可能引起不必要的医疗纠纷。因此,对住院病人跌倒风险因素及预防策略的研究在跌倒管理中非常重要。近年来,利用人工智能技术预防跌倒已逐步成为现实,机器学习则可用于跌倒前的预测模型构建[36]。Lindberg 等[37]采用了决策树及其3 种集成算法(随机森林算法、Bagging 算法、Boosting 算法)对38个潜在风险变量进行分析,得到了跌倒风险最重要的特征从高到低依次为跌倒史、年龄、Morse 跌倒风险评分、步态质量、科室类别、精神状态和使用高跌倒风险药物(FRIDs)的数量,4 种模型能够准确识别跌倒病人的相关风险因素,且优于Morse 跌倒风险评分的预测能力。Liu 等[38]应用多种机器学习算法构建模型,该模型适用于预测不同时间点的病人跌倒风险,包括病人入院时、入院24 h、临床变量值最大时、临近跌倒事件发生时,结果表明模型可以对整个住院过程进行连续监测,且集成分类器模型预测性能表现优于单一分类器。Kawazoe 等[39]使用BERT 算法和Bi-LSTM 算法开发了一个基于电子健康记录的跌倒预测模型,并且估算出若及时采取干预措施,每天的住院费用可以节省6.5 美元。此外,机器学习还能用于进一步量化跌倒严重程度,如Wang 等[40]从METEOR 临床数据库中提取了1 692 例病人的人口统计学特征、诊断、骨密度测量数据等信息,开发并验证了一种多视图集成分类学习模型,可用于跌倒风险评估后具体预测跌倒的严重程度,能够识别出跌倒危害较高的病人,提示护理人员分级管理。
目前,国内临床护理人员多依赖量表和主观经验在病人住院期间进行定期评估,筛查不良事件高危人群。在量表应用时,显现出部分指标主观性较强致评分者间信度偏低等问题,并未有效降低护理不良事件发生率[41-43]。同时,病人住院期间发生病情变化时往往需要护士复评风险,增加了护士的日常工作量。机器学习可以自动提取病程中新出现的潜在危险因素,将其纳入预测模型识别高风险病人,提高不良事件预警的准确率,优化病人护理。但必须注意的是,当前大多数基于机器学习算法的预测模型缺乏外部验证,模型泛化能力未知,这将是未来研究中的重要方向。
机器学习在图像数据处理方面的发展为不良事件监测提供了新的方法路径,当前已有的研究主要集中在院内跌倒监测系统开发上。国内外学者多将机器学习与可穿戴传感技术、视频传感技术相结合开展自动跌倒检测研究。前者通常由病人佩戴的传感器采集角速度、加速度等数据结合机器学习算法以区分日常生活活动和跌倒事件[44]。研究使用的算法多为深度学习算法,如Yu 等[45]开发了一种基于卷积神经网络(CNN)和长短期记忆神经网络(LSTM)的集成算法模型(ConvLSTM),用于执行人体站立、跌倒过程、撞击地面时3 个阶段的分类判别,五重交叉验证表明,ConvLSTM 模型对3 个阶段具有较高的灵敏度(>93%)和特异度(>94%),均高于CNN 和LSTM 模型,可以实时监测跌倒事件。今后若能在跌倒瞬时触发可穿戴式安全气囊,在很大程度上能减少与跌倒相关的伤害。有研究利用医院视频监控技术监测病人图像,通过提取图像中人体主要关节点构建骨架模型,根据病人宽高比、下肢与地面夹角等特征使用算法模型识别人体姿态,以判断病人是否跌倒[46]。金玮等[47]应用医院监控视频获取实时数据,基于CNN 算法提出了一种人体姿态识别方法,自动检测院内跌倒事件的发生,准确度为99.75%,灵敏度为100%,特异度为99.68%。基于机器学习的跌倒实时监测系统常用的步骤包括使用传感技术收集数据、特征提取、构建算法模型、跌倒检测。相比而言,基于可穿戴传感技术的跌倒检测设备体积小、不受环境物理因素影响,但易受活动干扰,误报率较高;采用视频监控技术成本较低,更适于医院工作中护理人员工作量大、人手短缺的现状。未来可结合多模态传感器开发更稳健的院内跌倒监测系统,在开发时还需要考虑在采集监控图像时保障病人隐私的问题。
压力性损伤发生后,最首要的措施即评估压力性损伤分期,给予相应的局部伤口护理。压力性损伤创面管理往往包括多重异构数据,机器学习可以利用算法分析病历中的相关临床记录,将压力性损伤创面图像数据化以实现自动、高效、非侵入性的压力性损伤创面评估,避免护士主观评估引起的误差以及侵入性评估伤害。Silva 等[48]提出了一种基于SVM 和Grab cut图像分割相结合的算法模型,通过超像素分割、特征提取、数据准备、创面识别、分割5 个步骤实现了溃疡区域的自动识别,并且可以准确测量创面面积,平均准确率达96%。但该研究中没有将模型用于组织分类,无法监测创面愈合过程。Chang 等[49]将多种深度学习算法模型结合,创建了压力性损伤诊断系统,能够结合图像分析结果和临床数据对创面进行自动诊断,提供多方面的诊疗建议,通过检测再生上皮化信号(re-ep)评估创面愈合征象;进行组织分类以评估肉芽组织占比,评估创面愈合进展;使用图像投影估计伤口大小;根据感染、坏死组织的分割结果以及实验指标提供是否需要手术清创的辅助决策,诊断模型准确率达到99%。由此可见,基于机器学习算法的压力性损伤管理能够帮助临床护理人员对创面进行准确分析、动态评估,防止发展成慢性难愈性创面,提高其治愈率。
从病人安全事件报告中学习,对事件进行追溯分析,探讨其发生原因及改进措施,是减少不良事件发生率、持续改善医疗护理质量的关键。当前,国内各医疗机构未形成统一、规范的护理不良事件上报系统,填报内容包含着大量描述事件发生过程的叙事性文本,缺乏合理、清晰的归类处理[50],基于原因分析理论模型开展审查,如Reason 模型[51]、SHEL 模型[52-53]等,得出不良事件的级别分布、时间、科室分布及相关因素,需要耗费大量的时间和精力,且审查标准不统一,易出现分析人工因素偏差的问题[54]。
在数据科学中,自然语言处理是使机器能够理解、处理并解释人类语言的技术,同属人工智能领域。基于机器学习算法构建非结构文本中的自然语言处理模型[55],发挥概念提取和关系识别等功能,可以为护理人员提供不良事件文本分析时的辅助工具。国内外关于此方面的报道还相对较少,宋杰等[56]使用自然语言处理法和人工标注法同时对1 599 例次压力性损伤事件报告进行分析,将报告中的“事件主要表现”叙事性文本内容作为主要处理对象,以获取报告中与压力性损伤发生相关的因素;前者使用基于SVM 算法和条件随机场算法的混合特征算法模型,后者由2 名经验丰富的护理专家进行人工标注,结果显示自然语言处理组的标注有效率(88.56%)高于人工标注组(63.77%),灵敏度达到87.19%,这意味着仅靠专家分析可能会遗漏部分风险因素。同时需要注意的是,在自然语言处理模型开发时,灵敏度和精度的调整难以统筹兼顾,假阳性事件可能会因此增加,需要额外的人工确认工作量[57]。葛晓伟等[58]通过构建字符级文本词汇表对文本数据向量化,使用CNN 算法提取文本特征,采用一对一支持向量机分类算法对提取的文本特征进行分类,构建了一种基于CNN-SVM 的护理不良事件文本分类模型,平均准确率达到78%,能够对不良事件进行有效分类。将机器学习算法运用于不良事件原因分析,有助于护理人员识别易被忽略的风险因素,预测二次事件发生,并且有助于今后管理人员构建不良事件填报时的标准语料规则库,形成统一的护理不良事件分类上报系统。
在护理不良事件管理中,机器学习法提高了预测模型的敏感性和特异性,增强了风险识别能力。目前,国内护理风险相关预测模型的构建多基于传统Logistic回归与Cox 回归,经过单因素、多因素分析后纳入有统计学意义的变量。但在筛选变量的过程中很容易排除掉某些有潜在临床意义的变量,因此无法充分利用病历系统中的真实临床数据[59]。机器学习算法则无须对变量间的相关性提出先验假设,而是使用算法对所有可用数据进行分析,得出变量间的规律[60]。同时,基于机器学习和自然语言处理技术融合的方法能够从大量的非结构化记录(如入院记录、护理记录等)中挖掘数据形成预测模型,推动不良事件管理模式向“事前预防”转型。机器学习和射频识别、信息传感等物联网技术的连接提升了数据感知能力和病人信息的采集效率[61],可用于实时监测高风险水平的病人状况,辅助护理决策以最大程度规避安全事件的发生,同时传感设备的应用减轻了临床护士的工作负荷。压力性损伤事件发生后,借助基于深度学习算法的图像处理技术有利于护士准确判断、评估伤口,开展后续的伤口护理计划。机器学习的运用为不良事件“事中管理”提供更高效的方法。另外,国内各医疗机构完善了不良事件上报功能,人工审查报告内容时面临着耗时耗力、人为因素多等问题,护理管理人员可以利用机器学习处理自然语言任务的能力,智能化提取报告中的有效信息,实现不良事件出现后的“事后分析”。
机器学习也同样存在不足,在使用传统的逻辑、线性回归进行数据分析时,人们可以参考模型系数解释模型及其预测结果。而机器学习性能的提升会伴随着模型复杂性的增加[62],多存在模型决策过程不透明、结果缺乏可解释性等情况,即“黑盒效应”[63]。由于模型给出的判断会对病人进一步的治疗造成明显影响,可解释性缺乏会降低医护人员对模型的信任,阻碍模型转化应用于临床的进程,仍然是机器学习面临的重要挑战。国内研究应用场景多为重症监护室,可能是因为重症监护室能更频繁地实时传感数据,可用数据较多。机器学习算法受大量临床数据驱动,对数据集的要求较高,尤其是深度学习算法,需要从大量样本中提取特征训练模型,以避免过拟合的发生,很难用于罕见类疾病/症状的模型构建中[64],且国内医疗系统数据存储环节存在数据割裂的问题,如何实现临床大量数据跨系统融合需要进一步探索。
机器学习法已在护理不良事件管理中取得了一定成效,虽存在一定的局限性,但极大地提高了医疗保健服务水平与效能,不仅能助力不良事件精准预测、保障病人安全,还可以促进不良事件转向数据化管理。在未来的研究中,如何建立外部效度可靠的预测模型,并将这种不良事件智能管理系统嵌入到电子病历系统中是主要方向。建议开展研究探讨护理人员对现有基于机器学习技术的应用看法,以了解人工智能技术对护理质量的潜在影响;建议将护理人员纳入智慧医疗项目的设计、研发过程中,重视护理人员的实践角色,加强“护理学-工程科学”的跨学科联系,真正实现适于医院场景的智慧护理技术的运用。