周丽娟 温贤秀 蒋蓉 周黄源 曹亚雨 蓝梅 吴海燕 吕琴 吴行伟 郭先一
(1.四川省医学科学院 四川省人民医院,四川 成都 610072;2.电子科技大学医学院,四川 成都 611731;3.中国人民解放军西部战区总医院,四川 成都 610095)
随着医疗大数据的不断积累,高性能计算设备的出现和机器学习算法的深入发展,人工智能技术被越来越多地应用在医疗领域。机器学习作为人工智能的核心技术,适用于各种类型的数据,既能处理变量间的非线性交互作用,又能提供跨复杂变量的分析解释,并从海量数据中筛选出关键因素,获得更稳健的预测分析模型[1-3]。该技术常用于病理诊断、临床决策、风险预测等方面,其精准性、系统性、有效性已得到初步证实。机器学习在护理领域中的应用也越来越广泛。本文从机器学习在不良事件和并发症、康复护理、慢病管理、护理管理、心理护理及中医护理等多个方面进行系统综述,为我国临床医护人员提供数据挖掘的方向,也为机器学习技术应用于护理实践提供借鉴。
机器学习(machine learning)被解释为“以经验性方式自动优化学习的一种有效处理高维数据和改进程序性能的算法,且采用模拟人们学习的方法来完成学习过程”[4-5]。根据获得标签的情况和模型训练方式的不同,机器学习常被分为:监督学习、无监督学习和强化学习[4-8]。常用的监督学习算法为朴素贝叶斯、logistic回归、线性回归、决策树、随机森林、支持向量机;常用的无监督学习有关联分析、K均值聚类算法,主成分分析(principal component analysis,PCA),特征选择与稀疏学习;常用的增强学习算法为Q-学习(q-learning,Q-L)算法、自适应启发评价(adaptive heuristic critic,AHC)算法、时间差分学习(temporal difference learning,TD learning)[9]。此外,深度学习(deep learning)是一种最先进的机器学习技术,在图像识别,语音识别和自然语言处理方面表现出高度的精准性。其中监督学习最常被应用于医疗领域。
本文通过采用主题词和自由词结合的方式,对PubMed、Cochrane、Embase、中国期刊全文数据库、维普中文科技期刊数据库及万方数据库等数据库进行系统检索,系统总结了机器学习在护理领域应用的相关研究。检索词及文献筛选流程见图1和图2(扫二维码可见)。
2.1护理不良事件和并发症 机器学习通过建立护理不良事件和并发症的预测模型,识别出高危患者,及早实施个体化护理干预,可对降低不良事件和并发症的发生起到积极作用。
2.1.1压力性损伤 Alderden等[10]利用电子病历系统(electronic medical record system,EMRS)收集6 376例患者的结构化数据,运用随机森林算法,并根据压力性损伤变量的重要性排序,将排序前5的预测变量:体质指数、血红蛋白、肌酐、手术所需时间和年龄用于构建重症监护患者压力性损伤的预测模型。该模型ROC曲线下面积(AUC)为0.79,可早期预测重症患者压力性损伤的风险。Hu等[11]构建决策树、logistic回归和随机森林3种模型用于预测住院患者压力性损伤事件;其研究结果表明,皮肤完整性、收缩压、表达能力、毛细血管充盈时间和意识水平是5个重要的预测变量;且随机森林预测性能高于决策树和logistic回归,F1值为0.845(F1值越大,预测性能越好)。Chen等[12]基于人工神经网络(artificial neural network,ANN)算法构建了心血管手术相关的压力损伤(surgery related pressure injury,SRPI)模型。该模型可帮助护士识别压力性损伤的高危患者,早期实施干预计划,有效减少SRPI的发生。
2.1.2跌倒事件 Topaz等[13]以自然语言(natural language processing,NLP)和机器学习相融合的方式,通过提取护理记录语料库,判断跌倒信息的分类能力,并创建临床文本挖掘的Nimble Miner系统。该系统有望在无监督学习情况下,实现临床文本健康数据挖掘,更适用于医疗实践和研究需求。Ye等[14]回顾性分析电子病历系统中157个跌倒潜在预测变量,最终以认知障碍、步态和平衡异常、帕金森氏症、跌倒史和骨质疏松症为主要预测因素,采用XGBoost算法构建患者未来一年中跌倒预测模型。由Delgado-escano等[15]提出的一种基于深度学习的跌倒预警模型,该模型以用户原始的身体惯性信息作为输入,采用多任务学习方法,实时执行跌倒检测和人员身份识别任务;结果显示,跌倒检测的准确率超过98%,用户身份识别的准确率为79.6%。
2.1.3低血压事件 患者术中低血压发作可导致不良预后,低血压发生时间越长,严重并发症发生的概率也越大[16]。使用机器学习算法建立前置性低血压风险预警模型有助于降低术中低血压发生风险。Hatib等[17]基于数千条动脉波形特征建立的机器学习模型可在术中低血压事件发生前15 min作出预警,其灵敏度为88%,特异度为87%。Kendale等[18]以麻醉诱导开始后10 min内平均动脉压低于55 mmHg(1 mmHg≈0.133 kPa)为结局指标,建立麻醉诱导后低血压风险的机器学习模型,结果表明梯度增强算法性能最好,相关的阴性预测值和阳性预测值分别为19%和96%。
2.2康复护理 机器学习在康复护理中,被用于建立卒中、脊髓损伤、髋关节术后患者的认知、生活质量、日常活动能力及机体功能恢复情况方面的预警模型[19],可为患者制定科学的康复计划。
2.2.1卒中康复 Chae等[20]开发了一种智能穿戴设备和深度学习模式的上肢家庭康复系统,有望成为未来卒中患者家庭护理治疗的一种实用且经济的康复工具。Iwamoto等[21]基于分类回归树(classification and regression tree,CART)算法,建立预测脑卒中患者日常生活活动(activities of daily living,ADL)依赖性的临床预测模型,其准确率为83%。Sale等[22]为探索卒中患者的炎性标志物作为预测变量的预测效果,使用支持向量机算法建立卒中患者运动和认知能力改善的机器学习模型,并从变量相关性、均方根误差和平均绝对误差百分率3个方面评价了模型性能。
2.2.2脊髓损伤康复 脊髓损伤的患者常有持续的功能、神经、认知能力的损害,日常活动能力需要长期监测及护理,有必要使用准确可靠的模型预测患者预后,从而提高患者的生活质量,促进个性化医疗的发展[23]。Devries等[24]利用无监督学习算法,以患者因素、年龄、脊髓损伤严重程度以及下肢运动和感觉评分来预测脊髓损伤患者1年后的独立行走能力。Liao等[25]提出了一种基于深度学习的身体康复训练质量自动评估框架。该框架由降维算法、性能度量、评分函数和深度学习模型组成;同时利用10个康复练习的数据集对所提出的框架进行了验证,此项研究展示了深度学习模型在康复训练评估中的潜力。
2.2.3髋部骨折康复 Cary等[26]使用logistic回归和多层感知机模型对患者髋部骨折死亡率预后分析,且多层感知机(multi-layer perceptron,MLP)算法具有良好的校准性,可作为准确识别髋部骨折患者30 d和1年死亡率高风险预测工具。多模态信号分析在医学康复领域应用日益广泛,Prochazka等[27]对康复过程中心率传感器和热像仪采集的生理数据进行了模式识别和分析,采用机器学习和数字信号图像处理的方法来评估身体活动中特定的生物医学信号,为制定运动康复计划提供依据。
2.3慢病管理 机器学习在慢病管理中,被用于建立疾病预后的预测模型,以减少慢病急性发作,降低患者再入院率,有效改善患者生活质量[28]。
2.3.1慢性阻塞性肺病 Mcheick等[29]应用贝叶斯网络学习模型来预测慢性阻塞性肺病患者病情恶化的发生,该模型准确率为81.5%。Gawlitza等[30]使用均值预测、中位数预测、K近邻(k nearest neighbor,KNN)、梯度增强和多层感知机这5种模型,根据定量计算机断层扫描(CT)值预测肺功能参数。以呼吸状态(吸气、呼气、增量)和参数(容积、最小管腔直径(minimum lumen diameter,MLD)、左房容积(left atrial volume,LAV)和半值宽度(full width at half maximum,FWHM)作为每个模型的输入,并以平均相对误差评估模型预测效果。结果显示,KNN模型的表现最佳。该模型可在合理的误差范围内根据静态定量CT参数预测肺功能值。
2.3.2糖尿病 基于机器学习的临床决策支持工具,学者对糖尿病前期、糖尿病患者住院风险以及2型糖尿病患者胰岛素治疗后的短期和长期糖化血红蛋白的反应进行预测。De等[31]通过符合美国糖尿病协会指南对糖尿病前期进行定义的6 346名患者,利用4种重采样方法和4种机器学习算法对糖尿病前期进行预测。该研究建立的4种模型均优于糖尿病前期的其他筛查工具(P<0.05),可提高糖尿病前期预测的准确性。Nagaraj等[32]使用基础糖化血红蛋白和估计肾小球滤过率的弹性网络正则化广义线性模型预测胰岛素治疗后糖化血红蛋白的反应,其预测性能良好。较为常见的深度学习算法——卷积神经网络(convolutional neural network,CNN)已被用于糖尿病视网膜病变的自动化诊断[33]。Lociganic等[34]运用此算法在小样本数据集上进行训练,用于检测和区分细微的眼部病变,并生成出血、微动脉瘤、渗出物、新生血管和视网膜正常外观的病变特异性概率图,该视网膜自动筛查的灵敏度和特异度分别为92.3%和93.7%。
2.4护理管理 机器学习算法对医院人力资源、工作质量方面予以预测,以达精准管控,促进医院高质量发展。急诊科承担着较大的门诊压力。为缩短患者平均停留时间,Yousefi等[35]提出了一种基于Agent仿真、机器学习和遗传算法相结合的急诊资源优化配置方法。该研究构建了8种不同的算法集成,其中AdaBoost集成前馈神经网络(feed forward neural network,FFNN)、自适应神经模糊推理系统(adaptive neuro-fuzzy reasoning system,ANFIS)和递归神经网络(recurrent neural network,RNN)性能最好,急诊平均停留时间减少14%。韩国学者Yu等[36]以86 304例急诊患者为研究对象,开发了基于机器学习的急诊分诊模型,其韩国分诊敏感度量表(Koreatriage and acuity scale,KTAS)和相关器官衰竭评估(sequential related organ failure assessment,SOFA)指标可准确地预测患者临床结局。Rojas等[37]以电子病历系统中提取患者护理级别、护理评估、住院号、药物、ICU干预、诊断测试、生命体征和实验室结果作为增强机器学习模型中的预测变量,构建并验证了ICU再入院的风险预测模型;结果显示,机器学习衍生模型(AUC=0.76)的性能明显优于工作量指数得分(AUC=0.65)或修正的早期预警得分(AUC=0.58);该预测模型的构建为管理者提供早期预警及临床护理决策。
2.5中医护理 机器学习技术在中医护理中,被用于中医体质和证候方面的预测,可为患者提供精准个性化医疗护理服务,为中医的革新发展起到积极推动作用。由Zhang等[38]提出的一种基于边缘云计算系统的统一智能中医药框架,以实现计算机辅助辨证和处方推荐为目标,建立证候识别的多模态深度计算模型,从而为患者提供个性化的服务。李迪瑶[39]基于辨证施护理论使用支持向量机、全连接网络和自编码器结和全连接网络3种算法构建辅助辨证工具;结果显示,全连接网络表现最佳,其中表里、寒热以及虚实这3种证候准确率分别为95.86%、97.58%和96.55%。Tang等[40]指出,中医体质与生理指标相结合可对代谢综合征进行早期预警,并以平衡体质、总胆红素、低密度脂蛋白、胆固醇、总胆红素水平5个指标构建梯度增压模型;该模型的总体准确率为73.23%。
2.6心理护理 机器学习在心理护理中,被用于建立焦虑、抑郁、妄想等精神卫生健康问题的风险预测模型,为患者选择最佳的心理干预措施提供依据。Kim等[41]开发了一种有监督的机器学习算法,利用来自情绪低落的老人的生态瞬时评估技术——一种可检测人在真实世界中随时间推移和在不同情况下实时体验和情绪的传感器,预测独居老人中抑郁群体。Mufti等[42]利用5 584例心脏手术后患者的数据,建立心脏手术后妄想症风险模型;该模型的建立可预防术后并发症,降低治疗成本,优化患者预后,具有一定的临床应用价值。Racine等[43]使用前瞻性队列的方法评估机器学习预测术后妄想症的模型性能,但其预测效果中等,可能因妄想症受多因素、异质性影响,是一种很难以准确预测的表型。Koutsouleris等[44]将深度学习运用于心理研究,抑郁症患者预后的准确性提高了1.9倍,并验证了在新发抑郁症患者的预后确定性增加10.5倍,深度学习可提高患者预后的确定性。
综上所述,机器学习为护理信息化发展提供了新的方向、新模式、新经验。目前,机器学习算法在护理不良事件、康复护理、中医护理、心理护理、慢病管理及护理管理等方面应用广泛。以信息化医学工具为基石,全面深度分析数据,并增加有效的治疗、护理策略,可达到患者精准个体化干预,从而提高其生命质量。国家大力推进各行业领域从数字化、网络化向智能化跃升,未来护理信息化趋势必将响应国家号召,加强医学人工智能应用标准研究及各地推进医学人工智能应用。然而,在医学人工智能发展的道路上,我国尚存的一些问题,一是跨学科人才培养缺乏:医学专业与计算机专业的深度交叉融合,需既懂医学又懂计算机的复合型人才。二是我国信息化体系不健全,需要进一步完善:未来研究者将更多以电子病历系统的数据信息来预测疾病发展动向。建议开设护理信息学学历教育,同时搭建专业的学习交流平台,促进跨学科合作,以期通过借助机器学习、深度学习等先进技术手段,帮助护士提高工作效率、提升专业价值。