机器学习在构建护理风险预测模型中的研究进展

2022-12-31 21:19王晶李玲利赵春林杨雪贺婷婷袁邻雁陈潇
护士进修杂志 2022年23期
关键词:机器护士预测

王晶 李玲利 赵春林 杨雪 贺婷婷 袁邻雁 陈潇

(四川大学华西护理学院/四川大学华西医院,四川 成都 610041)

国务院办公厅发布《关于促进和规范健康医疗大数据应用发展的指导意见》[1],其中提出医疗发展应该顺应新兴技术发展趋势,推进科研大数据的应用,建立疾病、药物副作用预测机制,充分利用优势资源,推动智慧医疗发展。随着大数据、人工智能等领域的飞速发展,精准医学与临床决策支持系统也是医疗服务进入智能化时代的要点。通过收集个人数据,应用算法,对个体易感性、敏感性进行预测分析,是服务模式向个性化、智能化地有效转变[2]。机器学习作为新型算法,可以对大量复杂数据进行深度学习并充分挖掘数据,获取新逻辑关系[3]。目前,风险预测模型构建是机器学习的常见用途之一[4],且已经在护理领域进行了系列模型探究与验证,实现了部分疾病症状的预测性防护与护理。因此,本文将通过对机器学习在护理风险预测模型的应用现状进行总结展望,为后续护理学者探索未来研究方向提供参考。

1 机器学习与风险预测模型的概述

1.1机器学习 信息技术等领域的快速发展,使得计算机数据分析的能力迅速提高,多个行业因此受益良多,其中尤其为医疗健康行业,可以将分析方法应用于大型数据库为医疗保健决策提供证据[5]。其中,机器学习指科学家探索如何开发合适的算法促进数据学习的研究领域,也指使用计算机等机器将统计算法应用于数据集中的人工智能方法之一[6]。在模型构建中,机器学习主要可以对结构化数据(诊断代码、人口统计学等)及非结构化数据(主诉、病例中的自由文本数据等)进行观察描述并挖掘他们之间可能的关系,以此开发出可以辅助临床决策或患者结果的预测模型。目前,常用的算法有Boost算法、支持向量机、决策树、随机化森林、贝叶斯及人工神经网络等[7]。

1.2风险预测模型 随着计算机技术和医疗领域的相互促进,依托“互联网+”,智慧医疗已经在健康发展取得一定的成果。智慧医疗不仅仅包含健康管理创新化、互化,还包括健康结局可视化、预测化;健康医疗大数据背景下,人工智能将利用海量的健康数据,进行计算机建模,从而实现精准的疾病未来结局、症状发生可能性等事件的概率,从而协助医护人员制定个性化地预防性治护方案[8]。风险预测模型指将患者的某些特征或症状作为预测因子,并对其进行权重分配,从而获得风险概率的工具[9]。近几年,越来越多的护理研究者将风险预测模型引入慢病管理、不良事件等领域。

2 机器学习在护理风险预测模型中的应用

2.1预测慢性病进展 反应国家经济社会发展、卫生保健水平和人口健康素质的指标之一是慢性病状况[10]。目前,慢性病已经成为全球死亡的第一大原因,我国已有2.6亿人确诊慢病,占据我国疾病负担的70%左右[11]。针对慢病患病率上升且逐步年轻化的现状,重视预防与管理成为重要举措。而大数据与新技术对健康管理的重要性应该得到关注与利用[12]。

2.1.1糖尿病 糖尿病是一种以高血糖为特征,伴随多种并发症的慢性疾病,其对人体的健康及生活质量造成严重影响[13]。近年来糖尿病发生率逐步增高,其防治措施亟需关注。Savita等[14]从机器学习储存库中收集糖尿病患者相关信息,通过使用分类算法(支持向量机、贝叶斯、决策树、随机森林及神经网络等)在数据集上进行测试和计算,并与Pima印度糖尿病数据集进行比较,以期能够精准的预测患者糖尿病风险。最终结果显示,改进的随机森林和k近邻算法具有最佳精度。同时,Dinh等[15]利用受监督的多个机器学习模型(物流回归、支持向量机、随机森林和梯度提升)对美国国家健康数据集进行搜索,并将模型进行组合,开发出加权集合模型,最终得出腰围、年龄、体质量及钠摄入量等为糖尿病患者的预测性因素。Quan等[16]和Kwon等[17]研究者皆使用数据集对糖尿病预测模型进行开发探究。

2.1.2心血管疾病 心血管疾病被视为最严重、最致命的疾病,占全球死亡总数的1/3,即头号死因[18]。但其早期诊断困难,后期诊治又需要充足完善的资源,对部分国家或地区具有挑战。因此,准确的预测是有效解决问题的方法之一。Pronab等[18]通过慢性心脏病的数据集构建智能机器学习系统,纳入多个特征包括年龄、性别和血压等,选择多个模型进行模型构建与评估,最终得到的随机森林混合模型具有最佳性能(精度约92.65%)。Nayan等[19]同样通过人工神经网络得到具有90%特异度、灵敏度及准确性的模型,其可以从心电图、血压、总胆固醇等方面进行心血管预测。

2.1.3慢性呼吸系统疾病 慢性呼吸系统疾病是全世界死亡和发病的主要原因之一,慢性阻塞性肺病(chronic obstructive pulmonary disease,COPD)和哮喘最为常见[20]。Dimitris等[21]考察了医疗保健领域的临床决策支持系统,对代表性样本静息研究,结果得出准确率为97.7%的COPD随机森林模型,其关键预测因素为吸烟、年龄、第1秒用力呼气量和强迫肺活量;以及精度为80.3%的哮喘随机森林模型,其显著因素为呼出25%与75%肺活量时的最大呼气流量。

结合机器学习的风险预测模型构建已经在慢性病及其并发症管理中得到一定的研究与应用,但是由于研究者的数据来源不同以及不同模型在数据集中的性能优劣,目前没有统一适用的模型,后期研究有待改进。但是,对于较为确定的、可避免的关键危险因素可通过加强宣传与前期预防干预进行规避,从而有效减少慢病发病率以及不良结局的发生率,降低医疗成本,节约资源。

2.2预测不良事件 随着医疗卫生行业的快速发展以及健康中国建设的推进,患者安全这一医疗管理的核心成为了推进医药卫生改革的基础,党的十九大指出要将患者安全作为医疗管理的重要内容,不断提高管理水平,减少医疗服务中可避免的不良事件[22]。目前,国内外对不良事件的定义尚未统一,但是大多研究中所指为压力性损伤及跌倒等类别[23]。据研究[24]数据显示,住院患者中50%的不良事件是可以预防的,因此探究准确有效的预测方案对实现优质护理有重要意义。

2.2.1压力性损伤 压力性损伤通常指压力或压力与剪切力的组合导致皮肤或组织损伤,其发生率是评价护理质量的重要指标之一。Ling等[25]研究者针对外科手术患者术中压力性损伤相关指标进行logistic回归建模,决策树算法分析自变量的重要性,最终得出BMI、手术时长及术中失血等是独立因素,整个模型灵敏度为0.81,特异度为0.88,曲线下面积为0.69,具有良好的诊断价值。Hu等[26]整合以往的文献、量表等内容,选择54个变量在11 838例病例中使用线性回归(LGR)、决策树、随机森林等方法进行分析,最终得出随机森林为最佳模型(召回=0.802),其中皮肤完整性、收缩压变化、表达能力等为关键变量,而饮酒、食用坚果等习惯需要考虑不同地区或国家的文化。探索压力性损伤的关键危险因素,可以有效帮助临床护士全面了解患者所处现状,减轻工作量的同时提高住院质量。Alderden等[27]和Mireia等[28]研究者同样发开了面对不同患者群体的压力性损伤预测模型。

2.2.2跌倒 跌倒是医院内常见不良事件之一,其可能导致患者受伤、住院时间延长等问题,因此积极有效预防跌倒极为重要。目前,临床常用跌倒评估量表(如Morse量表),但是此类评估工具可能会受到评估时机、实际环境和患者类型等的影响而不准确,且增加了护士的工作量。Yokota等[29]研究者对电子病历中的患者数据进行统计,采用支持向量机算法建立FINDS模型,可以根据护理记录以及患者每日相关信息预测患者是否会在某日跌倒,克服传统评估模式的部分问题,客观准确预估,减轻护士负担。Olivier等[30]将848例老年住院患者纳入人工神经网络进行分析,通过床旁临床评估以及电子病历采集相关数据,最终得出高特异性的模型;结果表明,面对老年患者时,应该多用诊断测试而不是筛查测试。

基于数据挖掘的不良事件预测模型相较于传统的量表评估,可以动态地、连续性地评估患者危险等级,且与医院系统衔接后,自动提取相应数据进行分析,免除护士主动评估的程序,在减少工作量的同时,提高预测准确率,尽早对高危患者、高危因素实施干预,减少不必要的不良事件发生,把控患者安全。

2.3管理模式及成效预测 相关政策倡导应该强化信息化医疗人才的培育,推动医疗、政府等机构的医疗数据型人才队伍建设。同时,利用信息技术手段与大数据资源,完善医疗评价体系,推动医院制度改革,优化医疗卫生资源的管理布局[1]。

护士短缺已经成为了全球医疗问题,不断增长的医疗需求加剧了短缺程度,为了缓解该局面,降低离职率是方法之一,因此可探究护士离职相关因素从而进行相应干预。Chang等[31]对护士进行调查,利用结构方程进行模型构建,发现提高专业能力的意识和行动与离职意向呈负相关。因此,护理管理者可以通过合理分配资源,提高护士专业能力来降低其辞职意图。同时,由于护理人员工作挑战较大以及需长期处于医患群体的关系中,很容易发生职业倦怠,该因素与护士离职率上升有关,给卫生保健组织及患者安全带来较大影响。Yao等[32]研究者通过马斯拉赫职业倦怠量表等问卷对860名护士展开调查,并通过通用线性模型进行机器学习,结果显示压力、自我效能与个性类型是3大风险因素。Kelly等[33]研究者进行重症监护室护士的倦怠进行限行逐步回归分析及聚类,得出工作压力、工作满意度和工作乐趣等可预测护士的职业倦怠。因此,医院及科室管理者可以通过减轻压力、增强自我效能等策略帮助护士减轻倦怠。护士是医疗系统的核心人力资源,护理质量直接对患者健康有影响。如果护士人员的配置不能满足患者需求,护理质量可能会受到影响。Daniel等[34]对围产期护理数据库进行二次数据收集,通过套索算法筛选可能影响护士人员配置的预测变量,后使用混合效应线性回归模型以及10倍交叉验证构建护理人员配置预测模型,可以解释1/3的护理人员变动,且结果表明人员的增加可能会减少不良事件。根据此类研究,未来卫生服务可通过合理调整人员配比提高护理服务质量。

除人员管理外,在评价护理单元方面,目前大多数医院多基于规范的评价标准进行考核。考评方式多为管理委员会成员进行检查、评价,给出评分进行评选优秀护理单元。虽然会结合科室特性,但是缺少更加客观、科学、准确的评价标准。通过数据挖掘技术与客观数据结合,如将各护理单元的工作量、人员配置及资源绩效等进行全面评估记录,分析其对护理质量的影响及相应得分,从而得到个性化、精准化的各护理单元护理质量评价结果。同时,利用平台自动分析,可以减少管理委员会工作量,实时动态计算,更加科学化的监督护理服务质量。

2.4教育方式及模式成果预测 鼓励探索开发新型教学模式,推进学习成效评估等应用,从而方便护理学生的学习,提升护理水平[1]。美国劳工统计局预计,截止到2028年,全美国将需要340万护士进入医疗行业中,这比目前所拥有护士数量增加了12%[35]。为满足日益增长的医疗保健需求,教育行业应该积极招收护理学生并提高毕业率。为此,研究者们探究出影响学业成功的预测因素,以便于积极干预。Hannaford等[35]总结某私立大学的学生信息,选择8种机器学习算法进行模型构建与比较,最终选择最佳模型为随机森林,其曲线下面积为0.60。且研究结果显示,护理相关课程成绩、学分以及大学平均成绩可以预测识别出高危学生。该类模型可指导高校改进教学模式与方法,为学生制定个性化培养方案以及早期高危干预措施,提高教育质量。除在护理人员数量缺失外,全球卓越的高等教育需求也日益增加。但目前对于教育质量的指标尚未有一个“基准”,Langan等[36]纳入来自英国9所大学护理课程的数据,使用机器学习方法(分类决策树等)客观地选择价值变量来预测我们衡量成功、学生进步的指标后,用选择的变量构建基准模型,最终得出年龄、性别、青年参与高等教育的比例等因素平均重要性最高。该基准方法可以为探索其他地区基准提供依据,以提高高等教学的质量。

3 机器学习在护理风险预测模型的应用不足与挑战

3.1前期数据缺失或记录不规范 构建风险预测模型时,最重要的基础是数据集的全面性与准确性;目前,大多数研究为回顾性探究,但是现有数据存在一些问题,导致模型构建不理想。虽然早在2008年住院护士工作站系统应用率已经高达67.22%[37],但是由于护理记录没有规范化格式,因此不能直接作为原始数据进行挖掘,需要大量前期处理,耗费人力、时间。而且一些数据未被记录入系统中,例如伤口、压疮等图片资料,导致大量数据资源流失。目前,大多数医院拥有自己的数据中心,可以进行数据分析与利用。但是医院间、地区间信息处于孤立状态,无法进行数据共享,导致信息孤岛的产生。因此,大多研究成果虽然在实验所在地效果良好,但因为数据集特征不同,因此结果无法共用且研究结果代表性不足,可推广性不强。部分研究在考虑临床相关因素时,忽略了大环境因素对人体的影响,例如在探究慢性呼吸系统疾病高危因素时,是否应该纳入患者长期生活环境的空气质量等影响因素,保证预测的全面性与有效性。鉴此,为了能够更加有效利用数据中蕴藏的丰富信息,应该从日常工作记录规范化这一基础措施做起,有利于数据利用的同时有助于推动后续数据库共享化、信息共通化以及系统评价制度的完善化。

3.2护理人员数据挖掘知识储备不足 医工结合已经成为当今医疗行业发展趋势,护理人员与多学科学者进行交叉合作,以期快速有效提升护理服务质量。但是我国护理人员自身缺少信息技术相关知识储备,不仅仅会降低与专业人士合作的效率,同时可能会忽视一些可以用信息技术解决的临床问题。目前,我国护理学者在构建风险预测模型时,还是以logistic等传统分析方法为主,相较于国外研究,我国大数据在护理领域的探究还处于起步阶段。部分研究者虽走在前列,利用机器学习进行数据挖掘,但通常会通过阅读文献或经验来选择某一种算法,而同一研究问题在不同数据库中构建模型,适用的算法可能都会发生变化[38-40],故后续研究可以对同一问题训练多个模型,再进行模型性能评估,以选出最优模型。面对目前研究过程中护理人才的短板,更提示培养具有医工素养的复合型人才应该早期着手,可在本科、硕士教育阶段中,增加信息化教育相关课程,拓展视野,丰富知识存储,充分发挥信息技术在护理领域的应用。

3.3研究停留于表面,缺少临床验证与应用 大多数研究立足于回顾历史数据,使用信息技术进行内部验证,缺少外部验证来明确模型的准确性及敏感度。而且临床依然多应用传统量表进行风险评估,可见预测模型目前的临床应用范围不广。因此,提高模型的准确性,使用的便利性,才能加快研究成果临床化的进程,推进护理信息化发展。

综上所述,目前护理领域中应用机器学习算法构建风险预测模型已经取得了一定的研究进展,但是护理的信息化发展仍然面临巨大的挑战。规范且完整数据库的缺乏,数据挖掘技术使用的不成熟,研究领域和理论还未被全面拓展等问题依旧严峻。随着医工交叉的快速推进,护理研究者需要把握学科自身特点,寻求高效的多学科合作,利用信息化技术开展护理风险预测模型研究,不断创新研究方法,进一步拓展研究的广度与深度,提高护理质量与效率,促进护理学科发展。

猜你喜欢
机器护士预测
最美护士
无可预测
最美护士
最美护士
机器狗
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
机器狗
未来机器城