机器学习模型在肝移植手术用血分析预测中的应用

2024-03-29 03:19:02宗朋张文丽李萍邵长峰王海燕
中国输血杂志 2024年3期
关键词:肝移植组间机器

宗朋 张文丽 李萍 邵长峰 王海燕

(1.青岛大学附属医院 输血科,山东 青岛 266000; 2.青岛市市立医院 检验科)

肝移植手术被认为是治疗终末期肝病的唯一有效的治疗手段[1-2]。 因肝脏实质受损和肝功能失代偿,手术操作复杂等因素影响,肝移植手术经常出现大量输血(massive transfusion,MT)的情况[3-4]。我们运用医渡云大数据平台和输血信息管理系统,收集肝移植手术患者的用血情况和临床资料,应用Python 语言构建机器学习模型,选择出最优数据模型,对临床医师术前科学合理用血评估和术前备血有一定的参考意义,现报告如下。

1 对象与方法

1.1 研究对象

选取2017 年1 月—2020 年11 月在本院接受肝移植手术的患者356 例,其中男性287 例(80.6%),女性69 例(19.4%),平均年龄52.49 岁,>45 岁 的291 例(81.7%), ≤45 岁 的65 例(18.3%),手术方式:改良背驮式322 例(90.4%),经 典 式34 (9.6%) 例; 诊 断: 肝 硬 化102 例(28.7%),肝恶性肿瘤183 例(51.4%),肝衰竭29例(8.1%),其他42 例(11.8%)。 按术中是否接受MT,将肝移植患者分为MT 组和非MT 组。

1.2 方法

1.2.1 血液制剂来源

所有血液均由青岛市中心血站提供。 血液成分输注计量单位:200 mL 全血分离获得1 U 去白细胞悬浮红细胞。 所有血液制剂质量均符合我国《全血和成分血质量要求》GB18469-2012 的规定。

1.2.2 数据收集和定义

基于文献检索、临床经验和专家讨论,通过输血信息管理系统统计肝移植患者手术红细胞输注量,通过医渡云大数据平台搜索患者的性别、年龄、诊断、手术方式、手术时长(Time),术前检验结果:血红蛋白(Hb)、红细胞压积(Hct)、血小板计数(Plt)、凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)、纤维蛋白原(Fib)、总胆红素(TBIL)、白蛋白(ALB)、肌酐(Crea)、总蛋白(TP)。 根据本院大量用血审批管理制度,将术中输注红细胞量≥8 U 定义为MT。

1.2.3 建模策略

递归特征消除(recursive feature elimination,RFE)是1 种用于特征选择的机器学习技术。 通过添加或删除特定的特征变量来获得能够最大化模型性能的最优变量组合,并应用于筛选关键变量。基于训练集筛选出7 个关键变量,它们都是连续变量。 此外,用关键变量绘制箱线图,以分析2 组之间变量的分布差异,并绘制热图来评估变量之间的相关性。 数据集被随机分为训练集(70%,用于模型开发和优化)和测试集(30%,用于模型测试)。多重插补用于处理缺失值。 RFE 选择的重要特征构成1 个特征集。 建立了7 个机器模型:通过决策树(decision tree classifier,DTC)、随机森林(random forest classifier, RFC)、支持向量机(support vector machine, SVM)、朴素贝叶斯(gaussian naive bayes,GNB)、K 近邻算法(K neighbors classifier, KNC)、线性回归(logistic regression,LR)、XGBoost(XGB classifier,XGBC)。 通常对分类问题的机器学习模型的评价指标有准确度(accuracy):预测正确的样本数与总样本数之比,适用于平衡类别分布的情况;精确度(precision):真正例(TP)占所有预测为正例的样本数之比,衡量模型预测为正的样本中的真实正例比例;召回率(recall):真正例(TP)占所有真实正例的样本数之比,衡量模型对于正例的识别能力;F1-Score:精确度和召回率的调和平均,用于综合考虑模型的精确度和召回率;ROC 曲线和AUC:ROC 曲线是真正例率(TPR)和假正例率(FPR)之间的关系曲线,AUC 是ROC 曲线下的面积,用于衡量模型预测能力。

1.3 统计学分析

应用Python 语言,通过Pycharm 软件分析数据,计量资料用Shapiro-Wilk 正态性检验方法进行正态性验证,符合正态分布的资料以“±s”表示,不符合正态分布的资料以“中位数(第1 四分位数,第3 四分位数)”表示,采用Mann-Whitney U 检验进行显著性验证;计数资料以%表示,采用卡方检验,P<0.01 为差异有统计学意义。 通过绘制热图分析变量之间的相关性(r)。 正值表示正相关,负值表示负相关,绝对值越大,相关性越强。 通常,变量的相关强度由以下绝对值的值范围来判断:0.0 ~0.2(极弱相关或无相关),0.2 ~0.4(弱相关),0.4 ~0.6(中等相关),0.6 ~0.8(强相关),0.8 ~1.0(非常强相关性)。

2 结果

2.1 肝移植患者临床特征

MT 与非MT2 组间年龄、性别、手术方式无差异(P>0.05),2 组间临床诊断有差异(χ2=19.07,P<0.01),见表1。

表1 肝移植患者临床特征Table 1 Clinical characteristics of liver transplant patients

2.2 肝移植患者术前血液检验结果

见表2。

表2 肝移植患者术前血液检验结果Table 2 Preoperative blood test results in liver transplant patients

2.3 关键变量数据特征分析

通过RFE 选择了训练集上的7 个关键特征:Time、Hb、Hct、Plt、PT、Fib 和ALB。 绘制箱线图(图1~7)可以显示训练集中各组之间变量的分布,从中可以分析出低Hb、Hct、Plt、Fib 和高PT、长Time,均使得患者术中大量输血概率增加。 再绘制热图(图8)分析变量之间的相关性。 从热图中可以直观地得出Hb 和Hct 相关系数(r)为0.76,为强正相关,Plt 和Fib 相关系数(r)为0.54,为中等正相关。

图1 MT 与非MT 组间Time 对比Figure 1 Comparison of the Time between the MT and NMT

图2 MT 与非MT 组间Hb 对比Figure 2 Comparison of the Hb between the MT and NMT

图3 MT 与非MT 组间Hct 对比Figure 3 Comparison of the Hct between the MT and NMT

图4 MT 与非MT 组间Plt 对比Figure 4 Comparison of the Plt between the MT and NMT

图5 MT 与NMT 组间PT 对比Figure 5 Comparison of the PT between the MT and NMT

图6 MT 与非MT 组间Fib 对比Figure 6 Comparison of the Fib between the MT and NMT

图7 MT 与非MT 组间ALB 对比Figure 7 Comparison of the ALB between the MT and NMT

图8 变量之间的相关性分析Figure 8 Correlation analysis between variables

2.4 模型评价

对构建的7 个机器学习模型评价(表3),7 个模型中LR 表现最佳,RFC 表现次佳(图9)。

图9 各模型的ROC 曲线Figure 9 ROC curves of each model

表3 模型评价表Table 3 Model evaluation table

3 讨论

近年来,随着肝移植手术技术的成熟和麻醉技术的提高,肝移植手术的用血量在不断减少,但是肝移植手术作为1 种的复杂的手术,仍与大量失血和MT 存在一定的相关性[5-7]。 研究表明MT 与术后死亡风险增加有关,并被确定为患者生存率的重要影响因素[8]。 在肝移植围手术期内接受MT 的患者,比未接受MT 的患者长期预后差,30 d 的并发症发生率和死亡率更高[9]。 我们通过RFE 选择了训练集上的Time,术前Hb、Hct、Plt、PT、Fib 和ALB 这7 个关键特征,通过结果分析出Hb、Hct、Plt、Fib、PT、Time 在2 组比较有差异(P<0.01),术前低Hb、Hct、Plt、Fib 和高PT,长Time 均可使患者术中MT 概率增加。

患者血液管理概念(personalized blood management,PBM)是应用循证输血指南优化患者结果的过程,这一概念推进科学合理的输血管理[10]。 机器学习是1 种人工智能(artificial intelligence,AI)领域的技术,旨在使计算机系统能够从数据中学习和改进,而无需明确的编程。 它涵盖了一系列算法和技术,旨在让计算机能够自动识别模式、进行预测和决策,以实现任务的自动化和优化。 近年来,随着交叉学科的发展,机器学习作为人工智能的研究热点,已广泛应用于医学领域[11-12]。 机器学习在医学研究中的应用有助于提升疾病诊断、治疗和预防的准确性和效率,促进医疗领域的创新和进步。为了提升临床血液管理,我们使用机器学习算法建立了7 个模型来预测肝移植患者术中会接受MT风险的研究,并通过科学的评价方法,成功构建了基于LR 和RFC 这样性能良好的预测模型。 作为传统的LR,训练起来很高效,通常以LR 作为基准,再尝试使用更复杂的算法,其在预测MT 风险中仍具有优秀的预测价值(AUROC:0.90,F1 得分:0.82),但受训练数据偏少的影响,模型容易出现过拟合(overfitting),因此,本研究将继续收集更多数据进行训练,防止过拟合。 RFC 则同样具有优秀的价值(AUROC:0.87,F1 得分:0.83),这是对传统模型算法的补充和挑战,RFC 是通过集成学习的思想将多棵树集成的1 种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支——集成学习(ensemble learning)方法,每棵树都选择部分样本及部分特征,一定程度避免过拟合,也使得模型具有很好的抗噪能力,性能稳定,随着训练数据的不断增加和算法的优化,该模型可能会优于传统LR[13]。 因接受肝移植手术患者偏少,数据收集困难,未能建立验证集,以及缺乏多中心验证是本文研究的局限性,因此,本研究将在今后开展前瞻性的多中心研究来验证模型的诊断效能。 同时随着机器学习的不断进步,会有更多更科学的预测模型应用于输血医学,可以更加准确的预测MT 的风险。 另外我们发现术前Hb 和Hct 是影响MT 的重要变量,和其他相关研究报道结果基本一致。 不同年龄、性别、手术方式的患者MT 情况无差异(P>0.05),这也与国内外文献报道的统计结果基本一致[14]。

在当前血液供应紧平衡的环境下,尤其是对于有MT 风险的肝移植手术,术前科学合理评估用血、精准备血极为重要[15-16]。 通过回顾性研究,应用Python 机器语言建立机器学习预测模型,对肝移植手术MT 风险的评估和肝移植手术的科学合理备血用血具有重要意义。 近年来人工智能技术获得了蓬勃发展,并渗入医学领域之中,在急诊预检、病情评估、医学诊断、治疗方案决策及外科手术、麻醉、护理、康复治疗、药理研究和医药开发等临床工作中发挥着重要的辅助作用,为医疗工作带来巨大便利。 虽然工智能技术为临床带来了诸多便利,但仍面临重大挑战,人工智能应用需要大量的数据,需要超高的算力的和精进的算法以及计算机硬件水平的提升,同样也面临着数据规范性、安全性、隐私性的问题,需要在今后的应用中不断改进。

利益冲突说明/Conflict of Interests

所有作者均声明不存在利益冲突。

伦理批准及知情同意/Ethics Approval and Patient Consent

本研究已获青岛大学附属医院医学伦理委员会审批通过,伦理号为QYFY WZLL 28511;本研究纳入的所有患者其本人或家属均已签署知情同意书。

作者贡献/Authors' Contribution

宗朋:文章撰写和修改、数据统计和分析;王海燕:研究的整体设计和指导;张文丽:从研究出发对实际工作进行调查和咨询,收集资料和数据;李萍:负责资料和数据的核对;邵长峰:文献查找。

猜你喜欢
肝移植组间机器
机器狗
环球时报(2022-07-13)2022-07-13 17:18:39
机器狗
环球时报(2022-03-14)2022-03-14 18:19:44
数据组间平均数、方差关系的探究
未来机器城
电影(2018年8期)2018-09-21 08:00:06
更 正
Geological characteristics, metallogenic regularities and the exploration of graphite deposits in China
China Geology(2018年3期)2018-01-13 03:07:16
无敌机器蛛
肝移植术后胆道并发症的研究现状
肝移植术后患者的健康之路
肝博士(2015年2期)2015-02-27 10:49:45
Numerical Solution of Fractional Fredholm-Volterra Integro-Differential Equations by Means of Generalized Hat Functions Method