自动化机器学习在剖宫产术后尿潴留预测模型中的应用

2023-03-29 02:32朱锦舟崔欢欢
医学信息 2023年5期
关键词:尿潴留机器剖宫产

王 芳,胡 星,朱锦舟,崔欢欢

(1.苏州工业园区星湖医院手术室,江苏 苏州 215000;2.苏州工业园区星湖医院麻醉科,江苏 苏州 215000;3.苏州大学苏州医学院,江苏 苏州 215000)

尿潴留(urinary retention)是指膀胱内充满尿液而不能正常排出的一种临床症状。在产科,尿潴留常出现在剖宫产术后,往往由于产妇害怕用力排尿引起切口疼痛,或麻醉引起的膀胱肌肉痉挛,或手术本身引起的泌尿系统充血水肿等多种因素造成,显著影响产妇术后护理质量[1]。产后尿潴留会影响产后子宫的收缩,造成出血增多、切口疼痛、尿路感染,显著增加感染概率,不利于切口愈合,严重影响产后恢复[2]。目前,各类机器学习算法在临床科研中广泛运用[3]。各种新算法快速迭代,包括深度学习、强化学习,明显提升了人工智能模型的准确性。但同时也让临床医生面对机器学习技术进行科研时面临较高的门槛。从2017 年自动化机器学习(AutoML)被各大公司推出,并不断更新,这一技术大大简化了数据清洗及模型训练中的繁琐环节[4]。本研究收集我院手术室行剖宫产手术的产妇资料,利用H2O 平台AutoML 框架建立预测术后尿潴留的机器学习模型并进行验证,现报道如下。

1 资料与方法

1.1 一般资料 收集2018 年1 月-2022 年1 月于苏州工业园区星湖医院220 例行剖宫产手术产妇的临床资料,根据术后发生尿潴留与否分为尿潴留组38例与无尿潴留组182 例,本研究获星湖医院伦理委员会批准,所有研究对象均签署知情同意书。纳入标准:相关资料完整。排除标准:①妊娠小于28 周;②精神、心理、认知功能异常者;③双胎或多胎产妇;④术中、术后出现严重并发症;⑤合并严重心、脑、内分泌或免疫疾病者;⑥术前有泌尿系统疾病史者。

1.2 方法 收集产妇入院时一般资料,包括基本情况、身高体重、相关病史、生育史、孕前资料,计算体质量指数(BMI),记录手术室麻醉及操作相关变量资料。术后行床边评估,收集产妇术后排尿情况,并分析原因。尿潴留的诊断标准:返回病房导尿管拔除后6 h 内,产妇无法自行排尿,或排尿不完全(即残余尿量超过100 ml)[5]。焦虑采用状态焦虑量表(STAI-S)评估[6],疼痛采用FPS-R 评分(Wong-Baker面部表情疼痛评估法修订版)[7]评估。

1.3 统计学方法 计量资料以(±s)表示,行t检验;计数资料采用n表示,行χ2检验。利用H2O 平台(版本3.34.0.6)AutoML 框架,建立一系列针对尿潴留事件发生与否的二分类结局的机器学习预测模型。计算包括敏感度、特异度及ROC 曲线下面积(AUC)来评价模型区分能力。为了机器学习模型的可解释性,进行SHAP 分析(Shapley Additive exPlanations)以及局部可解析性算法(Local Interpretable Model Agnostic Explanation,LIME)等可视化分析。以上统计学分析及绘图采用R(4.0.4 版)。双侧P<0.05 为差异有统计学意义。

2 结果

2.1 两组一般资料比较 两组疼痛评分、孕前BMI、产次、剖宫产史、胎儿体重、麻醉时间、手术时间、麻醉方式、尿管拔除时间及焦虑情况比较,差异有统计学意义(P<0.05),见表1。

表1 两组一般资料比较(±s,n)

表1 两组一般资料比较(±s,n)

表1 (续)

2.2 自动化机器学习模型的建立 根据二分类的分组,将预处理后数据载入H2O 平台AutoML 框架中,进行自动化特征选择、运算建模。建模最长时设置为60 s,最终得到最佳模型为梯度提升机模型(Gradient Boosting Machine,GBM)。作为一个树形模型,该模型包含树29 分支,平均深度10.4,Gini 值0.987,R2为0.653,LogLoss 为0.168。模型中重要变量排名见图1,分别为疼痛评分、焦虑、麻醉时间、产次(初产或经产)、麻醉方式(腰麻、硬膜外、腰硬联合麻醉、全麻)、拔尿管时间及孕前BMI。计算该最佳模型的ROC 下面积为0.909(95%CI:0.880~0.939)。该模型准确度0.947,特异度为0.962,敏感度0.856。

图1 变量重要性排序

2.3 变量在模型中作用的可视化实现 在最佳GBM模型中,重要变量的SHAP 特征图见图2。可以看到,疼痛评分、麻醉时间、焦虑及拔管时间4 个变量在结局二分类中的分布,其标准化数值与发病呈正相关趋势;而产次和孕前BMI 呈负相关。由于麻醉方式是无等级方向的多分类变量,与结局无明显方向呈现。LIME 可视化见图3,为随机抽取的4 个样本(无尿潴留组3 例,尿潴留组1 例)中重要变量对个体预测的作用。

图2 最佳模型中变量SHAP 可视化

图3 随机样本中变量重要性LIME 可视化

3 讨论

近年来,人工智能飞速发展,各种基于机器学习、深度学习的模型在科研、生活、医疗等场景得到运用,同时也对人工智能从业人员的专业知识提出较高要求[3]。近几年,谷歌、微软、H2O 等公司陆续推出自动化学习框架[4]。AutoML 可显著简化机器学习全部流程,包括数据清洗、特征提取、算法选择、优化、调参等过程。GBM 是机器学习算法Boosting 的一种树形算法,通过集合多个弱分类器来降低偏差[8]。H2O 平台AutoML(https://www.h2o.ai)是H2O 旗下推出的自动化学习框架[4]。该框架可自动化建立多个机器学习模型,如广义线性、XGBoost、GBM、stacking 以及深度学习等。

在我国,剖宫产率约为46%,居世界首位[9]。剖宫产术后尿潴留发生,目前认为有3 点:①剖宫产术中使用的麻醉、镇痛药物可明显抑制膀胱收缩,此外,手术本身的操作也会造成子宫、泌尿脏器的牵张和损伤[10,11];②孕期产妇的膀胱紧张度显著降低,而产后腹肌松弛,可引起膀胱逼尿肌无力[12,13];③心理精神因素也是剖宫产术后尿潴留的重要原因,行剖宫产术的产妇心理压力更大,常因害怕用力排尿造成切口疼痛,或排尿姿势环境的改变,导致产妇术后心理紧张,不敢排尿。剖宫产术后尿潴留常会导致泌尿系统感染,影响产后子宫的复旧,严重者可造成产后大出血[14]。国内外近年来对剖宫产围手术期的管理进行了较多研究,多位学者报道针对剖宫产术后尿潴留预测模型的研究,其目的是降低剖宫产术后尿潴留的发生率,改善产妇术后预后,避免相关并发症[15-17]。

Barba M 等[1]建立一项基于医院的回顾性队列研究,通过单中心7 年的随访,发现初产妇、低BMI、硬膜外镇痛、羊水浑浊等是产后尿潴留发生的危险因素。基于以上变量,该团队建立针对产后尿潴留的预测模型,ROC 下面积为0.84。袁芳等[18]纳入793 例产妇,通过多因素Logistic 回归分析,显示术后吗啡镇痛、低体重指数、血糖控制不达标是剖宫产术后尿潴留的高危因素。王诗翔等[17]纳入220 例行剖宫产产妇资料,筛选术后尿潴留的独立危险因素,构建预测模型。该研究报道:高疼痛评分、长拔管时间、妊娠期糖尿病以及焦虑是尿潴留发生的高危因素,同时其预测模型ROC 下面积值为0.717。

临床实践中,产妇入院拟行剖宫产的评估时间较短。如何充分利用产妇既往生育史及手术资料,在产后返回病房后,快速预测产妇术后发生尿潴留,这对产后管理和产妇恢复十分重要[19]。本研究是一项基于医院的病例-对照研究,收集拟行剖宫产产妇的手术麻醉数据、生育史等信息,预测产后尿潴留事件的发生。利用AutoML 平台建立了基于机器学习算法的最佳模型,该GBM 模型的预测区分能力优于之前报道[1,13]。在建模特征选择中,发现疼痛评分、焦虑、麻醉时间、产次、麻醉方式、拔尿管时间及孕前BMI 等是尿潴留发生的关键变量,这与国内外报道相似[1,12,13]。如上所述,疼痛、产次和焦虑往往和产妇术后惧怕疼痛以及心理精神压力所致,进而影响排尿。麻醉时间和方式是手术中麻醉的关键变量,镇静、止痛药物的使用会影响肌肉、神经的正常工作。拔尿管时间可能与尿管置入体内及拔除时对尿道造成的损伤有关。

综上所述,基于GBM 算法的剖宫产后尿潴留预测模型具有良好的区分能力,可作为潜在的产后并发症风险初筛工具。

猜你喜欢
尿潴留机器剖宫产
针灸治疗产后尿潴留的研究进展
机器狗
机器狗
一胎剖宫产,二胎必须剖吗
剖宫产之父
未来机器城
腹膜外剖宫产术应用于二次剖宫产的疗效观察
二次剖宫产与首次剖宫产的对比分析
间歇导尿配合温和灸治疗脊髓损伤后尿潴留30例
艾灸配合按摩治疗尿潴留50例