围术期压力性损伤预测变量筛选及回归方法选择实例分析

2023-02-15 07:43黄明亮曾德兰张秋娟黄世树
循证护理 2023年3期
关键词:围术变量预测

黄明亮,曾德兰,张秋娟,黄世树,梁 辉

广西中医药大学第一附属医院,广西 530022

压力性损伤预防的首要原则是使用合适的风险评估工具(risk assessment scales, RAS)对病人进行精准评估,而早期识别围术期压力性损伤的高危人群很大程度上取决于已确定的危险因素。目前研究表明,围术期压力性损伤的危险因素较多,在构建预测模型筛选危险因素时,很多文献通常先进行单因素分析,单因素分析有统计学意义的变量纳入多因素Logistic回归分析,无意义的变量不纳入分析[1-9]。然而,自变量间可能存在多重共线性等问题,因此只将单因素分析有统计学意义的因素作为自变量纳入多因素Logistic回归分析,很可能会将重要的危险因素漏掉[10],造成模型对疾病的预测能力降低。在这种情形下,传统的建模方法不再适用,因而需要寻找一些新的替代方法[11-12]。本研究基于围术期压力性损伤的临床资料,实际分析比较逐步回归和LASSO回归在该背景下的表现,结合赤池信息准则(Akaike′s information criterion,AIC)[13]、贝叶斯信息准则(Bayesian information criterion,BIC)[14-15]、决定系数(R2)、受试者工作特征曲线(ROC)下面积(AUC)等策略,为临床护理人员构建压力性损伤预测模型,筛选最佳变量组合提供参考依据。

1 资料与方法

1.1 观察对象

回顾性收集2020年10月—2021年5月在我院住院行择期手术的病人441例,按照围术期是否发生压力性损伤分为发生组(113例)和未发生组(328例)。

1.2 纳入与排除标准

1.2.1 纳入标准

年龄≥18岁;择期手术病人,术前诊断及病例信息完整;无精神障碍,沟通顺畅,自愿参加并签署知情同意书。

1.2.2 排除标准

术前患有急慢性皮肤疾病或皮肤黏膜已存在压力性损伤;严重关节功能障碍;术中出现病情恶化致抢救无效或术后送至重症监护室(ICU);术后拒访或失访;资料分析时发现某项数据缺失。

1.3 评估方法与时间

根据美国压疮专家咨询组(NPUAP)2016年最新推荐的分期标准[16]评估病人是否发生压力性损伤。由造口专家及科内成员按评估标准进行评估,皮肤出现压力性损伤的病人纳入发生组,未出现皮肤压力性损伤的病人则纳入未发生组,评估时间为手术结束时、术后2 h、术后24 h及术后3~6 d。

1.4 资料收集

参阅国内外文献报道围术期压力性损伤的影响因素并结合我院实际情况,共纳入 11 个预测变量为研究变量,变量信息及赋值情况如下:性别(男=1,女=2)、年龄、体质指数、血红蛋白、手术时间(<3 h=1,≥3 h=2)、术中出血量(<300 mL=1,≥300 mL=2)、手术体位(仰卧=1,侧卧=2,俯卧=3)、麻醉方式(非全身麻醉=1,全身麻醉=2)、术中体温(正常=1,异常=2)、高血压(无=1,有=2)、糖尿病(无=1,有=2)。

1.5 统计学方法

2 结果

2.1 研究对象一般资料(见表1)

表1 两组病人一般资料比较

2.2 逐步回归筛选预测变量

2.2.1 前向逐步回归

前向逐步回归筛选出的变量有性别、血红蛋白、手术时间、术中出血量、手术体位,见表2。

表2 前向逐步回归分析结果

2.2.2 后向逐步回归及双向逐步回归

后向逐步回归及双向逐步回归筛选出的变量一致,见表3。

表3 后向及双向逐步回归分析结果

2.3 LASSO回归筛选危险因素

LASSO回归从11个危险因素中进行筛选。随着惩罚系数的变化,模型初始纳入的影响因素的系数被压缩,最后部分影响因素系数被压缩为0,从而避免模型过度拟合,达到最佳影响因素选择的效果,见图1。为寻找最佳惩罚项系数,使模型性能优良且影响因素最少,选择交叉验证误差为min+1个标准误(lambda.1SE)时的值为模型最优值[17],最终筛选出6个变量,分别为性别、血红蛋白、手术时间、术中出血量、糖尿病、高血压。见图2。

图1 基于 LASSO 回归的特征性变量筛选(11 个特征影响因素模型惩罚过程)

图2 基于 LASSO 回归的特征性变量筛选(回归模型中最佳惩罚系数变化过程)

2.4 模型性能指标

在R中用lm函数拟合模型,将前向逐步回归筛选的变量拟合模型命名为模型1,后向及双向逐步回归拟合的模型命名为模型2,LASSO回归拟合的模型命名为模型3。通过performance包、pROC包计算3个模型的性能指标AIC、BIC、R2、AUC等值(见表4),并绘制模型指数比较图(见图3)。根据AIC信息准则及BIC信息准则,当从一组可供选择的模型中选取最佳模型时,通常选择AIC或BIC值最小的模型作为最优模型。从表4可以看出,模型2的AIC、BIC值均小于模型1和模型3,且R2值最大,由此可见,本次后向及双向逐步回归拟合的模型2较优。

表4 3个模型的性能指标值

图3 3个模型的性能指标比较图

3 讨论

将统计学方法应用于生物医学领域来进行疾病预测性能的比较,从而建立起准确可靠的模型是一个非常值得研究的方向[18]。本研究以围术期压力性损伤的数据为例,进行单因素分析时发现性别差异无统计学意义,而采用逐步回归与LASSO回归对所有预测变量进行筛选时,性别均纳入了回归模型。并且,将性别纳入模型后,模型的预测能力都表现较优。因此,传统单因素分析舍弃无统计意义的自变量,极可能造成遗漏重要危险因素的现象。本研究通过逐步回归与LASSO回归对围术期压力性损伤的11个预测变量进行筛选,拟合了3个Logistic回归模型,然而受到样本量及所选预测变量个数的局限,3个模型的AIC、BIC、R2等各项指标均未达到预期结果,但本次研究结果仍提示,在筛选变量时应尽量尝试多种策略,并结合临床和流行病学的意义以及生物学机制等专业知识[19-20],对回归方法的计算结果进行综合分析,选择较为准确、可靠的结果,以此为临床护理人员构建预测模型,筛选最佳变量组合提供更优的参考依据。

猜你喜欢
围术变量预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
抓住不变量解题
围术期舒适干预应用于口腔颌外科的效果
也谈分离变量
内镜下食管静脉曲张套扎术的围术期处理
围术期血液管理新进展
不必预测未来,只需把握现在
β受体阻滞剂在围术期高血压中的应用