杨 行,马莎莎,许红梅*,陈晓琳,刘 莉,于俪超
(1.滨州医学院 山东滨州256600;2.滨州医学院附属医院)
静脉血栓栓塞症(VTE)是继心肌梗死和中风之后的第3种常见的心血管疾病,包括深静脉血栓形成(DVT)和肺栓塞(PE)。有研究发现,ICU是VTE发生率较高的科室之一,其发生率为13%~31%[1-2]。并且ICU患者VTE病死率较高,Pineton等[3]对152例ICU发生VTE患者进行研究,发现VTE患者病死率约为23%。VTE不仅危害患者健康,还会加重患者经济负担。梁敏杰等[4]研究表明,采用风险防范理念指导下的预警护理干预方法可以有效降低患者VTE的发生。因此,早期评估ICU患者VTE风险十分重要。风险预测模型[5]是运用统计学方法将疾病的风险因素和发生概率确定为一种定量关系,并对其进行风险分层,预测个体疾病发生的可能性。运用预测模型对个体进行风险评估,可以有针对性地对个体采取预防措施,保障患者安全,提高患者满意度,减少医疗资源消耗[6]。目前国内外已有部分研究开展了ICU患者VTE风险预测模型的构建,但模型的预测性能和适用性仍待进一步验证。因此,本研究对ICU患者VTE风险预测模型的相关文献进行系统评价,旨在为模型的应用、优化及临床医护人员选择恰当模型对患者进行个体化精准防控提供参考依据。现报告如下。
1.1 文献检索策略 计算机检索PubMed、Embase、Web of Science、The Cochrane Library、CINAHL、中国知网、万方数据库、维普资讯数据库中有关ICU患者静脉血栓栓塞症风险预测模型的研究,检索时间从建库开始截止至2021年9月1日。英文检索词为“Intensive Care Unit/ICU”“venous thromboembolism/deep vein thrombosis/pulmonary embolism/VTE/DVT/PE”“risk assessment/risk score/risk model/risk prediction/scoring system/nomogram/prediction model”。中文检索词为“重症监护室/重症监护病房/加强治疗病房/危重/重症”“静脉血栓栓塞症/深静脉血栓/肺栓塞”“风险评估/风险预测/风险评分/列线图/预测模型”。以主题词和自由词相结合的方式检索,通过“滚雪球”的方式,为避免漏检,对纳入文献的相关参考文献进行检索。
1.2 文献纳入与排除标准 纳入标准:①研究对象为年龄≥18周岁的ICU住院患者;②研究内容为ICU患者VTE风险预测模型的构建研究;③研究类型包括队列研究、病例对照研究等。排除标准:①重复、无法获取全文、信息不全;②仅为危险因素的研究,未构建模型;③基于系统评价/Meta分析构建模型;④模型的预测因素≤2个。
1.3 文献筛选与数据提取 由2名课题组成员根据文献的纳入、排除标准完成文献筛选,意见出现分歧时,协商或咨询第3名成员直至意见达到一致。数据提取基于预测模型研究系统评价的关键评估和数据提取清单[7],采用Excel 2016软件制作表格进行提取。主要从以下方面进行提取:第一作者、发表年份、国家、研究设计类型、研究对象和场所、预测结果、建模方法、验模方法、预测因子、模型预测性能等。
1.4 偏倚风险和模型适用性质量评估 由2名经过系统评价课程培训并合格的课题组成员使用预测模型研究的偏倚风险评估工具[8]确定每个风险预测模型的偏倚风险。该工具主要从以下4个领域对偏倚风险进行评估:研究对象、预测因子、结果、分析,每个领域中都包含2~9个相应的问题,共计20个问题;每个领域中问题的回答为“是”“可能是”“可能否”“否”或“无信息”。评估人员根据自己的判断确定该领域是否应被评为高、低或不清楚。当所有问题的回答都是“是”表示该领域的偏倚风险低;当任意问题的回答为“否”或“可能否”表示该领域的偏倚风险高;当信息不足时,表示该领域的偏倚风险为不清楚。当所有领域的偏倚风险被判定为低时,则研究的总体偏倚风险为低;当一个或多个领域的偏倚风险被判定为高时,则研究的总体偏倚风险为高;如果一个或多个领域的偏倚风险被判定为不清楚,而其他所有领域偏倚风险被判定为低时,则研究的总体偏倚风险为不清楚。对模型的适用性进行评估。该工具主要从以下3个领域对适用性进行评估:研究对象、预测因子、结果。适用性的评级与偏倚风险评估相似(高、低、不清楚),但每个领域没有相关的问题。
2.1 文献筛选流程及结果 计算机检索数据库,初步检索出相关文献3229篇,排除重复文献,阅读题目及摘要部分进行筛选,最终纳入11篇文献[9-19]。文献筛选流程见图1。
图1 文献筛选流程
2.2 纳入文献的基本特征 纳入11篇文献,均为10年内发表文献,其中3年内发表的文献6篇;中国开展的研究4篇,美国开展的研究4篇,泰国、瑞士、日本各1篇;各模型纳入的人群主要是ICU成年患者;大多数研究的数据来源于注册或回顾性队列,回顾性研究9篇,前瞻性研究2篇。纳入文献的基本特征见表1。
表1 纳入文献的基本特征
2.3 模型的建立情况 各模型的候选变量数为15~52个。对连续变量处理方面,Ho等[16]将连续变量转换成了二分类变量,其余研究中连续变量均保持连续性。在样本量方面,各建模组的样本总量为138~37050例,结果事件数为26~8239例。在缺失数据方面,有4项研究[14,17,19-20]报告了缺失数据处理方法:删除、完整案例分析。在建模方法方面,除了Luo等[13]采用机器学习的方法,其余研究均采用Logistic回归方法。在预测变量的选择上,Luo等[13]采用最小绝对收缩和选择算子(Lasso)方法,Viarasilpa等[9]和朱晓光等[11]采用逐步选择法。ICU患者VTE风险预测模型的建立情况见表2。
表2 ICU患者VTE风险预测模型的建立情况
2.4 模型性能及预测因子 在模型验证方面,大多数研究的内部验证是通过将数据集分割成构建、验证2个数据集或对建模数据集进行内部交叉验证。共有8项研究进行了内部验证,纳入模型中的预测因子包括5~9个,其中出现次数最多的预测因子是VTE史(n=6),其次是机械通气、BMI>30、制动、年龄等。模型的最终呈现形式也不尽相同,有6个模型以风险评分的方式呈现。对于模型性能的检验,所有模型均采用AUC值检验模型的区分度,AUC值为0.630~0.935,除了Chen等[12]和Hegsted等[15]的研究,其余模型AUC值均>0.7,预测性能较好,对于模型校准度的检验,仅有4个模型[9-11,16]采用了Hosmer-Lemeshow 拟合优度检验。ICU患者VTE风险预测模型的预测因子及性能见表3。
表3 ICU患者VTE风险预测模型的预测因子及性能
2.5 偏倚风险和适用性评价
2.5.1 与研究对象有关的偏倚 经过评估,11项研究均严格按照纳入、排除标准选择研究对象,与研究对象有关的偏倚风险均较低。
2.5.2 与预测因子有关的偏倚 在预测因子领域,2项研究[10,14]的偏倚风险低,1项研究[16]的偏倚风险高。在进行多中心研究时,不同中心的数据由于评估方法不同可能会产生偏倚。Ho等[16]回顾性研究数据来自于2个中心临床数据库,可能没有采取统一的方式评估预测因子,因此对于问题“所有研究对象的预测因子是否以类似的方式定义和评估”的回答是“可能否”,因此,此研究的偏倚风险为高。此外,未对预测因子评估者施盲也会产生偏倚。陈颖等[10]、Blondon等[14]为前瞻性研究,对“预测因子的评估是否在不了解结果数据的情况下进行”的回答为“是”,其余研究均为回顾性研究,无法得知,因此回答为“无信息”。
2.5.3 与结果有关的偏倚 在结果领域,Luo等[13]、Blondon等[14]研究明确指出对结果评定者施盲,对“是否是在不知道预测因子信息的情况下确定结果”,二者的回答为“是”,因此这2个研究[13-14]的偏倚风险低,其余研究的回答为“无信息”,因此偏倚风险为“不清楚”。
2.5.4 与分析有关的偏倚 在分析领域方面,11项研究的偏倚风险均较高。Riley等[20]研究显示,如果应变量事件数(EPV)<10可能造成模型过度拟合,EPV>20会使研究更有说服力,除4项研究[10-13]总样本量未达到要求外,其余研究样本量均达到要求。Collins等[21]研究显示,用于验证预测模型的数据集中,结果事件数至少要100个事件,否则会发生偏倚。纳入的研究中有5项研究[10-11,14,16-17]结果事件数<100个,因此,对“结果事件数量是否合适”的回答为“否”,其余研究结果事件数均达到要求,回答为“是”。模型中若包含二分类变量的预测能力会降低[22],其中Ho等[16]研究将连续变量转换成二分类变量。在缺失数据方面,除了4项研究[14,17,19-20]采用删除数据及完整案例分析之外,其余研究均未明确说明缺失数据的有关信息,因此“数据缺失的参与者是否处理得当?”的回答为“无信息”。在建模方法方面,除了Luo等[13]研究采用机器方法建模,其余研究均采用Logistic回归方法建模,避免了单因素分析的预测因子选择。在模型性能评估方面,仅有4项研究[9-11,16]同时报告了校准度和区分度,在模型验证方面,仅有8项研究进行了内部验证,其中3项研究[10,12,17]进行了内部、外部验证。11项研究偏倚风险的评估情况见表4、5。
表4 研究对象、预测因子、结果领域偏倚风险评价结果
表5 分析领域和总体偏倚风险评价结果
2.5.5 适用性评价 在适用性方面,11项研究均显示纳入的模型在建模组、验证组的适用性较好。
3.1 现有大多数ICU患者VTE风险预测模型的偏倚风险较高 本研究系统地检索了国内外ICU患者VTE风险预测模型的相关文献,最终纳入了11项研究,包括15个预测模型,模型AUC值为0.630~0.931,其中13个模型AUC值>0.7,说明模型的预测性能较好。纳入研究均明确了研究对象的纳入、排除标准,有效地减少了选择性偏倚,提高了模型的适用性,但部分模型缺少内部、外部验证,导致模型的偏倚风险增加。并且模型的总样本数量不足、结果事件样本量过少、未报告盲法、未恰当处理缺失数据、缺少模型的性能评估等也增加了模型的偏倚风险。
3.2 VTE史、机械通气、BMI>30、制动是ICU患者VTE的高危因素 尽管ICU患者VTE的危险因素较多,但本研究发现各模型的预测因子存在一定共性,纳入模型中包含最多的预测因子是VTE史、机械通气、BMI>30、制动等,应注意对这些变量进行评估。在临床护理工作中,对于有VTE病史、卧床制动、进行机械通气的肥胖患者,应作为重点人群加强关注,及时评估此类患者的VTE发生风险,必要时采取措施预防VTE的发生。
3.3 ICU患者VTE风险预测模型的未来发展建议 目前,预测模型研究是护理领域的热点话题。本研究对ICU患者VTE风险预测模型进行系统评价,纳入文献均为10年内发表,其中3年内发表的文献6篇,说明ICU患者VTE风险预测模型的研究正处于发展阶段。从本系统评价得到以下启示:①Luo等[13]针对数据库中的数据运用了4种机器学习方法建立模型,模型的区分度均>0.7,其中最后一个模型的效果最佳,提示在建立模型方法的选择上除了传统Logistic回归分析方法外,还可以运用人工智能的方法,如支持向量机(SVM)、随机森林(RF)、贝叶斯(Bayes)、决策树(DTC)、梯度提升树(GBDT)、神经网络等建立多个模型,并从中选择效果最好的模型。对模型呈现方式可以采用概率计算方程、简化评分系统表格、列线图等。②由于PROBAST[8]是2019年发布,部分研究在其发布前开展,在建模部分方法细节容易有遗漏,这可能是导致偏倚风险较高的原因之一。因此,未来建模研究可以参考PROBAST报告规范步骤,以减少偏倚。③由于纳入文献的模型大多数是基于外国人群建立,对我国人群的预测能力尚未可知,而基于中国人群建立的模型尚未进行大样本的外部验证,对其的外推能力有一定的阻碍。因此,未来研究可以重点在本国采用大样本、多中心的研究,对模型进行外部验证,探索最适合中国人群的预测模型,以便于模型的应用、优化。
本研究共纳入11篇关于ICU患者VTE风险预测模型的研究,并对模型的特征进行了系统概括。研究结果显示,ICU患者VTE的高危因素主要有VTE史、机械通气、BMI>30、制动,临床应对这些因素重点关注,因此在应用模型进行评估时,可以结合人群特点及时优化更新模型。大多数模型采用Logistic回归方法构建,模型的适应性较好,但整体偏倚风险高,部分模型缺乏内部、外部验证,模型的稳定性以及推广性有一定的限制。本研究也有不足之处,首先本研究主观性较大,纳入的文献可能有遗漏,对模型的系统评价也存在偏倚风险,并且由于不同研究的研究设计、纳入标准、建模方式、评价指标等存在一定的差异,无法进行Meta分析,因此仅做了定性总结,无法确定哪种模型更适合我国ICU患者。其次,部分研究缺少AUC值与校准度等评价模型的指标,并且缺少内部、外部验证等方面也使得模型的偏倚风险较高。未来研究中,要注重对已有模型进行外部验证,在构建新模型时,要注意按照PROBAST步骤降低偏倚的发生,并且结合临床实际情况,采取决策树、随机森林及支持向量机等机器学习的方法对模型进行合理的开发、优化以及应用,并构建风险预测模型信息共享平台。