产后压力性尿失禁风险预测模型的系统评价

2024-03-14 02:41王丽云张明慧张新月沙凯辉

护理学报 2024年3期

王丽云，张明慧，张新月，沙凯辉

（1.滨州医学院护理学院，山东滨州 256600；2.山东第一医科大学附属省立医院神经内科，山东济南 250021）

国际尿控协会(International Continence Society,ICS)定义压力性尿失禁（Stress Urinary Incontinence,SUI）为当咳嗽、打喷嚏等腹腔内压急剧增高时出现不可控制的溢尿现象[1]，是女性尿失禁的常见类型[2]。产后SUI 发生在产后这一特殊时期，可能与妊娠和分娩造成盆底结构损伤以及雌激素分泌改变导致盆底肌力下降、韧带松弛、尿道收缩功能异常等因素有关[3]。据报道，产后SUI 的患病率为6.9%～47%[2，4]，患病率随年龄增长而升高[5]，约3/4 产后SUI 患者的尿失禁症状可持续到产后12 年[6]，持续性SUI 患者的生活质量较低[7]，社会成本较大[8]。由于羞耻感、对SUI 疾病认知不足以及经济方面等原因导致产后SUI 就诊率较低[9-10]。因此，识别高危人群对产后SUI进行风险预测至关重要。国内外学者通过建立预测模型来识别产后SUI 患者，本研究对国内外发表的产后SUI 风险预测模型进行总结、比较和分析，以期为国内外学者精准选择合适的产后SUI 预测模型以及对预测模型改进及优化提供借鉴。

1 资料和方法

1.1 文献检索策略计算机系统检索国内外数据库，包括PubMed、EBSCO、The Cochrane Library、Embase、Web of Science、中国知网、中国生物医学文献数据库、万方、和维普。中文检索词为产后、分娩后、尿失禁、漏尿、预测、模型、风险评分、列线图。英文检索词为：postpartum period、puerperium、delivery、after birth、post birth、urinary incontinence,stress、 SUI、urinary incontinence、leakage of urine、risk、risk factors、predict*、 model、nomogram、 score。检索策略采用主题词结合自由词，辅以手工检索和滚雪球方式追溯纳入文献的参考文献及引证文献。检索时限为建库至2023 年6 月。

1.2 文献纳入和排除标准纳入标准：（1）研究对象为产后的成年女性；（2）研究内容为产后SUI 的风险测模型的构建或验证；（3）研究设计类型为病例对照研究、横断面研究、随机对照试验、队列研究。文献排除标准：（1）重复发表和无法获取全文文献；（2）非中英文的文献；（3）以标题、摘要、来信、会议通知或干预草案等形式报道的文献；（4）仅为产后SUI 预测因素、危险因素研究，未构建预测模型。

1.3 文献筛选及数据提取方法 2 名研究者根据纳排标准独立筛选文献和提取数据。重复题录使用NoteExpress 软件删除，通过阅读题目、摘要将明显不相关文献排除，再通过全文阅读进行二次筛选，遇分歧时则与第3 人讨论决定取舍。确定纳入文献后，根据预测模型研究系统评价的关键评估和数据提取清单（Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies:the CHARMS checklist）[11]进行数据提取并交叉核对，提取内容包括：第一作者、国家、目标人群、候选变量、建模样本量、缺失数据及处理方法、建模方法、模型性能、验证方法、呈现方式和预测因子等。

1.4 文献质量评价 2 名研究者采用预测模型偏倚风险评估工具（Prediction Model Risk of Bias Assessment Tool，PROBAST）对纳入文献的模型独立评价并进行交叉核对[12]，若评价意见存在分歧，则与第3 名研究人员进行讨论达成一致意见。

1.4.1 偏倚风险评估 PROBAST 的偏倚风险评估涵盖研究对象、预测因子、结局和统计分析4 个领域，共计20 个问题。根据纳入文献对每个问题进行判断，结果用“是/可能是”、“否/可能否”或“未提供信息”回答。 “是/可能是”表示该领域偏倚风险低，“否/可能否”代表偏倚风险高。若未提及相关问题内容，判断为“未提供信息”。若文献中提供的信息不足以确定判断，归为“可能是”或“可能不是”。所有领域均为“低风险”，整体判断则为“低风险”，若有1 个领域为“高风险”，则适用性为“高风险”。若某领域为“不清楚”，而其他领域均为“低风险”，适用性为“不清楚”。

1.4.2 适用性评估适用性评估包括研究对象、预测因子和结局3 个领域，判断过程与偏倚风险相似。

2 结果

2.1 文献筛选流程及结果数据库检索获得2 797篇相关文献，去除重复文献后剩余2 228 篇文献，经逐层筛选，最终纳入17 篇文献。文献筛选流程见图1。

图1 文献筛选流程

2.2 预测模型的基本特征本研究共纳入17 项研究[13-29]，80%（14/17）的产后SUI 风险预测模型发表于近5 年，发表国家主要为中国（n=14）、巴西（n=2）和美国（n=1）。其中4 项[15，17，19，21]前瞻性队列研究，7 项[13-14，16，18，20，25-26]回顾性队列研究，3 项[23，28-29]病例对照研究，3 项[22，24，27]横断面研究。 13 项研究[13-15，17-18，20，22-27,29]模型类型为模型开发，4 项研究[16，19，21，28]为模型开发与验证。各研究目标人群不同，6 项研究[14-15，18，22，24，26]目标人群为初产妇，1 项研究[27]为经产妇，9 项研究[13，16，19-21，23，25，28-29]将初产妇和经产妇一同纳入建立预测模型，1 项研究[17]将初产妇和经产妇分别建立预测模型（表1）。

表1 纳入研究的基本特征

2.3 预测模型的样本量和建模方法 17 项研究报告了20 个产后SUI 风险预测模型，所有研究均报告了建模所需的样本量，样本量在115～2 441 之间。在建模方法方面，有14 项研究[13-21，23，26-29]使用Logistic回归构建模型，2 项研究[22，24]使用分类与回归树构建预测模型，1 项研究[25]分别使用Logistic 回归和决策树构建预测模型，并比较2 个模型的预测性能筛选出最优模型（表2）。

表2 产后压力性尿失禁风险预测模型构建基本情况

2.4 预测模型的预测因子及预测性能纳入研究的候选预测因子共39 个，各研究的候选预测因子10～38 个，1 项研究[15]未报告候选预测因子。纳入预测模型的预测因子数目4～13 个，纳入预测模型次数在前5 位的有分娩方式（n=14）、妊娠期尿失禁（n=11）、妊娠年龄（n=9）、新生儿体质量（n=8）、产次（n=7）。在模型的预测性能方面，有15 项研究[13-22，25-29]报告了区分度指标（AUC 和C 指数），AUC 或C 指数在0.68～0.97 之间，说明大部分预测模型的区分度良好。 9项研究[15-17，19-21，26-28]使用Hosmer-Lemeshow 拟合优度检验和/或校准度图评价预测模型的校准度，结果均显示校准度良好。此外，仅有5 项研究[13-14，25，27，29]报告灵敏度和特异度，灵敏度在48.7%～94.7%，特异度在76%～100.0%之间（表3）。

表3 产后压力性尿失禁风险预测模型

2.5 预测模型的验证及呈现方式在预测模型的验证方面，4 项研究[16，19，21，28]分别进行了内部验证和外部验证，5 项研究[15，17，20，25-26]仅进行了内部验证，其余8 项研究[13-14，18，22-24，27，29]未进行模型验证。在预测模型呈现方式方面，9 项研究[15-21，26，29]使用列线图呈现，4 项研究[13-14，27-28]采用风险计算公式呈现，1 项研究[15]除列线图呈现外还开发了网页风险计算器，2 项研究[22，24]使用分类树呈现，1 项研究[25]使用决策树，1 项研究[23]未报告呈现方式（表3）。

2.6 偏倚风险和适用性评价结果

2.6.1 研究对象领域 13 项研究[13-14，16，18，20，22-27，29]被认为偏倚风险较高，原因主要是回顾性队列研究、病例对照研究和横断面研究所收集的数据距离预测结局时间较为久远，可能导致信息准确性或完整性上的差异，较差数据质量以及无法测量的预测因素均可能造成偏倚[11]，其中1 项研究[29]未报告研究对象的测量时间，可能造成高偏倚风险。1 项研究[28]偏倚风险不清楚，原因是该研究纳入标准将符合产后SUI 诊断标准的纳入产后SUI 组，而不符合诊断标准者未报告处理方法。其余研究[15，17，21]均为低偏倚风险（表4）。

表4 偏倚风险及适用性评价结果

2.6.2 预测因子领域 17 项研究中，3 项研究[23，28-29]被评为高偏倚风险，因为病例对照研究是在结果已知情况下收集预测变量，对研究人员无法使用盲法，测量过程易受结局影响。 4 项研究[15，17-18，27]虽然为多中心研究，但明确指出按统一标准对预测变量评估，因此被评为低偏倚风险。 4 项[15，17，19，21]前瞻性队列研究预测因素在结局发生之前，默认使用盲法，被评为低偏倚风险（表4）。

2.6.3 结局领域 15 项研究[13-27]结局领域偏倚风险低。沈丹萍[29]的研究中未报告预测因子评估时间和结局的时间间隔，被评为偏倚风险不清楚。张伟娜[28]的研究中未报告结局的定义，故评为偏倚风险不清楚（表4）。

2.6.4 分析领域 17 项研究均为高偏倚风险或不清楚。对于预测模型的样本量，6 项研究[18，20，22，24-25，29]每变量事件数（Event Per Variable, EPV）＜20 或样本量不足造成高偏倚风险，有研究发现EPV≥20 可以满足建模样本量要求，减少预测模型过拟合现象[30]。对于缺失数据的处理，7 项研究[13，21-22，24-25，27，29]直接排除数据缺失的病例，其余研究未报告缺失数据及处理方法。对预测模型的性能评估，2 项研究[23-24]未报告预测模型的区分度，7 项研究[13-14，22-24，29]未报告校准度，8 项研究[13-14，18，21-24，29]未报告模型过拟合或拟合不足情况，预测模型的实际预测能力有待进一步验证。所有研究均未报告数据中的复杂性处理情况（表4）。

2.6.5 适用性评价在预测模型适用性方面，2 项研究[28-29]适用性不清楚，主要在预测因子和结局方面，其余研究适用性良好。

3 讨论

3.1 现有预测模型对临床有指导意义产后SUI的发生率高，严重影响产妇的日常生活和身心健康，产后SUI 风险评估工具可以早期识别高风险人群，及时为孕产妇实施干预措施，降低产后SUI 发生率。本研究共纳入17 项研究、20 个预测模型进行分析，16 个预测模型区分度较好，能够准确识别产后SUI高危人群。除了较高的预测准确性外，简便性也同样重要。模型的简便性主要体现在预测因子是否简单易得和评估的过程是否方便快捷。在预测因子方面，预测因子的数目越多，构建模型的过程中越可能出现过拟合现象，本研究纳入预测模型的预测因子数量为4～13 个，大部分预测因子可以客观测量、容易收集。评估过程方面，多数研发者使用列线图呈现预测模型，使计算方式更方便快捷，预测结果更具可读性。产后SUI 预测模型出现频次较高的预测因子有分娩方式、妊娠期尿失禁、妊娠年龄、新生儿体质量、产次，有多项研究证实以上预测因子是产后SUI 的重要危险因素[4，5]。因此，医务人员应重视有以上危险因素的孕产妇，从危险因素角度出发，针对病因提出个性化干预措施，加强妊娠期管理，预防产后SUI 的发生。

3.2 数据来源和预测因子的选择影响预测模型性能在数据来源方面，大部分研究采用回顾性队列研究开发预测模型，预测因子可能不全面，可能存在信息偏倚。前瞻性队列研究的数据代表性好，通过文献回顾筛选候选预测因子，收集临床数据，统一评估预测因子，在一定程度上可以改善预测模型质量[31]。未来开发预测模型，尽量选择前瞻性队列研究，降低信息偏倚对模型的影响。有些研究最终纳入的预测因子可能对产后SUI 的预防并无帮助，因为有些指标在分娩前未知，比如是否使用产钳及母乳喂养等，将其作为预测因子意味着预测模型的使用时间是在分娩后，可能产后SUI 高风险时段已经过去，对于分娩前医疗护理措施的制定价值有限。未来应开发涵盖整个妊娠、分娩和产后时期的动态风险评估系统，预测产后SUI 的发生。

3.3 机器学习在产后SUI 预测模型的应用有待研究现有产后SUI 预测模型建模方法较为单一，多使用Logistic 回归建模。 2018 年国家卫生健康委员会发行的《全国医院信息化建设标准与规范（试行）》中提到要利用人工智能技术对疾病风险进行预测。机器学习能够对数据描述、学习、分析以及预测[32]，和传统数学模型相比，机器学习的灵敏度、特异度和预测性能更高。国内外学者将机器学习广泛应用在疾病风险预测模型构建和验证中[33]，但在产后SUI 预测模型的研究鲜有报道，未来建议使用机器学习构建产后SUI 风险预测模型，以弥补传统预测模型的不足。

3.4 预测模型的适应性需进一步验证内部验证能够更准确评估模型表现和调整过拟合，外部验证可用于测试模型可推广性及可泛化性[34]。本研究中仅9 个预测模型进行内部验证，4 个预测模型进行外部验证，且多数研究为单中心研究，纳入的目标人群并未统一，模型的构建是基于本地区产妇，诊断及评价指标未标准化，构建时并未考虑在后期模型推广时的地域、经济水平、教育水平和文化程度等方面差异。建议未来产后SUI 预测模型构建时，采用交叉验证、Boostrap 等方法进行内部验证，采用开发队列以外的数据进行外部验证，采用多中心研究以确保预测模型的泛化能力。

3.5 预测模型的结果报告需进一步规范在结果报告方面，纳入的所有研究均未按照个体预后与诊断的多变量预测模型透明报告（Transparent Reporting of a Multivariate Prediction Model for Individual Prognosis or Diagnosis, TRIPOD）进行报告[35]，使大部分预测模型的构建过程不透明，影响了文献的质量评价结果。仅考虑区分度和校准度并不能完整评价预测模型的使用价值，还应报告灵敏度、特异度、阳性预测值和阴性预测值等指标。在本研究中，仅有5个预测模型[13-14，25，27，29]报告敏感度、特异度，1 个预测模型[25]报告阳性预测值和阴性预测值。因此，建议研究者参考TRIPOD 对预测模型进行报告，以提高预测模型构建过程的透明性。

3.6 研究的局限性本系统评价存在一定的局限性：（1）本研究仅纳入以中、英文发表的文献，可能存在文献遗漏；（2）由于研究设计、随访时间、建模方法等存在较大异质性，本研究仅进行了定性分析；（3）大部分预测模型未进行外部验证，且尚未发现在临床应用，预测模型可推广性有待验证。

4 结论

产后SUI 风险预测模型尚处于初步发展阶段，大部分预测模型的预测性能较好，但建模方法学存在一定缺陷，整体偏倚风险较高。未来产后SUI 风险预测开发应遵循PROBAST 标准，构建预测性能优良、偏倚风险低、便于临床应用的预测模型。