滕艳娟,唐雯桢,黄玮琳,王继龙
(广西医科大学第一附属医院肝胆外科,广西 南宁 530021)
肝癌是世界范围内发病率和死亡率较高的恶性肿瘤,在我国恶性肿瘤发病率和死亡率中分别居第四位和第二位[1]。目前,以手术为主的综合治疗是肝癌的主要治疗方式[2-4]。尽管肝切除术有了显著的改进,但仍有较高的并发症发生率。据报道,肝切除术后并发症的发生率为23%~48%[5-6]。既往的研究表明,术后的严重并发症可能会导致癌症患者住院时间延长﹑住院费用增加等短期的不良临床后果,这些并发症还会对患者产生长期影响,不利于患者的长期生存[7-8]。在一项对1200 例大手术患者进行成本分析的研究中,肝切除术后合并有3 级以上并发症患者的手术费用要高出2 ~5 倍。鉴于此,早期识别高危人群并提供个性化的干预措施对于肝切除后严重并发症的预防至关重要。风险预测模型是以疾病发病的各种风险因素为基础,来评估个体未来发生某种特定疾病或因为某种特定疾病导致死亡风险,对改善患者预后具有积极作用[9]。目前,国内外已开展多项肝切除术后严重并发症风险预测模型的研究,但各项研究质量不一且尚未有学者对此进行系统评价研究。因此,本研究旨在全面检索国内外关于肝切除术后严重并发症风险预测模型的研究,系统总结和评估各种预测模型,为医务人员的临床实践和科研提供参考。
检索公开发表在以下数据库有关肝切除术后严重并发症预测模型的研究,中文文献数据库为中国生物医学数据库和中国知网,外文文献数据库为Cochrane Library﹑PubMed﹑Web of Science﹑EBSCO Host,检索时间从建库至2022 年12 月。检索用主题词,中文检索词为(“肝切除术”OR“肝部分切除术”)AND(“术后并发症”OR“并发症”)AND(“风险模型”OR “高危因素”OR “预测因素”OR “预测模型”OR “风险预测模型”OR “预测”OR“评分系统”),英文检索词为:(‘hepatectomy’ OR ‘liver resection’ OR‘ hepatic resection’ OR ‘liver surgery’)AND(‘postoperative complications’ OR ‘complications’)AND(‘risk model’ OR ‘risk factors’ OR ‘risk prediction model’OR ‘prediction’ OR ‘scoring system’ OR ‘score system’),以计算机检索为主,辅以人工检索,通过阅读检索文献的参考研究进行进一步的追溯。
纳入标准。(1)研究类型:前瞻性或回顾性队列研究。(2)研究对象:接受肝切除术的患者。(3)研究内容:构建肝切除术后严重并发症的预测模型,并对预测模型进行内部和/或外部验证。(4)肝切除术后严重并发症定义为Clavien 3 级以上。(5)研究报道该模型预测严重并发症的灵敏度﹑特异性和受试者工作特征曲线(receiver operating characteristic,ROC)的曲线下面积(area under the curve,AUC)。
排除标准:排除研究类型为综述或动物研究,重复发表且相同内容的研究,只纳入最新且病例数较多的研究,删除发表年份较早﹑信息不完整的研究。
本次研究所涉及的文献资料,均由两位人员进行独立筛选,当两位研究者意见不一致时,由第三位研究者进行协助裁决并争取统一意见,最终确定纳入的文献。研究者阅读纳入文献的全文并根据预先制定的表格进行数据提取,包括研究名称(连同第一作者姓名和出版年份),国家,研究人群,研究设计(回顾性研究或前瞻性研究),样本量(建立样本和验证样本),发病率/死亡率,建模/验证的AUC,模型类型(评分系统或列线图)和研究结果[调整后的RR 或OR 及其相应的预测因子95%置信区间(CI)]。
两名研究者根据McGinn 检查表[10]对纳入研究进行质量评价,McGinn 检查表包括两个方面,共13 个项目,从样本量﹑盲法和研究对象特点等方面对预测模型进行评估。
由两名研究者独立地对不同的预测模型进行分类和总结,并分析包含不同预测指标模型的性能。本研究使用Revman5.3 软件对模型中的预测变量的预测值进行系统评价。连续变量用平均数±标准差和中位数或四分位数间距表示,分类变量用构成比n(%)表示,计量资料的合并效应值用加权平均差和95% 置信区间(confidence interval,CI)表示,计数资料的合并效应指标用比值比(OR)和95% CI 表示。用Q 检验进行研究之间的同质性检验:如果检验结果I2<50%(P>0.1),认为研究之间的同质性良好,使用固定效应模型进行异质性分析;如果I2>50%(P<0.1),则研究间存在异质性,采用随机效应模型分析,灵敏度分析用于检测数据结果的强度。P<0.05 为差异具有统计学意义。
根据检索策略,初步检索共获得298 项研究,经过去除重复文献﹑浏览文献标题﹑摘要和全文后,最终纳入了7 篇文章,文章语言均为英文[7,11-16]。文献检索流程见图1。
图1 本研究的文献筛选流程
纳入的所有研究均为发表于2010 年—2022 年的前瞻性研究。其中,三项在中国进行[7,13,15],两项在瑞士进行[12,16],一项在意大利进行[11],剩余一项则是多中心研究[14]。在纳入的研究中,建模的样本量为150 ~1810,验模的样本量为57 ~803。肝切除术后受试者严重并发症的发病率和死亡率分别为10%~42.7%和0.5%~4.3%。共有五项研究报告了预测模型的AUC 值,建模组的AUC值为0.71 ~0.898,验证组的AUC 值为0.717 ~0.83,模型的性能较好。纳入研究的基本特征见表1。
表1 本研究纳入文献的基本特征
采用McGinn 检查表对纳入研究进行质量评价。在研究对象领域,纳入的三项研究[11,14-15]样本量不足,其余研究偏倚风险低。在预测因子领域,一项研究[16]模型中的所有预测因子均未明确定义,可能会造成一定的偏倚。在验证模型的过程中,三项研究[11,14-15]中的有效样本小于或等于80%,两项研究[7,13]未使用或报告盲法是否用于评估结果。纳入模型的方法学质量评价见表2﹑表3。
表2 建立预测模型研究的方法学质量评价(n=7)
表3 验证预测模型研究的方法学质量评价(n=7)
在7 个肝切除术后严重并发症预测模型中,最终纳入预测模型的预测因子个数为3 ~9 个,出现频次最高的预测因素包括手术切除范围﹑ASA 分级﹑肝外手术和白蛋白水平。其中,手术切除范围是出现频次最高的预测因子,有6 个模型采用。模型中纳入的预测因子具体情况见表4。
表4 7 项纳入研究中的预测因子
对风险预测模型中纳入较多的手术切除范围﹑ASA分级﹑白蛋白水平﹑合并肝外手术这4 个因素对术后严重并发症的预测价值进一步进行Meta 分析。
一项研究[15]未能提供有效数据,因此共有5 项研究[7,12-14,16]分析了手术切除范围对术后严重并发症的预测价值(6136 例患者)。运用固定效应模型(P=0.33,I2=12%)分析,结果显示:OR=2.71,95% CI=(2.36 ~3.10),Z=14.38(P<0.00001)。具体结果见图2。
图2 手术切除范围作为术后严重并发症预测指标的森林图
两项研究[13,16]分析了ASA 分级对术后严重并发症的预测价值(1899 例患者)。运用固定效应模型(P=0.37,I2=0%)分析,结果显示:OR=1.95,95% CI=(1.48 ~2.58),Z=4.70(P<0.00001),具体结果见图3。
图3 ASA 分级作为术后严重并发症预测指标的森林图
两项研究[7,11]分析了白蛋白水平对术后严重并发症的预测价值(2744 例患者)。运用随机效应模型(P<0.00001,I2=98%)分析,结果显示:OR= -1.41,95% CI=(-2.58 ~-0.23),Z=2.35,P=0.02。进 一 步 分析异质性原因,可能与两项研究中包含的研究对象类型差异有关。具体结果见图4。
图4 白蛋白水平作为术后严重并发症预测指标的森林图
两项研究[13,16]分析了肝外手术对术后严重并发症的预测价值(1543 例患者)。运用随机效应模型(P=0.003,I2=89%)分析,结果显示:OR= 5.3,95% CI=(2.38~12.18),Z=4.04(P<0.00001)。进一步分析异质性原因,可能与两组患者的实际年龄分布差异有关。具体见图5。
图5 合并肝外手术作为术后严重并发症预测指标的森林图
本系统综述纳入了7 个肝切除术后严重并发症风险预测模型,总体来说文献质量较高。大部分研究是基于评分系统建模,只有两项研究通过列线图建模。所有模型的AUC 均大于0.7。手术切除范围﹑ASA 分级﹑合并肝外手术和白蛋白水平是模型中常见的预测指标。
本研究包含的所有预测模型均进行了内部和/或外部验证,且所有模型的AUC 值在建模和验模人群中均大于0.7,说明这些模型可以有效区分肝切除术后严重并发症的发生与否。所有研究都使用了Logistic 回归,它是建立预测模型的主要方法[17]。借助回归系数β 的权重进行预测因子的赋值处理,便于对术后并发症风险进行预测,具备相对较强的可操作性。此外,所有研究中对术后严重并发症的定义均基于易操作的Clavien 分级系统,该系统已被广泛用于评估手术的治疗效果[18],结果稳定可靠。因此,本研究所纳入的肝切除术后严重并发症风险预测模型的总体性能良好,对临床医务人员筛查高危人群严重并发症具有重要意义。但是需要注意的是,部分研究存在偏倚,主要原因是样本量相对较少,且预测因子或结果评估未实施或未报告盲法﹑预测因子缺乏明确定义等。因此,未来研究对于部分样本量较少,且不能进行统计学分析的情况下,应慎用此模型;同时,应严格遵循模型的开发方法与流程,降低可能存在的偏倚风险,以提高模型的性能[14-15]。对于样本量不足的模型,Rudolph 等[19]在相关报道中指出,如存在样本量不足的情况,可借助boot-strap 重抽样法进行模型优化处理,以使其具有匹配性和稳定性,该观点对后续的临床研究具备借鉴价值。
经归纳总结发现预测因子存在一定的共性,手术切除范围﹑ASA 分级﹑合并肝外手术和白蛋白水平是术后严重并发症预测模型中常用的预测因素,这些预测因子已被众多研究证实是导致肝切除术后发生严重并发症的重要危险因素[20-21]。Meta 分析的结果显示,肝大部分切除术﹑ASA 分级III ~IV 级﹑合并肝外手术和低白蛋白水平是肝切除术后严重并发症的独立预测因子。手术切除范围是风险模型中使用最广泛的预测因子。当切除更多节段时,肝脏受损的解剖结构明显增加,因此,肝衰竭和输血的风险也会相应地增加[22]。研究表明,ASA 分级III ~IV 级已被确定为肝切除术后严重并发症的独立危险因素[23],这可能是由于随着ASA 等级的增加,患者的器官功能补偿能力逐渐下降,围手术期死亡风险升高。
此外,低蛋白血症也是术后严重并发症的独立危险因素。白蛋白是血浆中重要的蛋白质,它由肝脏合成,是反映肝脏合成功能和营养状况的重要物质[24],有研究证实低蛋白血症可诱发患者术后胸腔积液﹑肝衰竭等并发症[20]。合并肝外手术是风险模型中另一个重要的预测指标。Mariette 等发现48.3%的肝外手术与大血管手术有关,鉴于术中突然的大量出血,合并肝外手术已被证实在大多数情况下是出血性的。肝外手术包括胃肠道手术﹑膈肌切除术﹑脾切除术等,这可能导致失血并增加输血的风险[25]。但这四项指标主要分为术前和术中两类,不利于临床上术后的管理。因此,在未来的研究中可增加术后的相关指标。在临床工作中,医务人员对伴有以上危险因素的肝切除术后的患者应保持持续关注和高度敏感,以期早期识别高危人群。
本研究纳入的文献中,所报道的模型大部分是基于国外肝切除术后患者构建的,我国在该领域的发展尚处于初步阶段。此外,纳入的7 项研究中,仅1 项研究在多中心开展。提示未来研究可根据我国临床的实际情况,选取容易获取﹑预测强度高的预测因子和预测性能较好的预测模型,或是构建本土化多中心﹑大样本的预测模型,在国内肝切除术后患者中进行验证,提高模型的预测效能。同时,未来医护人员通过早期筛查和识别严重并发症的高危人群,有助于护理人员对相应的高危患者及时并有效地提供相应的护理措施,可有效改善患者的临床结局。
本研究也存在一定的局限性。首先,由于研究对象存在一定差异,因此在选择预测模型时应注意模型的适用对象。其次,本次所纳入研究的语言仅限于中英文,因此可能会存在发表偏倚。另外,少数研究由于缺乏模型的验证过程而被排除在外,可能会存在一定的选择偏倚。
本系统综述纳入了7 项经验证的肝切除术后严重并发症风险预测模型,对风险模型性能﹑方法学质量﹑建模方法和预测因素等进行了系统地分析和评估。大部分预测模型的预测效能较好,但存在一定的偏倚风险。鼓励未来研究者在构建模型的过程中,应遵循模型的开发与报告规范,尽量降低偏倚风险。建议未来可开展多中心﹑大样本的研究,并结合大数据分析的方法,以构建预测性能优良﹑使用便捷的风险预测模型,为临床工作人员早期识别肝切除术后严重并发症的高危人群提供可靠的研究工具。