张 垚,赵成俊,任 宾,杜 磊,马倩源
青海大学附属医院 1肝胆胰外科 3病理科,西宁 810001 2青海省包虫病研究重点实验室,西宁 810001
原发性肝癌(primary liver cancer,PLC)是消化系统最常见的恶性肿瘤之一,其发病率、肿瘤相关死亡率分别居全球恶性肿瘤排行榜的第6位和第2位,具有较高的疾病负担[1]。肝细胞癌(hepatocellular carcinoma,HCC)在PLC中占比约75%~85%,是PLC最主要的组织学亚型[2]。根治性肝切除术是HCC患者首选的治疗方法,可最大程度提高其临床获益[3],但部分病例预后仍不理想,包括发生肝切除术后肝衰竭(post-hepatectomy liver failure,PHLF)、术后复发与转移、死亡等,尤其PHLF是肝切除术后死亡的主要原因,其发生率约为1.2%~32%,死亡率为14%[4-5],术后5年复发率高达70%[6]。故完善术前肝功能评估,严格筛选病例并通过适宜的预后评价系统早期识别出预后不良的高危人群,对于临床制定最佳诊疗决策具有重要意义。本文将系统性阐述经典肝功能评分Child-Pugh分级和终末期肝病模型(model for end-stage liver disease,MELD),以及白蛋白-胆红素(albumin-bilirubin,ALBI)评分、血小板-白蛋白-胆红素(platelet-albumin-bilirubin,PALBI)评分和格拉斯哥预后评分(Glasgow prognostic score,GPS)等新型肝功能评分在HCC患者接受根治性肝切除术后临床预后评估中的应用价值及其局限性,并对新型预测模型的研究进展进行综述,以期为临床提供借鉴。
Child-Pugh分级是1973年由Pugh提出基于酒精性肝硬化患者临床数据建立的肝硬化严重程度评估方法,其包括血清胆红素、血浆白蛋白、凝血酶原时间、腹水、肝性脑病5项参数,每项评分范围为1~3分,总分越高表示肝功能越差,其中5~6分为A级,7~9分为B级,≥10分为C级。此肝功能评估方法具有快速、简单方便的特点,主要用于HCC临床分期并可指导临床治疗及预后评估,国内诊疗指南推荐Child-Pugh A级、ICG-15(吲哚菁绿15 min滞留率)<30%为肝病患者实施外科手术的必要条件[7]。Zhou等[8]对672例行根治性肝切除术的Child-Pugh A级HCC患者分析后发现,术后并发症发生率为30.4%(其中PHLF约占9.4%),术后3个月内12例患者死亡(其中11例死于PHLF相关原因)。一项纳入357例HCC患者的回顾性队列研究[9]将B级患者分为B1级(Child-Pugh 8~9分)和B2级(Child-Pugh 7分),结果显示B1级并发症发生率(26%)明显高于B2级(9.6%),但B2级和A级(Child-Pugh 5~6分)的并发症发生率相当(9.6%比8.2%)。虽然Child-Pugh分级可影响无复发生存期(relapse-free survival,RFS),但相同Child-Pugh分级患者的预后可能差异极大。这与该评分存在多方面局限性相关:(1)肝性脑病和腹水的评估主观性较强,尤其目前对腹水的判断尚无统一标准[10];(2)白蛋白易受人为因素的影响,如输注白蛋白可快速提升血清白蛋白水平;(3)每项参数的赋分权重均相同,分级不够精确,不同病因或相同分级患者的病情可能存在较大差异,以致生存期不同。
2000年Malinchoc等[11]开发了MELD评分,以预测终末期肝病行经颈静脉肝内门腔静脉分流术后死亡风险,经验证可预测终末期肝病患者的临床结局,其计算公式为:MELD评分=3.78×ln[胆红素(g/L)×10-2]+11.20×ln(国际标准化比值)+9.57×ln[肌酐(g/L)×10-2]+6.43×(病因:胆汁性或酒精性肝硬化为0,其他肝硬化为1)。与Child-Pugh分级相比,MELD评分具有以下优点:(1)评估内容无腹水、肝性脑病等主观性较强的指标;(2)实验室指标不分级,作为连续变量进行评分计算,无最高分限制,有助于病情严重程度的区分;(3)可反映终末期肝病患者肾功能受损情况;(4)指标均为易获得的客观变量。Badawy等[12]在一项纳入240例行根治性肝切除术HCC患者的回顾性研究中发现,术后90 d死亡率约为2.5%,术后第3天MELD评分是90 d死亡率的独立危险因素(OR=1.4,95% CI:1.06~1.81,P=0.02),提示该评分或可作为肝切除术HCC患者预后的早期预警指标,预测失代偿期肝病患者死亡风险,但该评分亦存在局限性,如并非适用于所有HCC患者,尤其肝功能损伤程度较轻者。一项纳入185例首次接受肝切除术HCC患者(176例肝功能为Child-Pugh A级)的研究比较了不同评分与临床预后的相关性,结果显示23例(12.4%)患者发生了重度PHLF,MELD评分预测重度PHLF的受试者工作特征曲线下面积(area under the curve,AUC)低于ICG-R15[13],亦提示MELD评分在肝功能轻度受损HCC患者中的应用价值受限。此外,MELD评分组成参数血肌酐受肝外疾病因素的影响较大,一定程度限制了该评分的应用。陈敏强等[14]提出可用血清肌酐清除率代替血肌酐值进行MELD评分计算,但相关研究较少,其临床价值尚需验证。
2015年Johnson等[15]基于日本1313例HCC患者的临床资料提出了ALBI评分,该评分仅由白蛋白和总胆红素2个简单且客观的实验室参数构成,计算方法为:ALBI评分=0.66×lg[总胆红素(μmol/L)]-0.085×[白蛋白(g/L)],计算结果可分为1级(≤-2.60 分)、2级(>-2.60~-1.39分)和3级(>-1.39分),其中1级表示肝功能良好,3级表示肝功能较差。经验证在排除区域因素的影响后,ALBI评分对肝损伤患者预后风险的区分能力与Child-Pugh分级保持一致,且ALBI评分无需MELD评分如此多的变量数目,即可对肝功能正常或轻度损伤患者(Child-Pugh A级)进行风险等级划分,以消除Child-Pugh分级的内部等级差异[15]。一项纳入13 783例HCC患者的大样本研究评估了ALBI评分的临床效能,结果显示ALBI评分预测HCC患者肝切除术后30 d发生重度PHLF及死亡的AUC均高于MELD评分,提示ALBI评分对HCC患者预后具有更佳的预测能力[16]。Lin等[17]对383例接受根治性肝切除术的HCC患者随访后发现,术前ALBI评分2~3级患者的术后5年总生存期(overall survival,OS)和RFS均显著低于ALBI评分1级患者(即使其术后甲胎蛋白水平较低)。一项纳入5377例接受根治性肝切除术HCC患者的荟萃分析显示[18],与ALBI 1级患者相比,术前 ALBI 2级和3级患者PHLF发生率更高,且ALBI评分预测PHLF的AUC高于MELD评分和ICG-R15。Wang等[19]在针对1242例HCC患者的研究中得到了类似结果:PHLF发生率和严重程度随术前ALBI等级增加而升高,术前ALBI评分预测PHLF发生风险的性能优于Child-Pugh分级(AUC:0.723比0.607,P<0.001)。
尽管多项研究认为,ALBI评分在预测根治性肝切除术HCC患者预后方面具有更高的稳定性与准确性,但由于该评分仅包含2个变量且无“天花板效应”(无评分上限),其预测结果在特定情况下亦存在一定偏倚:(1)临床检验结果表明胆红素水平十分高,但实际上患者的肝功能并非很差时,该患者虽被划分为ALBI 3级,但预后可能良好。(2)ALBI 3级HCC患者中,梗阻性黄疸者的肝功能和预后明显优于肝功能不全性黄疸者[20]。(3)营养不良者可能存在血清白蛋白极低,而无严重的肝功能不全,此时其ALBI等级可能较高而预后较好。此外,有研究报道,门静脉高压与HCC患者根治性肝切除术后并发症发生率与复发率增高、生存率降低有关,但ALBI评分未涉及门静脉高压相关因素的评估。
2015年Roayaie等[21]将反映门静脉高压对术后预后影响的指标血小板纳入ALBI评分并形成了PALBI评分。该评分计算方法为:PALBI评分=2.02×lg(胆红素)-0.37×[lg(胆红素)]2-0.04×(白蛋白)-3.48×lg(血小板)+1.01×[lg(血小板)]2,计算结果可分为3个等级:1级(≤-2.53分)、2级(>-2.53~-2.09分)、3级(>-2.09分)。Lu等[22]基于2038例Child-Pugh A级HCC患者的临床资料评估了不同评分对根治性肝切除术后PHLF的预测能力,结果显示PALBI评分的AUC 高于ALBI评分和Child-Pugh评分,且随PALBI等级增加,PHLF发生率随之升高;此外,PALBI评分可将1570例ALBI 1级患者的预后风险划分为3个亚组,可更好地对Child-Pugh A级HCC患者进行危险分层,以优化临床管理策略。Luo等[23]开展的研究得到了类似结果,即PABLI评分在预测HCC患者根治性肝切除术后复发、生存率方面表现出了较好的性能,预测能力优于ALBI评分和Child-Pugh分级。
PALBI评分不仅包含肝功能相关指标,还涉及门静脉高压的评估,一定程度上提高了其对术前血小板降低及严重门静脉高压HCC患者经行肝根治性切除术后预后风险的预测能力[24-25]。由于目前发表的相关文献均为单中心和回顾性研究,研究对象主要为Child-Pugh A级患者,其在Child-Pugh B级和C级患者中的应用情况尚需验证。此外,该评分仅纳入了符合米兰标准的乙型肝炎病毒相关HCC患者,是否适用于由丙型肝炎病毒、饮酒、非酒精性脂肪肝等其他病因引起的HCC亦需进一步探索[26]。
炎症标志物是多种癌症患者重要的预后因素。GPS评分是基于C反应蛋白(C-reactive protein,CRP)和白蛋白的炎症评分系统,其中2项指标均正常赋0分,其中1项异常赋1分,2项均异常赋2分,目前该评分多用于卵巢癌、胃癌等恶性肿瘤预后的评估[27],其与HCC患者的相关性尚存争议。2023年日本研究学者Kumamoto等[28]基于480例接受肝切除术HCC患者的临床资料对GPS评分的实用性进行了验证,结果表明GPS评分增高与较差的OS、无病生存期(disease-free-survival,DFS)显著相关,且随GPS评分增高肝内转移者的比例显著升高,提示术前GPS评分是HCC患者肝切除术后OS和复发的有效预测指标。考虑到HCC与其他恶性肿瘤之间临床特征的差异,一项多中心回顾性研究[29]将ALBI评分代替白蛋白开发了新的GPS评分(neo-GPS)作为HCC术后预后的评估方法,经验证随neo-GPS评分增加,术后并发症发生率逐渐升高;neo-GPS评分在预测HCC患者OS和无进展生存期(progression-free survival,PFS)方面的性能优于GPS评分。此外,有研究表明[30]肌肉减少是HCC复发和OS缩短的重要危险因素,目前尚未见研究阐述肌肉减少与GPS评分、neo-GPS评分之间的关系,故GPS评分、neo-GPS评分预测HCC患者预后的效能及其可能的预测原理有待进一步阐明。
一项研究评定了不同肝功能评分在HCC患者行根治性肝切除术后1年、3年和5年生存情况中的预测价值,结果显示在所有患者、肝功能轻度下降患者以及接受不同治疗方式的患者中,PALBI评分的预测能力均最优[31]。Sonohara 等[32]基于连续纳入305例行肝切除术HCC患者的临床资料评估了PALBI评分与肝纤维化评估指标纤维化-4(fibrosis 4,FIB-4)指数和天冬氨酸氨基转移酶与血小板的比值(APRI指数)对HCC患者围术期风险及预后的影响,结果显示3种评分与预后均具有相关性,但仅PALBI评分与手术时间、术中出血量显著相关。另一项回顾性研究[33]对比分析了术前ALBI评分、APRI指数、Child-Pugh分级、FIB-4指数、MELD评分及PALBI评分与HCC患者肝切除术后生存情况的相关性,结果表明PALBI评分是6种评分中预测死亡率和复发率最为准确的预后评价指标。目前尚缺乏GPS评分与其他评分进行比较的研究,有研究[34]认为(碱性磷酸酶+γ-谷氨酰转肽酶)与淋巴细胞比值对HCC患者术后预后具有良好的预测能力,但确切结果仍需大样本前瞻性研究予以验证。PALBI在肝切除术HCC患者预后方面的预测能力优于其他评分系统的可能原因:(1)主观因素、血肌酐值等可靠性较差指标可能削弱了Child-Pugh分级和MELD评分的预测能力,而PALBI评分的参数更为客观,减少了主观因素的影响;(2)与ALBI评分相比,其新增了门静脉高压的评估,对肝功能的评价更全面;(3)对于肝功能正常或轻度损伤患者(Child-Pugh A级)亦具有较强的风险分层能力[22]。
为进一步提高单一模型的预测能力,以更好地辅助临床决策,研究者尝试将多种评估HCC患者预后的评分进行联合应用[35-36]。Zhang等[35]在一项纳入544例接受肝切除术HCC患者的研究中将ALBI评分与FIB-4指数进行组合形成了ALBI-FIB-4评分,随访结果表明ALBI-FIB-4评分对OS与RFS的预测能力优于单一ALBI评分和FIB-4指数,且高ALBI-FIB-4评分者可能具有更高的术后复发率和更低的远期存活率。Luo等[37]在一项针对ALBI评分和APRI指数的研究中得到了相似结果,将ALBI评分和APRI指数相结合(ALBI-APRI评分)可提高单一ALBI评分和APRI指数预测HCC患者肝切除术后OS与RFS的能力。Pereyra等[38]研究证实,ALBI-APRI评分在预测因结直肠癌肝转移而接受肝切除术患者再次出现结直肠癌肝转移发生率、肝功能情况及死亡率方面亦表现出良好的性能,提示该评分可作为动态监测并识别结直肠癌肝转移患者发生化疗相关肝损伤的辅助工具。作为ALBI评分与GPS评分的综合体现,neo-GPS评分可提高预测根治性肝切除术HCC患者并发症发生风险的灵敏度,并有助于生存期的预估[39]。此外,对于neo-GPS评分较高者,腹腔镜下肝切除术可能比开放式肝切除术更加安全,提示该评分可为临床诊疗策略的制定提供参考。目前,尚未见PALBI评分与其他评分联合应用的报道,期待后续相关研究的发表。
代谢组学肝功能预测模型可为理解复杂疾病的分子相互作用提供新的研究视角[40]。Wang等[41]采用液相色谱-质谱联合法分析了78例HCC患者的血清样本并开发了可评估总生存状态的全球预后指数(global prognostic index,GPI),经独立数据集验证,与目前临床常用的巴塞罗那分期系统(Barcelona Clinic Liver Cancer,BCLC)、TNM分期以及ALBI评分相比,GPI在HCC预后评估方面表现出较好的预测能力,提示代谢组学或可作为HCC术后预后风险分层的实用工具。Fang等[42]基于气相色谱-质谱伪靶向代谢组学法开发了基于网络的组合显著性指数(N-CSI)以识别与HCC术后结局相关的代谢特征,建立了死亡风险预测模型(RSOS)和复发转移风险预测模型(RSDFS)。该研究采集91例接受根治性肝切除术HCC患者的术前血清样本对上述两种HCC预后风险模型进行了验证,结果显示预测的生存期与实际生存期之间具有良好的一致性。故基于血清代谢组学研究能够为肿瘤分子代谢及预后特征分析提供线索,可作为HCC预后危险因素筛查的潜在工具。
肠道微生物在营养吸收、肠道功能调节及免疫反应中均发挥重要作用,可在肠道和肝脏之间形成双向通讯关系(“肠-肝轴”),并通过多种途径影响肝病进程[42]。研究表明[43],肠道微生物通过“肠-肝轴”可驱动肝脏炎症反应,加速肝脏癌变。He等[44]在一项纳入112例接受根治性肝切除术的早期HCC患者的研究中,结合增强CT特征和肠道微生物特征建立了预后风险预测模型并采用COX回归分析对模型的性能进行验证,结果表明该预测模型对肝切除术HCC患者的RFS具有良好的判别能力,可辅助临床对患者进行术后管理以及随访和干预措施制定。此外,该研究进一步将肿瘤负荷、微血管侵犯及临床病理参数纳入模型后,其预测性能并未获得明显提高,亦提示肠道菌群在HCC预后中具有重要调控作用。
机器学习算法的应用极大地提高了临床病理图像分析的效率,通过提取隐匿的生物学信息,结合大数据分析可提升预后模型的准确性,并为干预措施的制定提供重要参考依据。Saillard等[45]基于195例HCC患者的全数字化组织图像建立了2个预测模型(“CHOWDER”与“SCHMOWDER”),以预测HCC患者术后生存率。结果显示,可反映模型性能的C指数分别为0.75和0.78,预测能力均优于与生存相关的所有基线变量。一项区域性、回顾性、观察性队列研究纳入了124 006例具有完整数据的慢性病毒性肝炎患者[46],并建立基于机器学习的HCC风险预测模型(HCC-RS),结果显示该模型在预测慢性病毒性肝炎进展为HCC方面表现出优于现有HCC风险评分的准确性,但该研究未对模型在HCC患者根治性肝切除术后转归中的预测价值进行分析。相信随着相关参数不断优化,未来机器学习模型必将在HCC预后风险预测方面发挥更大作用。
术前进行精确肝功能评估有助于治疗措施的制定和预后风险的评估,具有重要临床意义。本综述对多种肝功能评价方法的特征及优缺点进行了总结(表1)。整体而言,相较于Child-Pugh分级、MELD 评分等经典肝功能评价方法,ALBI评分、PALBI评分、GPS评分等新型评价体系可能在行根治性肝切除术HCC患者预后方面展示出更优的预测价值,尤以PALBI评分表现最佳。多种评分相整合或可提高单一评分的预测能力,必要时可根据患者的具体情况选取恰当的评分组合予以应用。近年来,基于代谢组学、肠道菌群、机器学习的预测模型在HCC患者预后方面亦取得了不俗的成绩,未来研究需探索如何进一步优化预测模型的逻辑运算过程,以方便临床理解和使用。此外,利用先进科学技术整合资源,融合多模态、多元化数据如生物标志物、临床表现、病理信息、影像学资料以及人类基因组学特征等进一步提高预测模型的精度是未来发展方向,以更好地指导临床治疗和预后管理,达到早期筛查、监测和治疗HCC的目标。
表1 根治性肝切除术HCC患者预后预测模型总结