张 磊, 侯忠衡, 王 祁, 王 凯, 徐家晨, 马 原, 张 帅, 李 智,朱晓黎, 倪才方
原发性肝癌(primary liver cancer, PLC)是目前我国第4 位常见恶性肿瘤及第2 位肿瘤致死病因[1]。 由于肝癌起病隐匿,大多数患者就诊时已处于中晚期,从而失去了外科手术等根治性治疗的机会[2]。目前国际上美国肝病学会(AASLD)和欧洲肝病学会(EASL)均推荐经肝动脉化疗栓塞术(TACE)为中期肝癌(BCLC B 期)的一线治疗方案[3-4]。 然而,BCLC B 期是一组高异质性的患者人群, 包括肿瘤负荷、肝功能、病因、合并症等,使BCLC B 期肝癌患者预后不一[5-6]。
由于BCLC B 期肝癌患者的疾病异质性显著,之前的学者基于肿瘤负荷(up-to-7 标准)和肝功能(Child-Pugh 评分)这两个重要的指标提出BCLC亚分期(sub-classifications)作为预后分层[5]。 其中争议较多的是针对那些行TACE 预后较差肝癌患者是否及早行系统治疗[7]。 同时有其他学者建立了几种预测TACE 术后生存的预后模型或者评分系统[8-10]。 这其中,比较著名的如 HAP 评分,基于肿瘤大小、AFP、白蛋白、胆红素这些指标而建立的,但其缺乏对肝癌患者的个体化预后预测[8]。 而且,这些模型或者评分系统绝大多数是从不同的BCLC 分期肝癌患者中建立的, 增加了异质性,或者是针对肝癌,而不是针对TACE 这一治疗手段,从而都具有不足之处[11-12]。
本研究建立并验证对中期肝癌患者行TACE治疗的生存期预测模型,并且与其他的预测模型比较预测的准确性。
回顾性分析 2009 年 1 月至 2017 年 12 月在 3所医院接受TACE 治疗的首诊中期肝癌患者的临床资料。 以常州市第一人民医院和常州市第二人民医院收治患者作为训练集,苏州大学附属第一医院收治患者作为测试集。 纳入标准: 根据AASLD 及EASL 肝癌治疗指南诊断为中期(BCLC B 期)首诊首治肝癌患者。 排除标准:①弥漫性肝癌;②伴有其他恶性肿瘤;③合并严重的心脑肺肾疾病;④失访的患者。 本研究通过3 家医院医学伦理委员会审批,符合《赫尔辛基宣言》标准。
1.2.1 数据收集 收集患者的基线资料,包括流行病学、人口学、实验室检查、影像学检查资料。
1.2.2 TACE 治疗方法 所有患者均采用传统的碘油TACE(cTACE)治疗及按需模式。 采用经典的“三明治”栓塞方案。 TACE 治疗前先行肝动脉造影,了解肿瘤的供血动脉情况。 使用吡柔比星(10~40 mg)及奥沙利铂(100~150 mg)与碘油(2~20 mL)混合形成乳剂,经Progreat 微导管(泰尔茂,日本)超选择缓慢注入肿瘤的供血动脉,再以明胶海绵或PVA 颗粒栓塞肿瘤内血管,至主要供血动脉血流停滞。栓塞终点为肿瘤血管血流较初始血流明显减少, 一般由清除对比剂的时间决定, 一般需要5 个心动周期。 5 min 后,再次行肝动脉造影,以确定肿瘤供血动脉栓塞完全。
1.2.3 随访及复查 随访持续到患者死亡或随访截止日期为止,随访截止日期是2019 年12 月31 日。总生存期(overall survival,OS)定义为首次 TACE 手术日至患者死亡日期或随访截止日期(删失)的间隔时间。 TACE 术后3 d 行肝肾功能及血常规复查,术后1 个月行增强CT 或者MRI 及甲胎蛋白复查。根据影像学的评价、患者的一般情况及肝肾功能决定患者是否再次行TACE 治疗。 如果患者不适合后续的TACE 治疗,则给予最佳的支持治疗。
1.2.4 评估标准 根据基线资料,up-to-7 标准:肿瘤大小及肿瘤的最大径相加不超过7,up-to-11 标准:肿瘤大小及肿瘤的最大径相加不超过11。 HAP评分根据血清白蛋白、甲胎蛋白、胆红素和肿瘤最大直径来评定。 BCLC 亚分期及新BCLC 亚分期根据 Child-Pugh 评分、up-to-7 以及 up-to-11 来判定。根据mRECIST(modified Response Evaluation in Solid Tumors)标准来评估肿瘤应答。 ALBI 计算公式=log10胆红素×0.66+白蛋白×0.085, 胆红素单位为 μmol/L,白蛋白单位为 g/L; ALBI 评分≤-2.60(ALBI 1 级),-2.60 <ALBI 评 分 ≤-1.39 (ALBI 2 级 ), ALBI 评分>-1.39(ALBI 3 级)。
计量资料以中位数或者均数±标准差表示。 采用Mann-Whitney U 检验比较连续变量, 比较分类变量采用卡方或者Fisher 精确检验。 采用Kaplan-Meier 法绘制生存曲线, 采用Log-rank 检验进行生存分析。 采用Cox 回归模型分析影响生存的预后因素并建立列线图。 经单因素分析将P<0.05 的变量纳入多因素分析。通过计算修正的赤池信息量准则(corrected Akaike information criteria,AICc) 来分析模型和OS 的关联性。 采用受试者工作特征曲线下面积(area under the receiver operator characteristic curve,AUROC)及C 指数比较各个模型预测生存率的准确性。C 指数越大,模型的准确性越高。Cox 回归模型用于计算似然比χ2确定每个模型的同质性。一个模型的χ2越大,AICc 值越小,表示该模型预测预后的效能越高,预测预后的稳定性越好。生存时间、风险比(HR)及 C 指数均计算区间估计值(95%CI)。P<0.05 为差异有统计学意义。所有统计分析均使用R 语言进行。
共纳入299 例中期肝癌患者, 其中训练集158例,测试集141 例。 所有患者的基线特征见表1。 训练集共做了750 次TACE,测试集做了530 次TACE,中位 TACE 次数分别为 4(1~12)和 3(1~12)。
表1 训练集和测试集的肝癌患者一般临床资料
截止随访结束,训练集和测试集的中位随访时间分别为 22.7(95%CI:19.9~30.1)和 23.8(95%CI:19.9~29.0)个月,分别有 146 例和 115 例患者死亡,12 例和26 例患者存活。299 例患者的总体中位生存时间(mOS)为 23.0(95%CI:20.5~27.2)个月,训练集和测试集的生存时间分别为22.7(95%CI:19.9~30.1)和 23.8(95%CI:19.9~29.0)个月(P=0.96)。 见图 1。
单因素分析中,性别、AFP、肿瘤大小、白蛋白、AST、Child-Pugh 分期、up-to-7 标准、up-to-11 标准及肿瘤应答均与预后相关(P<0.05)。在多因素分析中,AFP、up-to-11 标准及肿瘤应答为独立预后因素(P<0.05)见表 2。 KM 曲线提示 3 个独立预后因素可以将整个队列患者进行OS 分层(均P<0.01)。见图1。
表2 训练集总生存率的单因素和多因素分析
图1 生存曲线
基于多因素分析的独立危险因素建立列线图预测模型,见图2。每个患者被指定1 个个性化的评分(3 个危险因素的总得分),以准确地预测中位生存时间。 训练集和测试集的C 指数分别为0.700(95%CI:0.693~0.707)和 0.647(95%CI:0.637~0.657)。以列线图评分的中位数作为训练集和测试集的患者分为两个亚组的分界点,评分高于中位数的亚组为高危组,反之则为低危组(P<0.000 1)。 见图 3。
图2 列线图
用 1 年、2 年生存率的 AUROC 值、AICc 及似然比将建立的模型与其他模型(HAP、BCLC 亚分期、新BCLC 亚分期)进行比较,见表3。 建立的模型1 年、2 年生存率的AUROC 值都高于其他模型。KM 曲线显示其他模型对训练集、 测试集患者的预后分层能力,其中新BCLC 亚分期对训练集、测试集所有患者都有预后分层能力(P=0.0012,P<0.0001)。见图3。
图3 训练集和测试集各分层图
表3 列线图和其他模型的比较
目前,TACE 仍为BCLC B 期肝癌患者一线治疗方案[13],但既往研究并不是所有的中期肝癌患者都能从 TACE 治疗中获益[14]。 为了能够筛选出那些能够从TACE 治疗中获益的肝癌患者, 不少学者建立了预测模型[15]。 但之前的模型入组人群包括BCLC A 期到C 期, 且很多是基于术前的一些临床指标建立的。 由于中期肝癌的明显异质性,个体对TACE 的肿瘤应答不同, 而肿瘤应答与生存期是明显相关的。 为了克服之前的模型缺乏肿瘤应答这一重要的预后因素,本课题基于首次TACE 术后肿瘤应答、up-to-11 标准及AFP 建立的列线图模型能够很好的预测BCLC B 期肝癌行TACE 治疗的生存期,并且模型的准确性及效能都能满足目前的预测。
肿瘤负荷和肝功能一直是肝癌患者行TACE治疗预后的主要的预测因子。 但对肿瘤负荷和肝功能的最佳代替指标一直没有达到共识。HAP 评分包括白蛋白、胆红素、AFP 及肿瘤大小,STATE 评分包括up-to-7 标准及白蛋白,BCLC B 期亚分期包括Child-Pugh 评分及 up-to-7 标准,新 BCLC B 期亚分期包括up-to-11 标准及Child-Pugh 分期。最近也有一些研究表明ALBI 可能是一个更好的肝功能的代替指标。 本研究多因素分析的临床指标中只有AFP 和up-to-11 标准是独立的预后因素。 AFP 可能是肿瘤负荷或肿瘤生物学侵袭性的标志物,常作为肝癌患者的重要的生存期预测因素[16-17]。 up-to-7 标准最初提出是用来评估患者是否具有肝移植的条件,可能不太适用于 BCLC B 期肝癌患者[18]。 相反,up-to-11 标准在本研究中对于BCLC B 期患者可能更有区别性。在本研究中, 入组的肝癌患者肝功能良好(Child-Pugh B 期患者比例较少), 而最后的模型中没有肝功能相关指标,可能对于肝功能良好的患者,肿瘤负荷对患者生存期的影响更大。之前有国内学者提出了“Six-and-Twelve”的预后模型,通过肿瘤的最大直径和肿瘤数目相加的代数和来预测肝癌患者接受TACE 治疗的疗效,证实了在肝功能良好的患者中,肿瘤负荷与预后的关系更加密切[19]。mRECIST 评分是EASL 指南推荐的TACE 术后评估肿瘤应答的一种标准,其在临床中的应用越来越广泛,相较于其他评定标准(RECIST),可以作为更好的生存期预测因子[20]。
列线图与其他的模型比较,在预测1 年、2 年生存率方面有最低的AICc 值、 最高的似然比和最高的C 指数值,说明模型预测的效能高,准确性高。 按照本模型,将所有肝癌患者分成高风险组和低风险组,低风险组的中位生存期更短,提示可能低风险组的患者TACE 手术的并发症风险增高,导致肝功能的恶化甚至死亡, 针对这部分患者, 说明TACE效果可能不佳,可以选择另外的治疗方式如系统治疗,以延长患者的生存期。
本研究为回顾性研究,部分数据不全的患者被排除,使得在患者的选择上可能存在偏倚;其次,采用首次TACE 的肿瘤应答作为与预后相关的因素,但有学者提出, 评估肝癌患者TACE 疗效的时机应是第2 次TACE 之后, 但这样会限制模型的应用;再次,本研究没有入组行载药微球(drug-eluting,DEB)-TACE 术的患者,有荟萃分析提出,肝癌患者行cTACE 和DEB-TACE 的生存期无明显差异。
综上所述,up-to-11 标准、AFP、 肿瘤应答是中期肝癌患者行TACE 治疗的预后的独立预测因素。基于这些预测因子建立的列线图预测模型能够筛选出哪些患者能从TACE 治疗中获益,并且能识别出哪些患者不适合TACE 治疗,从而转变成其他的治疗方式。