李皇保,周俊,吴晓俊,赵凤庆,闵捷
(嘉兴市第一医院 肝胆外科,浙江 嘉兴 314000)
胆囊癌起病隐匿,发现时超过一半的患者已发展至TNM IV期[1],因此预后差。即使是手术后的患者,5年生存率仅有20%左右[2]。对预后的准确判断是制定术后后续治疗方案的重要条件,因此患者预后情况评估方法的可靠度和准确性至关重要。TNM分期虽然可以对治疗进行指导,但是它纳入的危险因素仅有肿瘤侵犯范围、淋巴结转移、远处转移等,对预后预测的准确性不足,且无法实现可视化及个体化应用[3]。
列线图是一个能综合分析预后危险因素从而进行可视化、个体化评估的方法[3]。但是在胆囊方面,目前仅发现少量的相关研究[4-6],而且由于数据结构及适用范围的原因,这些研究的局限性均较大。本研究提取SEER(Surveillance,Epidemiology,and End Results Program)数据库中胆囊癌患者的临床病理数据,评估影响预后的危险因素,并在此基础上建立列线图,从而为临床医师对胆囊癌预后判断及治疗提供参考。
使用SEER*stat软件从数据库提取数据,提取条件为“发病部位:胆囊;诊断年份:2004至2014年;既往无肿瘤病史,胆囊癌为首发原发肿瘤”,提取变量为“病案号、登记地址(州)、性别、年龄、种族、婚姻、诊断年份、分化等级、手术方式、区域淋巴结检出数、区域淋巴结阳性数、肿瘤直径、侵袭范围、转移情况、病理类型、TNM分期(因第六版TNM分期在数据库中数据完整性较好,故本文TNM分期参照第六版)、疾病相关生存状态、生存时间”。
纳入标准:手术方式根据数据库手册选择行胆囊根治性切除术[RX Summ-Surg Prim Site(1998+):40,50,60];既往无肿瘤病史,且胆囊癌为首发原发恶性肿瘤。诊断年份为2004至2014年。
排除标准:SEER数据库目前更新至2014年12月,共获得7 943例胆囊癌患者数据。为使所有患者获得至少1年以上随访,排除诊断年份为2014年者;同时剔除30 d内死亡者、各变量中有缺失值者及随访信息不完整者的数据,获得2004年1月至2013年12月具有完整信息的有效数据832例。
SEER数据库记录了美国18个州的肿瘤患者信息及随访信息,通过整群随机抽样法,选取11个州的608例患者作为训练集,另外7个州(Connecticut,Hawaii, Iowa, New Jersey, New Mexico, Rural Georgia, San Jose-Monterey)的224例患者作为验证集,训练集与验证集的特征对比详见表1。
数据库数据每年连续随访,随访内容包括死亡时间(精确到月)、生存状态,其中死亡类型包括总死因死亡与疾病相关死亡,本研究采用疾病相关死亡为终止事件,随访时间截止为2014年12月。
统计分析应用SPSS 22.0(IBM Corporation,Armonk,NY,USA)软件包实现。在患者基线资料中,非正态分布变量采用Mann-Whitney U检验,分类变量采用χ2检验。为使变量可纳入列线图分析,连续性变量采用X-tile软件(Rimm Laboratory,Yale School of Medicine,New Haven,CT,USA)获取最佳截取值转换为分类变量[7]。寿命表法计算1、3、5年生存率,Cox比例风险回归模型筛选影响预后的独立危险因素。列线图的绘制使用R语言(The R Project for Statistical Computing,Vienna,Austria)的survival包及rms包实现,变量得分使用nomogramEx包计算。列线图的准确性通过一致性指数(C-index)及校正曲线判断[8]。内部验证通过Bootstrap法重复取样1 000次自检完成,外部验证通过验证集进行验证。本研究与AJCC分期的预测能力比较采用R语言的rcorrp.cens函数实现。P< 0.05为差异有统计学意义。
通过提取SEER数据库2004年1月至2014年12月的胆囊癌数据,42.6%(3 387/7 943)的胆囊癌诊断时为TNM IV期,接受根治手术者占49.0%(3 894/7 943)。剔除各个变量中含有缺失值的数据后共有832例患者纳入研究,根据整群随机抽样法,608例患者进入训练集,224例患者纳入验证集。各组的临床病理资料详见表1。训练集与验证集的基本资料差异不明显,只有种族及远处转移两个变量有统计学差异(P<0.05)。在对变量进行分组时,根据侵袭范围绘制的Kaplan-Meier生存曲线中侵犯至胆囊肌层外结缔组织以内的各组(黏膜层、肌肉固有层、胆囊肌层外结缔组织)的曲线有较多重合及交叉,故将以上3组合并成“肌肉层外结缔组织”组。
表1 训练集及验证集患者临床病理基线资料
训练集患者的中位疾病相关生存(disease-specific survival,DSS)期为22.07个月,术后1、3、5年DSS率为67.6%、36.8%、29.2%。多因素回归分析提示性别、年龄、分化程度、淋巴结转移、肿瘤直径、侵袭范围、远处转移是影响预后的独立危险因素(P<0.05),病理类型、婚姻状态、种族、区域淋巴结检出数等因素与预后无统计学相关性(P> 0.05)。Cox多因素回归分析见表2。
表2 DDS Cox多因素回归分析
列线图基于上述独立危险因素绘制,见图1,内部验证的C-index为0.76(95%CI0.74~0.78),术后5年DSS校正曲线提示在观察值与预测值之间有良好的一致性(图2A)。AJCC分期的C-index为0.70(95%CI0.67~0.73),本列线图的预测能力优于AJCC分期,两组之间比较有统计学意义(P< 0.001)。根据各变量的相应回归系数,由R语言nomogramEx包计算各变量相应得分,见表2,每个患者可基于列线图或根据表2中单个变量的得分计算总分,然后根据总分在列线图上获取对应的1、3、5年预测生存率。例如某患者男,65岁,病理分级中分化,伴淋巴结转移,肿瘤直径2 cm,侵犯浆膜层,无远处转移,则可以通过以上各变量在列线图“评分”线上寻找对应的得分,或直接从表2中获取变量的对应得分,这两种方法是等效的。根据各变量的得分计算总分为31.5+0+0+80+0+50+0=161.5,然后在“总分”线上找到161.5,做一条向下垂直线,得到该患者1、3、5年的生存率约为72%、36%、27%,该预测值的准确性为76%(C-index值)。
验证集的中位DSS生存期为25.14个月,术后1、3、5年DSS相关生存率为71.0%、38.7%、30.5%。外部验证C-index为0.73(95%CI0.68~0.78),以5年生存率为例,外部验证与训练集的一致性较好(图2B)。
图1 DSS列线图(pDSS:预测疾病相关生存率)
图2 列线图校正曲线
在本研究中,我们从SEER数据库中提取信息完整的胆囊癌根治手术后的患者资料共832例,其中608例患者作为训练集,224例患者作为外部验证集。经过Cox回归分析,我们纳入7个影响预后的独立危险因素作为列线图的变量,经过验证,本列线图显示出较高的准确度,与既往的预后评估方法(AJCC分期)相比,其优势体现在可视化、个体化,可为个体的胆囊癌患者预后评估提供指导。
根据Cox回归分析,我们发现性别、年龄、分化程度、淋巴结转移、肿瘤直径、侵袭范围、转移情况等是影响根治性切除术预后的独立危险因素。其中分化程度、淋巴结转移、肿瘤直径、侵袭范围、远处转移等因素对预后的影响已获得广泛认同[9-10]。在既往的研究中,性别及年龄对预后的影响存在争议,国内的研究普遍认为性别、年龄对预后无影响[11-13],而部分国外的文献则提示男性、高龄为危险因素[14-15],本研究提示女性的发病率虽然高于男性,但是预后好于男性,与国外的研究结论相符。另外随着分组年龄的增加,患者预后变差,年龄对预后的影响可能来源于高龄导致的全身机能减退及其他合并症对寿命的影响[16]。国内研究结果的差异可能与纳入的病例数较少有关。
基于以上预后独立危险因素,本研究建立了预测胆囊癌术后DSS生存率的列线图。建立的列线图在预测准确性上表现出色,训练组的内部验证和验证组的外部验证C-index分别是0.76和0.73,5年生存率的校正曲线也显示列线图预测的疾病相关生存率与实际观察的生存率一致性较好。目前国内有一篇基于淋巴结转移率的胆囊癌列线图文献,但是该文过于强调淋巴结转移率的作用,忽略了其他影响预后的变量,而且并未进行验证,存在较多不足[17]。通过检索PubMed数据库,也仅发现少量相关研究,其中两篇研究用于评价术后放化疗效果,而且第一作者为同一个研究者[5-6],一篇用于预测磁化胆囊患者中早期胆囊癌的发生情况[4]。我们根据临床工作中易于获取的临床病理因素建立的列线图弥补了以上文献的不足,可在预后评估时发挥重要作用。
本列线图对胆囊癌术后患者预后的预测准确性(C-index 0.76)优于传统的AJCC分期(C-index 0.70)。传统的AJCC分期主要基于胆囊癌侵袭深度、淋巴结转移情况及远处转移情况,虽然能够对预后及后续治疗提供给指导,但是影响预后的因素还包括性别、年龄、分化程度及肿瘤直径等,在对患者的预后评估中,应充分考虑以上因素。我们的研究也证明,在纳入以上因素后,列线图的预测准确性有所提高。而且以上因素在根治性手术患者中易于获取,在临床工作中具有很好的实用性。
尽管我们提供了一个准确性较高的列线图模型,但是该模型还有以下不足。首先,其他影响预后的因素如放化疗情况、靶向治疗、炎症状态等由于数据库本身的缺陷未纳入。其次,虽然该列线图进行了外部验证且验证证明一致性较好,但数据均来源于美国,如果有东方人种的数据进行进一步的验证,可能效果更好。
综上所述,性别、年龄、分化程度、淋巴结转移、肿瘤直径、侵袭范围、转移情况等是影响预后的独立危险因素。基于以上因素建立的列线图能较准确、直观地个体化预测胆囊癌术后患者的疾病相关生存率。
感谢美国国立肿瘤研究所SEER数据库提供的开放获取数据。