基于SEER数据库构建的远处转移性乳腺癌的预后列线图

2022-08-31 02:04章锐阮剑赵建国
安徽医药 2022年9期
关键词:转移性线图生存率

章锐,阮剑,赵建国

乳腺癌是全世界女性中最常见的恶性肿瘤,也是导致癌症死亡的第2 大原因[1],从1976 年至2009年,50 岁以下女性乳腺癌的发病率以每年0.2%的速度增长,而在被确诊为乳腺癌的病人中,远处转移的发病率则以每年约2%的速度增长[2]。各期乳腺癌的5 年相对生存率为89.7%,而晚期乳腺癌的预后较差,5 年生存率仅为26.9%[3]。晚期乳腺癌包括远处转移和局部晚期乳腺癌,目前远处转移性乳腺癌仍然是无法治愈的疾病,激素受体阳性并且人表皮生长因子受体2(Her-2)阴性的晚期乳腺癌比其他类别的晚期乳腺癌具有更好的生存率[3-4],但是晚期乳腺癌(远处转移性乳腺癌)个体化的预后并不明确。

列线图是一个能综合分析预后危险因素,从而进行可视化、个体化评估的方法,目前被广泛用于各种类型的癌症[5-6],但是在远处转移性乳腺癌方面,仅发现极少量的研究。本研究基于SEER(The Surveillance,Epidemiology,and End Results)数据库首次较好地建立远处转移性乳腺癌的预后列线图,根据SEER 数据库中远处转移性乳腺癌病人的临床病理资料,以确定该模型可以较为准确地预测病人的存活率,从而为临床医师对远处转移性乳腺癌预后判断及治疗提供参考。

1 资料与方法

1.1 数据资料获取使用SEER*stat 软件从数据库中提取数据,提取条件为“(1)发病部位:乳腺;(2)性别:女性;(3)诊断年份:2010—2012 年;(4)既往无肿瘤病史”,提取变量为“病人ID、生存时间、生存状态、年龄、种族、婚姻状态、组织学分级、原发灶是否手术、雌激素受体(ER)状态、孕激素受体(PR)状态、Her-2状态、第七版美国癌症联合委员会(AJCC)T 分期、第七版AJCC N 分期、有无骨转移、有无脑转移、有无肝转移、有无肺转移”。本研究符合《世界医学协会赫尔辛基宣言》相关要求。

1.2 纳入、排除标准纳入标准:为保证所有病人均随访5 年以上,选择诊断年份为2012 年前的乳腺癌;远处转移数据库中SEER combined mets at DXbone/brain/liver/lung(2010+)为2010年后的乳腺癌。共获得临床资料完整的139 584 例女性乳腺癌病人。排除标准:生存时间为0,无远处转移。获得2010 年1 月至2012 年12 月具有完整临床信息的有效数据3 989例。

1.3 数据分组通过整群随机抽样法[7],以3∶1 分组,从3 989 例病人选2 993 例为建模组,996 例为验证组。

1.4 统计学方法采用SPSS 25.0 统计分析危险因素,变量分组计数后采用χ2检验,多变量分析采用Cox 比例风险回归模型筛选影响预后的独立危险因素,按照文献[5-6]中的方法基于多变量分析的结果使 用R 版 本3.6.2(https://www.r-project.org/)中 的“rms”包和“survival”包绘制列线图。列线图的准确性通过C 指数和校准曲线进行衡量,C 指数越大(接近1),预后预测越准确。内部验证通过Bootstrap 法重复取样1 000 次自检完成,对列线图的外部验证通过验证组进行验证。受试者工作特征曲线(ROC曲线)下面积用于评估模型预测远处转移性乳腺癌预后的准确性。P<0.05被认为差异有统计学意义。

2 结果

2.1 两组的临床病理资料两组临床病理资料差异无统计学意义(P>0.05),见表1。

2.2 Cox 比例风险回归分析分析提示年龄、婚姻状态、种族、组织学分级、ER 状态、PR 状态、Her-2状态、T 分期、原发灶是否手术、骨转移、脑转移、肝转移、肺转移是影响预后的独立危险因素(P<0.05),其中相对于年轻(<35岁),年老(>49岁)是远处转移性乳腺癌病人预后的危险因素(P<0.05);Her-2阴性相对于Her-2 阳性是预后的危险因素(P<0.05);原发灶手术相对于原发灶不手术具有更低的风险比(P<0.05);N 分期与预后相关性差异无统计学意义(P>0.05)。Cox单因素和多因素回归分析见表2。

2.3 远处转移性乳腺癌生存预后列线图及其内/外部验证基于Cox 比例风险回归分析绘制列线图,见图1。内部验证的C指数为0.702[95%CI:(0.696,0.708)],远处转移性乳腺癌校准曲线提示在观察值与预测值之间的一致性:1年和3年生存率一致性良好,5年生存率一致性较好,见图2。外部验证C指数为0.707[95%CI:(0.706,0.708)],1年和3年生存率外部验证一致性良好,5年生存率一致性较好,见图3。

2.4 远处转移性乳腺癌建模组和验证组的ROC 曲线建模组和验证组的校准图提示该临床预测模型在1 年和3 年的预测结果与实际观测数据具有良好的一致性。建模组1 年、3 年、5 年的ROC 曲线下面积分别为0.8、0.7、0.7,验证组的1 年、3 年、5 年的ROC 曲线下面积分别为0.8、0.8、0.695,也证实了该模型能够准确预测远处转移性乳腺癌的预后,尤其是1年和3年预后。

3 讨论

随着乳腺癌药物治疗的研究发展及相关临床试验的开展,乳腺癌的远处转移率及死亡率显著下降,但是远处转移仍然是乳腺癌病人致死的主要原因[8-9],远处转移的预后不良,其5 年生存率约为27%,脑转移乳腺癌病人预后最差,中位总生存时间为10 个月[95%CI:(9,12)个月][10]。乳腺癌的随访研究不仅能及早发现复发及转移,并且能从中不断总结经验,完善诊治。SEER 数据库涵盖了大约28%的美国人口的癌症治疗随访数据[11],该数据库中获得的研究数据代表了该人群的流行病学状况,在癌症监测科学以及收集、分析、解释和传播可靠的基于人口的统计数据方面处于国家领导地位。SEER 数据库收集的癌症数据中免疫组化从2010年开始录入,癌症结局包括死亡与否以及死亡原因,对研究复发、转移或进展有限制,但该数据库对预后研究具有较大的指导意义。

据文献报道,晚期乳腺癌的预后与以下变量有关:肿瘤的分型、年龄[12]、生理机能、转移的器官、全身化疗、原发灶手术切除、原发灶的大小、孤立转移/多发转移,因此此次模型建立时纳入了在晚期乳腺癌的生存方面存在差异的因素。在文献中,年龄<50 岁较>50 岁,局部无复发生存更高,>65 岁是晚期乳腺癌生存的不利因素[12]。在本研究中证实年龄同样是晚期乳腺癌预后的重要因素,较大年龄(>49岁)是转移性乳腺癌的危险因素,而在早期乳腺癌

复发风险分层中,<35 岁作为复发的危险因素之一,此次研究侧重于转移性乳腺癌的预后分析,虽然年轻病人复发转移概率较高,但其对后期治疗的耐受性更好,年龄越大(>49 岁)出现治疗不能耐受的可能越大,所以其预后更差。Her-2 阳性乳腺癌的预后优于三阴性乳腺癌[4,13],Her-2 阳性晚期乳腺癌的4 年总生存为31%~70%[14],三阴性晚期乳腺癌的中位生存时间仅为18~25个月[15],我们分析发现Her-2阳性远处转移性乳腺癌病人预后优于Her-2 阴性远处转移性乳腺癌[16],可能得益于Her-2 阳性乳腺癌靶向治疗的多样性、有效性、安全性[17-19]。我们构建了预测远处转移性乳腺癌生存预后的列线图,列线图通过建模组的内部验证和验证组的外部验证,并且通过校准和判别评估性能。校准曲线是用于评估列线图的估计风险和观察风险之间的一致性,保证所建立的列线图的可靠性。在远处转移性乳腺癌预后列线图的部分文献中报道其C 指数<0.700[13],而本研究列线图的内部验证和外部验证的C 指数分别是0.702 和0.707,高于之前的研究,并且3 年生存率的校准曲线显示生存一致性良好,表明列线图对转移性乳腺癌具有很高的预测能力,而5年生存率的校准曲线一般的主要原因在于远处转移性乳腺癌病人(肝、肺、脑转移)5年生存率极低。

表2 建模组2 993例远处转移性乳腺癌病人预后影响因素Cox单因素和多因素回归分析

图1 远处转移性乳腺癌预后列线图

图2 建模组远处转移性乳腺癌1年(A)、3年(B)、5年(C)预测生存的校准曲线

图3 验证组远处转移性乳腺癌1年(A)、3年(B)、5年(C)预测生存的校准曲线

尽管我们提供了一个准确性较高的列线图模型,但是该模型仍有较多不足。因临床资料来源于SEER 数据库,而针对乳腺癌的化疗、靶向治疗、放疗等关键性的治疗方案并不能从该数据库中获得,所以在一致性上只能达到0.7 左右,如果能够将乳腺癌的相关治疗纳入其中,可能预测效果更好。

综上所述,年龄、种族、婚姻状态、组织学分级、原发灶是否手术、ER状态、PR状态、Her-2状态、T分期、骨/脑/肝/肺转移是影响预后的独立危险因素,基于以上因素建立的列线图能较为准确、直观地个体化预测远处转移性乳腺癌病人的生存率。

猜你喜欢
转移性线图生存率
SPECT/CT显像用于诊断转移性骨肿瘤的临床价值
『5年生存率』啥意思
“五年生存率”不等于只能活五年
晚期乳癌五大迷思与预防
日本首次公布本国居民癌症三年生存率
日本癌症患者十年生存率达59%左右
伊立替康治疗转移性结直肠癌的临床观察
转移性收入在居民收入分配中的作用
——中国居民收入分配中的逆向调节机制
一类图及其线图的Wiener指数