基于SEER数据库转移性胰腺腺癌患者早期死亡预测列线图模型构建和验证

2023-08-03 03:32:08钟佳俊叶艳清
世界华人消化杂志 2023年14期
关键词:线图胰腺癌腺癌

钟佳俊,叶艳清

钟佳俊,叶艳清,赣南医学院第一附属医院消化内科 江西省赣州市341000

0 引言

胰腺癌是一种高度侵袭性的恶性肿瘤,居世界癌症死亡原因第三位[1],胰腺癌在无症状癌症中排名第一,其中胰腺腺癌(pancreatic adenocarcinoma,PCa)占原发性胰腺癌的90%以上[2].胰腺癌早期症状隐匿,侵袭性高,超过50%的PCa患者在晚期才被诊断,其5年生存率不到8%[3].化疗一直是转移性胰腺腺癌(metastatic pancreatic adenocarcinoma,mPCa)一线治疗方案[4],mPCa患者在没有化疗的情况下只有2 mo-4 mo的中位预期寿命[5],然而mPCa患者即使接受积极治疗,其中位总生存期(overall survival,OS)仍短于12 mo[6].因此mPCa患者预后差,容易发生早期死亡(通常定义为初始诊断后3 mo内死亡[7]).然而,迄今为止,关于影响mPCa患者早期死亡因素的研究较少.因此,开发列线图以指导临床医生识别患者早期死亡的危险因素并实施个体化治疗具有重要意义.本研究以SEER数据库中诊断为mPCa的患者为研究对象,探讨早期死亡的危险因素,并构建列线图预测早期死亡(≤3 mo)的概率.

1 材料和方法

1.1 材料 使用SEER*Stat(版本8.4.0.1)从SEER数据库中提取2010-2015年诊断为Ⅳ期PCa患者的数据.纳入标准:(1)肿瘤部位代码: C25.0-C25.3和C25.7-C25.9;(2)组织学代码8140/3、8480/3、8481/3、8500/3和8521/3[根据国际肿瘤疾病分类第三版(ICD-O-3)].排除标准: (1)既往有恶性肿瘤病史;(2)通过死亡证明或尸检诊断;(3)种族信息不明;(4)T0分期患者;(5)远处转移相关信息缺失;(6)手术相关信息缺失;(7)死因不明;(8)年龄小于18岁.筛选流程见图1.最终共有18603例mPCa患者纳入研究,按照7:3比例随机分为训练集和验证集,训练集用来分析早期死亡的危险因素并建立列线图,验证集用来验证模型的准确性.该研究获得了美国国家癌症研究所(参考编号18558-Nov2021)对SEER计划中存储的研究数据的分析授权.

图1 患者纳入流程图.

1.2 方法 收集以下人口统计学和临床特征: 诊断年龄、种族、性别、肿瘤原发部位、肿瘤分化程度、T分期(AJCC第7版)、N分期(AJCC第7版)、骨转移、脑转移、肝转移、肺转移、手术、放疗、化疗、死因和生存时间.

统计学处理计数资料由数量和百分比(n,%)描述.训练集和验证集各因素之间比较采用χ2检验.利用单变量和多变量Logistic回归模型来识别与Ⅳ期PCa患者早期死亡独立危险因素,进而构建列线图.在训练集和验证集中绘制受试者工作特征曲线(receiver operating characteristic curve,ROC)和校准曲线对列线图的效能进行验证.决策曲线分析(decision curve analysis,DCA)用于评估模型的临床可用性.所有统计学分析均使用R软件(版本4.2.1)进行.P<0.05被认为具有统计学意义.

2 结果

2.1 人口统计学和临床特征 共有18603例mPCa纳入研究,10230名患者早期死亡(因PCa死亡9767例,其他原因死亡463例).大部分早期死亡出现在男性(54.5%)、白人(78.6%)和年龄在65岁至79岁(44.5%)之间的患者中.胰头(31.5%)是胰腺癌患者早期死亡的最常见肿瘤原发位置.除未知分化等级(81.2%)外,低分化/未分化mPCa与良好/中度分化mPCa的早期死亡率分别为11.4%和7.4%.早期死亡患者最常见的转移部位是肝脏(78.5%).在治疗方面,大多数早期死亡患者没有接受手术治疗(99.2%),只有少数患者接受放疗(3.2%)或化疗(31.0%).入选病例按照7:3的比例随机分组,13023名患者被随机分配为训练集,5580名患者被随机分配为验证集,两组患者在年龄、种族、性别、原发部位、分化程度、T分期(AJCC第7版)、N分期(AJCC第7版)、骨转移、脑转移、肝转移、肺转移、手术、放疗、化疗方面比较,差异均无统计学意义,训练集和验证集的随机分组具有可比性.表1显示mPCa患者早期死亡的发生率,表2总结了训练集、验证集中mPCa患者的人口统计学和临床特征.

表1 mPCa患者早期死亡的发生率

表2 训练集和验证集的人口统计学和临床特征

2.2 训练集中早期死亡的危险因素 训练集中单因素和多因素Logistic回归分析结果显示,年龄、性别、原发肿瘤部位、分化程度、T分期、N分期、骨转移、脑转移、肝转移、肺转移、手术、放疗、化疗是mPCa患者早期死亡的独立危险因素,见表3.

表3 训练集中转移性胰腺癌早期死亡风险因素的单变量和多变量Logistics回归分析

2.3 列线图模型构建 基于多因素Logistics回归分析确定的独立危险因素,构建了预测mPCa患者早期死亡的列线图(图2).列线图显示化疗是mPCa患者早期死亡最重要的影响因素,其次是手术、脑转移、年龄和放疗.在列线图中,可以通过将每个影响因素的分值相加来获得总分,然后可以估计早期死亡的概率.例如: 一名女性在70岁时被诊断为胰头癌和肝转移,中等分化,仅接受过化疗,使用该列线图预测的早期死亡概率约为24%.

图2 预测转移性胰腺腺癌患者早期死亡的列线图.

2.4 列线图模型的性能和验证 使用校准曲线评估模型的校准度.在本研究中,如图3A和B所示,训练集和验证集的校准曲线与45°对角线的吻合度较高,表明模型预测的mPCa早期死亡的概率与患者实际早期死亡概率相符,表明模型有良好的校准度.

图3 列线图的校准曲线.A: 训练集中列线图的校准曲线;B: 验证集中列线图的校准曲线.

使用ROC曲线评估模型的区分度.图4所示,训练集的ROC曲线下面积AUC为0.810(95%CI: 0.802-0.817),验证集的ROC曲线下面积AUC为0.802(95%CI: 0.790-0.813),表明模型具有良好的区分度.

图4 训练集和验证集列线图的ROC曲线.ROC曲线: 受试者工作特征曲线;AUC: ROC曲线下面积.

使用DCA评估模型的临床适用性.图5A和B所示,在训练集中预测早期死亡的最有利阈值概率为0.1-0.9.正如有利的阈值概率所证明的那样,它表明列线图可以帮助临床医生准确地评估mPCa患者的早期死亡.并且与TNM分期相比,本研究中的列线图模型在预测早期死亡方面有更高的临床净收益.

图5 列线图与TNM分期相比临床净效益的决策曲线分析曲线.A: 训练集中列线图与TNM分期比较;B: 验证集中列线图与TNM分期比较.

3 讨论

胰腺癌是最致命的恶性肿瘤之一.据统计,2020年全球新发胰腺癌病例超过49万例,并且有46万例胰腺癌患者死亡[8],随着医疗水平的进步,大多数癌症的的存活率得到了明显的提高,但胰腺癌的存活率却一直没有明显的改善[9].早期诊断或者发现新的治疗方案是改善胰腺癌预后的理想方法.Valeria Tonini和Manuel Zanni回顾并总结了所有关于胰腺癌风险因素和筛查方式的最新研究、包括液体活检在内的新实验室测试、新的成像方法以及人工智能和机器学习的可能应用,然而遗憾的是直到2022年胰腺癌预后并没有得到明显的改善[10].手术切除是唯一可能治愈PCa的治疗方法[10],然而超过50%的胰腺癌患者在诊断时就属于晚期,因此失去了手术彻底治愈的机会[11].对于无手术机会的mPCa患者,目前一线治疗有以下三种选择: 吉西他滨单药治疗,FOLFIRINOX方案以及吉西他滨加白蛋白-纳米颗粒结合紫杉醇(nab-紫杉醇)的组合[12].有许多Ⅲ期试验证明了吉西他滨的有效性,其1年总生存率为18%-20%,中位OS约为6 mo[13,14].而没有接受化疗的mPCa患者中位生存期约2 mo-4 mo[5].Ⅲ期MPACT试验对吉西他滨加nab-紫杉醇与吉西他滨单药进行了比较.该试验显示,与单药治疗相比,吉西他滨加nab-紫杉醇治疗的患者中位生存期显著改善(8.5 mo:6.7 mo;HR: 0.72;P<0.001)[15].FOLFIRINOX方案中5-FU、伊立替康和奥沙利铂的组合是mPCa治疗的里程碑.在PRODIGE 4组试验中,该联合方案与吉西他滨单药治疗相比,中位生存期得到改善(11.1 mo:6.8 mo;HR: 0.57;P<0.001)[13].然而与其他癌症相比,mPCa一线治疗的方案对中位生存期的改善并不令人满意[16].根据本研究中从SEER数据库提取的数据得知,超过50%的mPCa患者发生了早期死亡,然而大多数关于PCa预后的研究都集中在患者的长期生存[17,18]和可切除PCa早期死亡的相关危险因素[19,20],关于mPCa患者早期死亡的研究还很少,因此,在这项研究中,我们基于mPCa患者早期死亡的独立危险因素建立了预测列线图,以预测mPCa患者是早期死亡的概率.

本研究通过单因素和多因素Logistic回归分析发现,多个人口统计学特征和临床因素是mPCa早期死亡的危险因素,包括年龄、性别、肿瘤部位、分化程度、T分期、N分期、骨转移、脑转移、肝转移、肺转移、手术、放疗、化疗.与传统TNM分期一样,肿瘤患者的预后与肿瘤浸润、淋巴结转移和远处转移密切相关[20].在本研究中,高龄、男性有更大的早期死亡风险,这与以往的研究一致[21],而且老年患者通常基础状况较差,伴随多种慢性疾病,如高血压、糖尿病、冠心病等,对治疗耐受差,且更容易出现各种并发症,各种因素导致老年患者生存时间减少.在临床因素方面,化疗是影响mPCa患者早期死亡最重要的危险因素,接受化疗的mPCa患者早期死亡风险明显降低,有研究表明使用FOLFIRINO方案或吉西他滨/NAB-紫杉醇化疗方案可显著提升2 mo-4 mo的总生存期[22],但这些化疗方案具有很强的细胞毒性,并且耐药性较高,导致mPCa患者长期生存率仍然很低[23],需要进一步开发新型抗癌药,以较小毒性提供疗效.手术对改善mPCa的早期死亡也有重要影响,目前有一些研究强调了手术在晚期,特别是在孤立性远处转移性胰腺癌中的获益[24,25].然而,在我们的研究中接受手术的患者数量很少,根据患者的临床状况设定严格的mPCa手术适应症可能更为谨慎.因此,需要大型前瞻性试验来揭示手术对mPCa的价值.

在我们的研究中,列线图是根据SEER数据库中大量样本数构建的,这表明结果是客观和稳定的.训练集和验证集的AUC分别为0.810和0.802,表明列线图在辨别和准确性方面表现良好.为了进一步明确列线图所能带来的临床获益,我们绘制了DCA曲线,一种用于检查诊断测试和预测模型效率的高级工具[26],结果表明,列线图在预测效率和临床应用方面表现良好,而且此模型相对于TNM分期能为患者带来更高的临床益处.作为回顾性研究,我们的研究有不可避免的局限性: (1)SEER数据库中缺乏一些可能与早期死亡有关的潜在危险因素,如患者既往史、BMI、不良习惯(吸烟、饮酒史)、并发症、放化疗具体方式等;(2)这是一项回顾性研究,删减数据引起的选择偏倚是不可避免的,需要前瞻性研究进一步论证;(3)尽管内部验证表明列线图模型具有良好的预测能力,但仍需要多中心和大样本量数据进行外部验证以避免过度拟合.

4 结论

总之,基于SEER数据库提供的大样本量数据,确定了转移性胰腺腺癌患者早期死亡的危险因素,并制定了列线图.内部验证结果表明,列线图具有良好的区分度和准确度,相比TNM分期能带来更高的临床获益.列线图可以帮助肿瘤学家和临床医生更快、更准确地识别早期死亡的危险因素和概率,从而制定更精确的个体化治疗计划,从而提高患者的生存概率和生活质量.

文章亮点

实验背景

胰腺腺癌是一种高度致命的恶性肿瘤,病死率较高,且临床实际工作中超过50%的患者在晚期被诊断,生存期有限,早期死亡风险大,目前关于晚期胰腺腺癌患者的短期生存研究较少,本研究通过构建晚期胰腺腺癌患者早期死亡预测列线图模型,有助于在临床上为患者制定更精确的个体化治疗.

实验动机

探究影响晚期胰腺腺癌患者早期死亡的危险因素并构建预测列线图,帮助临床医生识别早期死亡高危患者,从而准确选择个体化的治疗方案.

实验目标

对SEER数据库提供的大样本量数据进行统计分析确定晚期胰腺腺癌患者早期死亡的独立危险因素,构建晚期胰腺腺癌患者早期死亡预测列线图,并验证了其效能及临床的适用性.

实验方法

研究中将所入选的晚期胰腺腺癌病例按照7:3的比例随机分为训练集和验证集,对验证集进行单变量和多变量Logistic回归分析来识别晚期胰腺腺癌患者早期死亡的独立危险因素,进而构建列线图.基于训练集和验证集绘制ROC曲线和校准曲线对列线图的效能进行验证.绘制决策曲线分析(decision curve analysis,DCA)用于评估列线图的临床可用性.

实验结果

研究结果表明年龄、性别、肿瘤部位、肿瘤分化程度、T分期、N分期、骨转移、脑转移、肝转移、肺转移、手术、放疗、化疗是晚期胰腺腺癌患者早期死亡的独立危险因素,所开发的胰腺腺癌患者早期死亡预测列线图经过内部验证后结果表明其在辨别和准确性方面表现良好,对临床抗肿瘤治疗提供个体化方案具有一定指导作用.

实验结论

基于SEER数据库提供的大样本量,确定了晚期胰腺腺癌患者早期死亡的危险因素,其中化疗是影响晚期胰腺腺癌患者早期死亡最重要的影响因素,其次是手术治疗,表明手术在晚期胰腺腺癌尤其是孤立性远处转移性胰腺腺癌中可能获益,未来可能还需要大型前瞻性实验来揭示手术对晚期胰腺腺癌的价值.DCA模型结果亡显示与TNM分期相比,本研究中的列线图模型在预测早期死方面有更高的临床净收益.列线图具有显著较高的准确性,可以帮助肿瘤学家和临床医生更快、更准确地识别早期死亡的危险因素和概率,制定更精确的个体化治疗计划,从而提高患者的生存概率和生活质量.

展望前景

未来进一步研究可吸取经验,多中心纳入病例,进行大样本量研究进行外部验证避免过度拟合,进一步证明列线图良好的预测能力.

猜你喜欢
线图胰腺癌腺癌
个体化预测结肠癌术后发生并发症风险列线图模型的建立
胰腺癌治疗为什么这么难
保健医苑(2022年6期)2022-07-08 01:25:22
基于箱线图的出厂水和管网水水质分析
供水技术(2020年6期)2020-03-17 08:18:36
益肺解毒方联合顺铂对人肺腺癌A549细胞的影响
中成药(2018年7期)2018-08-04 06:04:18
东山头遗址采集石器线图
STAT1和MMP-2在胰腺癌中表达的意义
天津医药(2016年9期)2016-10-20 03:19:39
HIF-1a和VEGF-A在宫颈腺癌中的表达及临床意义
西南军医(2016年3期)2016-01-23 02:17:47
早诊早治赶走胰腺癌
上海工运(2015年11期)2015-08-21 07:27:00
GSNO对人肺腺癌A549细胞的作用
老年胃腺癌中FOXO3a、PTEN和E-cadherin表达的关系
西南军医(2014年5期)2014-04-25 07:42:32