食管癌患者术后预测模型的构建和验证:基于SEER数据库

2022-06-30 08:35王高明胡力文
南方医科大学学报 2022年6期
关键词:线图队列生存率

食管癌是癌症死亡的第8大原因,2012年在全世界造成40万人死亡。预后不良与淋巴结转移或远处转移及体质量减轻有关。据报道,食管癌患者5年总生存率低于20%。目前,外科手术被认为是食管癌最重要的治疗方法之一,尽管随着外科技术的发展,术后5年总生存率逐年提高,但仍低于40%。近几年来,围手术期放化疗在食管癌的治疗中得到了越来越多的应用。新辅助放化疗改善了食管癌患者预测总生存率(OS),但也可能增加术后死亡率。我们希望利用SEER数据库中的放疗和化疗数据了解围手术期放化疗对食管癌预后的影响。

经济水平的提升,让学生的物质生活水平也相应提高,尤其是家庭经济生活水平较高的学生手中有了更多可供学生支配的钱财。但是,即便是在这种经济水平背景下,学生仍然没有理财意识,节约意识更是十分低下,而学生的消费中,也存在一定的从众心理,往往不管自己的需求,而是看着他人购买了某种物品,基于从众心理,自己也有拥有相应的物品,更有部分学生在消费和购物中存在求异心理,希望自己的物品时独一无二、与众不同的,所以更加崇尚舶来品,通过特殊的渠道中购买更具个性化的物品,这也导致了学生的消费出现非理性,购买心理畸形的现状。所以,即便是目前学生拥有了一定的金钱,也难以在学生的节俭和理财意识下保存下来,而是更多的挥霍。

TNM分期系统目前已广泛应用于临床实践中,一些研究人员认为在预测癌症生存率时应考虑其他重要的风险因素,如年龄、肿瘤位置、肿瘤大小和围手术期放化疗。近年来,列线图广泛应用于预测许多类型的癌症的预后,如胰头癌,乳腺癌,肾癌,胃癌等,其中一些研究结果表明列线图的预测效能比现有TNM分期更有优势。然而,列线图在食管癌领域应用较少,且以往的大多数研究中仅考虑了基于Kaplan-Meier和Cox分析的OS,而没有考虑基于竞争风险模型的癌症特异性生存率(CSS)。因此,一个更准确的食管癌临床列线图是迫切需要的。我们希望基于监测、流行病学和最终结果(SEER)数据库,构建食管癌患者术后远期生存的列线图,用于预测术后1年、3年、5年的OS和CSS。

1 资料和方法

1.1 研究对象

监测、流行病学和最终结果(SEER)数据库(https://seer.cancer.gov/)是一个基于美国人群的癌症注册数据库。我们使用SEER*Stat 软件(版本8.3.6.1)提取2004年~2016年间确诊为食管癌的患者信息。外部验证所用的数据来自于东部战区总医院心胸外科数据库,提取了2014年~2016年间确诊的食管癌的患者信息。用于分析的危险因素包括年龄、性别、种族、分化程度、肿瘤部位、病理类型、肿瘤大小、TNM分期、放疗、化疗和区域淋巴结。淋巴结比率(LNR)定义为阳性淋巴结数量与清扫淋巴结的比率。结局变量包括总生存率和癌症特异性生存率。纳入标准:年龄≥18岁;食管癌诊断经组织病理学证实;首诊为食管癌且为原发灶;接受了食管癌切除术。排除标准:TNM分期资料缺失的患者;未行区域淋巴结清扫或数目不清的患者;仅接受内镜治疗的患者;无CSS数据的患者;随访数据不完整的患者。

1.2 伦理审查

我们从SEER数据库获得了访问和使用数据的签名授权和许可,并在整个过程中遵守协议,以保护患者隐私。此外,我们回顾性地收集东部战区总医院病历系统中的数据,所有患者的个人信息均匿名化处理,因此东部战区总医院伦理审查委员会批准了对这项研究的伦理要求,并豁免了获取患者书面知情同意的要求。本研究是根据修订版《赫尔辛基宣言》进行的。

1.3 统计学分析

Stata/SE 16.0(Stata Corp LLC,USA)用于数据分析。R for windows(版本4.0.0)则用于列线图的开发和验证。X-tile 3.6.1(Yale University School of Medicine,USA)用于确定肿瘤大小和LNR等连续变量的最佳截断值。双侧<0.05定义为差异具有统计学意义。使用自助重抽样方法,将SEER数据库提取的患者按照7∶3分配为训练队列和内部验证队列,东部战区总医院心胸外科数据库提取的患者为外部验证队列,分别用于构建和验证列线图。采用Kaplan-Meier方法比较食管癌患者不同组之间的OS差异,并用log-rank检验差异是否具有统计学意义。竞争风险模型应用Fine和Gray检验分析CSS,采用累积发病率函数(CIF)比较食管癌患者不同组之间的CSS差异,并用Fine和Gray检验差异是否具有统计学意义。分别采用多因素Cox回归分析模型、竞争风险模型确定影响OS和CSS的独立预测因素,并用于构建列线图。我们采用了Harrell一致性指数(C-指数)和校准曲线评估列线图的预测效能,同时还采用了ROC曲线来比较列线图和TNM分期系统预测准确性的差异。

ROC曲线用于比较已建立的列线图和TNM分期系统之间的鉴别准确性差异,我们绘制了内部验证队列(图8)和外部验证队列(图9)中列线图和TNM分期分别预测1年、3年、5年OS和CSS的ROC曲线,并计算其AUC值。结果表明,本研究中建立的列线图在预测1年、3年、5年OS和CSS的预测效能均高于TNM分期系统。

2 结果

2.1 患者特征

1.在构建安居乐业、文明祥和的社会生活共同体上,社会环境更加和美幸福。加快形成“社会安全”得以全面维护的“平安”环境,即社会矛盾得以化解,社会冲突得以调适,社会正义得以伸张,社会公平得以体现,社会富裕得以保障,社会和美得以实现,使以“安定”为基本目标的“治安”、“稳定”转向以“安康”为目标的“平安”、“和美”。

我们最终从SEER 数据库中确定了7215 名患者(训练队列:5052名;内部验证队列:2163名),从东部战区总医院心胸外科数据库中确定了435名患者作为外部验证队列,选择流程图如图1所示,患者特征如表1所示。SEER数据库中6086名患者(84.4%)为男性,4584名患者(63.5%)年龄超过60岁;5656名患者(78.4%)肿瘤位于下段食管;白人占整个群体的90%;超过一半的研究人群接受了围手术期放疗(65.0%)和化疗(70.6%);在所有病理类型中,食管腺癌占74.3%。近一半的患者在确诊时分期较晚(III~IV期,46.3%);有2723例(37.8%)区域淋巴结阳性,其中2459例(34.1%)LNR高于0.05。与SEER数据库相比,外部验证队列数据库中370名患者(85.1%)为男性,267名患者(61.4%)年龄超过60岁;341名患者(78.4%)肿瘤位于下段食管;外部验证队列的人种均为黄种人;接受围手术期放疗(63.0%)和化疗(69.7%);食管腺癌在所有病理类型中占73.8%。患者在确诊时分期较晚(III~IV期)占47.4%;有177名患者(40.7%)区域淋巴结阳性,其中159名患者(36.6%)LNR高于0.05。

整个研究队列的中位随访时间为26个月(间距:1~155个月),在随访期间共发生3983例死亡,包括3209例癌症特异性死亡和774例其他原因死亡。1年、3年、5年的癌症特异性死亡率分别为14.6%、35.7%、41.6%,竞争性死亡率分别为3.2%、6.2%、7.8%。

训练队列、内部验证队列和外部验证队列中列线图的C指数均大于0.70,表明本研究构建的列线图对预测食管癌患者术后1、3、5年OS和CSS均具有令人满意的预测准确性。此外,ROC曲线显示,列线图的预测效能高于现有TNM分期系统。我们通过校准图证实了列线图的预测概率和患者实际概率之间的具有很好的一致性。除性别和肿瘤分化程度外,其他危险因素在竞争性死亡率中均显示出统计学意义,这一结果与He等人的结果相似。在一些研究中,年龄被认为是竞争性死亡的一个相当重要的因素,他们认为随着年龄的增长,老年患者比年轻患者更容易死于心力衰竭、呼吸衰竭、中风、跌倒和其他原因。近年来,少肌症的概念逐渐被临床医生熟知,据报道,少肌症在食管癌患者中发病率约14.4%~80%,合并少肌症的食管癌患者术后并发症发病率升高,且具有较差的远期生存。

对训练队列进行多变量Cox回归分析,以确定显著的危险因素,最终年龄(≥80岁<50岁,<0.001)、性别(男女,<0.001)、肿瘤部位(下段中段,=0.013)、病理分期(腺癌鳞癌,=0.012),分化程度(差分化分化良好,<0.001),TNM分期(IVI,<0.001),肿瘤大小(>50 mm0~20 mm,<0.001),化疗(是否,<0.001),LNR(>0.250,<0.001)纳入最终回归模型(表2)。

2.2 多因素Cox回归分析

对于传统的“老师教,学生学”,在这里可以采用“学生教,老师和学生一起学”,通过让学生当“老师”,这样可以充分发挥学生的积极性,此外让学生感觉上数学课是一种享受的过程。

2.3 OS和CSS列线图的构造和验证

在本研究中,我们基于SEER数据库建立了食管癌患者术后1、3、5年的OS和CSS的预后列线图,结果得到良好的内部和外部验证。预测危险因素包括年龄、性别、病理类型、分化程度、TNM分期、肿瘤大小、化疗和LNR。在建模过程中,围手术期放射治疗由于无统计学意义(HR=1.07,95%:0.96-1.19,=0.234)未包括在列线图中。尽管种族间存在明显的死亡差异,但由于种族信息并不广泛适用也未纳入列线图中。此外,为避免多重共线性,即使阳性淋巴结的数量在预测食管癌术后的生存率方面具有显著统计学意义,但也被排除在外。

2.4 列线图与TNM系统的比较

无论多好的班都有最差的学生,无论多差的班都有好学生,学生成绩的好与差,其实是一个相对的概念,教学其实也是一个逐步实现的过程,只有不会,才教,会了还用教吗?因此在每一个教学环节中,只要学生有丁点的进步,作为教师的都要及时给予肯定和表扬,表扬要针对不对层次的学生,表扬要适度,表扬要富有激励作用,其实学生的每一个进步,代表的也是教育有了明显的效果,是进度的重大表现。“不积圭步,无以致千里”,没有一点一滴的进步,也不可能实现学习的进步,考虑学生的差异性、关注学生的提高,这才是有价值和有意义的教育,也才是教育的公平与均衡发展。

3 讨论

对于训练队列,OS和CSS的列线图分别如图4和图5所示。所有危险因素包括年龄、性别、肿瘤部位、病理类型、分化程度、TNM分期、肿瘤大小、化疗和LNR。OS和CSS预后列线图的C指数分别为0.748(95%:0.738-0.758)和0.795(95%:0.785-0.804)。内部验证队列中,OS和CSS列线图的C指数分别为0.752(95%:0.738-0.765)和0.804(95%:0.790-0.817);外部验证队列中,OS和CSS列线图的C指数分别为0.749(95%:0.736-0.767)和0.788(95%:0.751-0.808)。OS 的1、3、5年生存概率的校准图如图6所示,CSS的1、3、5年生存概率的校准图如图7所示。训练队列、内部验证队列、外部验证队列的校准图显示,在1、3、5年OS和CSS的概率方面,列线图预测生存率与实际生存率之间具有很高的一致性。

基于单因素竞争风险模型的相应CIF曲线如图2所示。男性食管癌患者的癌症特异性累积死亡率显著高于女性;食管鳞癌和其他病理类型较腺癌的癌症特异性死亡率高,差异具有统计学意义;除此之外,当患者年龄越大、分化程度越差、肿瘤越大、TNM分期越晚、组织学分化越差、LNR越高时,食管癌的累积死亡率越高。除性别、分化和TNM分期外,其他危险因素不同组间的竞争性死亡率具有统计学意义(图3)。

若把生活比作一条轨道,其实大部分人、大多数时间,都在循规蹈矩地沿着固定的轨道方向行走。但有些人并不满足于这样的平静,偏要探索不可预知的未来,于孙义而言,这样的探索或是生命中的必然。孙义本是南京工业大学的副教授,过着教书育人、安稳度日的悠哉生活,但“岁月静好”对于一颗躁动的心而言并不是一种幸福,随着对数字印刷和设计的了解越来越多、越来越深入,2008年,他创立了南京四色数码科技有限公司,开始对数字印刷的探索,目前四色快印门店已开了8家;2010年,他又收购了东南文化,着力于以数字技术实现文化创意集成,数字印刷实验室随即成立。

围手术期放化疗是否对患者有益尚不清楚。与单纯手术相比,术前化疗+手术和术前放疗+手术的5年生存率并无差异。在这项研究中,围手术期化疗是食管癌患者术后的保护性因素(HR=0.67,95%:0.60-0.75),而围手术期放疗为非保护性因素(HR=1.07,95%:0.96-1.19)。这可能是由于放疗和手术顺序的不同以及选择偏倚造成的。因此,需要对放射治疗进行亚组分析,以确定放射治疗的作用。

截至目前,已有若干项研究构建了预测食管癌远期预后的列线图,但仍未在临床实践中得到广泛应用。Cao等的研究只关注食管癌患者的OS,Du等人的研究只关注了食管癌患者的CSS,且未考虑化疗和放疗的临床价值。与以往的研究相比,本研究有几个优点。首先,癌症特异性死亡和非癌症特异性死亡被认为是重要的竞争因素,这意味着在预测癌症生存率时应考虑竞争风险模型。本研究采用了基于Fine和Gray检验的竞争风险模型,结果表明,除性别和分化程度外,所有因素在竞争性死亡原因中都具有统计学意义。本研究的列线图的预测效能优于Du等(0.7350.710)和Cao等人(0.7260.716)。其次,本研究进行了内部和外部验证,所得的结果也进一步验证了列线图的预测效能。此外,我们将LNR定义为区域阳性淋巴结数目与区域淋巴结总数的比率。阳性淋巴结数目是食管癌的一个重要预后因素,患者的远期生存率随着阳性淋巴结数目的增加而下降。在以前的研究中,LNR被报道为一个独立的预测因子,与本研究的结果类似。在本研究中,当LNR分为5个亚组:0、1~25%、26%~50%、51%~75%、76%~100%时,危险比(HR)随LNR的增加而增加。列线图的AUC值高于TNM分期,表明有更好的预测准确性,可以作为现有TNM分期的补充。

本研究还存在一些不足之处。首先,尽管SEER数据库是基于人群的,并且进行了内部验证,同时用东部战区总医院心胸外科数据库进行了外部验证,但仍需要更多的中心外部验证以确认该预测模型的准确性。其次,SEER数据库中没有影响食管癌预后的一些危险因素,如BMI、术后并发症、营养状况、少肌症。据报道,经术前体质量减轻调整的BMI对ESCC患者的OS有独立的预后影响;肺部并发症显著影响食管切除术患者的OS;肠内喂养被认为与改善食管癌患者术后短期生存率有关;合并少肌症的食管癌患者术后并发症发生率较高。

综上所述,我们基于SEER数据库构建并验证了食管癌术后远期生存率的列线图,并得到良好校准,显示出比TNM分类更高的准确性,可用于临床实践中识别高危患者。

猜你喜欢
线图队列生存率
智能网联车辆队列紧急工况控制策略设计*
『5年生存率』啥意思
队列队形体育教案
“五年生存率”不等于只能活五年
日本首次公布本国居民癌症三年生存率
日本癌症患者十年生存率达59%左右
青春的头屑
一类图及其线图的Wiener指数
队列操练