基于SEER数据库建立小肝癌患者远处转移预测模型

2022-01-09 13:23卢文勇康星凯蔡慧欣杨文军
肝胆胰外科杂志 2021年12期
关键词:训练组线图结节

卢文勇,康星凯,蔡慧欣,杨文军

(温州医科大学附属第一医院 肝胆胰外科,浙江 温州 32500)

肝细胞癌(hepatocellular carcinoma,HCC)是最常见的原发性肝癌,是全球第六大常见的肿瘤[1]。2018年全球新增肝癌病例841 080例,肝癌相关死亡病例781 631例[2]。HCC病死率高、预后差,大样本的统计研究显示HCC患者5年生存率仍低于20%[3-4]。HCC早期临床症状隐匿,多数患者诊断时病情已到中晚期,但随着影像诊断技术的提高以及高危患者常规筛查的普及,许多早期HCC被及时诊断,其中绝大部分是小HCC[5]。临床上常将单个癌结节直径≤5 cm或不超过3个癌结节且最大直径≤3 cm的肝癌称为小肝癌[6-7]。远处转移是患者不良预后的主要危险因素,但在小肝癌患者中相对少见[8-9]。因此可能会导致外科医师忽视小肝癌患者远处转移的风险,术前检查不充分,治疗方法不恰当和术后随访不及时。由于病例数量的限制,迄今为止,很少有对小肝癌患者远处转移的危险因素研究报道。

列线图(Nomogram)是一种用于肿瘤学相关预测的可视化工具,能个性化评估单个患者生存和转移风险[10]。本研究中我们基于SEER数据库构建并且验证小肝癌患者远处转移风险预测的列线图,为外科医师对高风险患者早期识别提供参考,从而选择最佳治疗方法。

1 资料和方法

1.1 资料的获取

使用SEER*stat(8.3.9)软件从数据库提取数据,提取条件:发病部位为肝脏;诊断年份为2010年1月至2016年12月。提取数据为病案号、确诊方式、原发肿瘤数量、性别、年龄、种族、婚姻状况、诊断年份、分化程度、肿瘤大小、肿瘤扩展、病理类型、TNM分期、甲胎蛋白等。由于SEER数据库2018年以后才按照第八版TNM分期分类,故本研究参照第七版TNM分期。

1.2 数据的筛选

纳入标准:(1)确诊方式为细胞学阳性;(2)只有一种原发肿瘤;(3)国际肿瘤学疾病编码(ICDO-3)为8170-8175[11];(4)肿瘤最大径≤5 cm。

排除标准:(1)非病理确诊;(2)2种以上原发肿瘤;(3)TNM分期不明;(4)年龄小于18岁,婚姻,种族,甲胎蛋白(AFP)不明;(5)肿瘤大小不明或最大径>5 cm;

根据以上标准逐步排除,最终纳入5 595例符合研究标准的病例,并采用随机数字法按7∶3分成训练组和验证组,具体筛选流程详见图1。

图1 小肝癌患者筛选流程图

1.3 统计学分析

采用SPSS 24.0 和R语言(4.0.4)软件进行数据分析和处理。随机数字分组法通过SPSS随机生成5 595个0~1之间的随机数,前3 915个随机数对应的病例纳入训练组,后1 680个随机数对应的病例纳入训练组。两组间分类变量的比较用卡方检验;在训练组中使用SPSS进行Logistic单因素和多因素分析。基于筛选出的独立危险因素,利用R语言的rms包构建列线图,每个变量分值使用replot内置包NomogramEx包计算。采用rms软件包用于绘制ROC曲线,校正曲线,采用rmda软件包用于绘制决策曲线。P<0.05认为差异有统计学意义。

2 结果

2.1 训练组及验证组基线特征

训练组和验证组年龄、性别、种族等人口构成及肿瘤最大径、癌结节数目、分期、分化程度等临床病理特征比较均无统计学差异(P>0.05),两组基线均衡。详见表1。

表1 小肝癌临床病理特征(例)

2.2 训练组危险因素筛选

单因素Logistic分析显示性别、婚姻状况、T分期、N分期、分化程度、癌结节数目、AFP与患者的远处转移相关(P<0.05),将以上指标纳入多因素Logistic逐步回归分析显示未婚、多发癌结节、T3~T4、N1、分化程度(III/IV)和AFP阳性为小肝癌患者远处转移的独立危险因素(P<0.05),性别被排除(P>0.05),详见表2。

表2 训练组中小肝癌患者远处转移危险因素的单因素及多因素Logistic回归分析(n=3 915)

2.3 训练组列线图的构建和验证组验证结果

将筛选出来的包括婚姻状况、癌结节数目、T分期、N分期、分化程度和AFP这6个独立的危险因素在训练组中通过R语言绘制出列线图。如图2所示,列线图将每个变量的因素以具体分数形式量化,形象地呈现每个患者远处转移的发病风险。

图2 小肝癌患者远处转移的列线图预测模型

训练组和验证组中ROC曲线下面积(AUC值)分别为0.805(95%CI0.778~0.832)和0.829(95%CI0.791~0.868),校准曲线显示远处转移预测值和实际值有较好的一致性,ROC曲线和校准曲线(图3)共同表明该模型有良好的预测精度和准度。

图3 训练组和验证组患者ROC曲线和校准曲线

2.4 临床效用评估

决策曲线分析(DCA)是一种评估预测模型的方法[12],通过远处转移的风险阈值(X轴)和净收益(Y轴)衡量其临床有效性。可以清楚地看到,与仅使用婚姻状况、癌结节数目、T分期、N分期、分化程度和AFP单一方法相比,列线图在预测远处转移风险范围内具有最大的净收益,详见图4。

图4 列线图及各个预测因子的决策曲线比较

3 讨论

现如今许多的小肝癌患者都能被及时诊断,通过结合CT、MRI、超声波和血清学检查,甚至可以较早发现癌结节小于1 cm的小肝癌[5]。肝癌的预后与肿瘤的分期情况息息相关。早期HCC患者经肝切除术后的5 年生存率超过70%,但一旦发生远处转移,即使经多学科诊疗后,中位生存时间也仅有1~1.5 年[1-2],预后很差。PET/CT成像在肿瘤分期和肝外转移的诊断方面具有独特的优势,但因其高成本,很难在临床上大范围应用[13]。因此,构建一个经济实用的模型来预测患者的远处转移具有非常重要价值。

在本研究中,小肝癌的远处转移发生率为7.0%(395/5 595),未婚、多发癌结节,T分期(T3~T4)、区域淋巴结转移(N1)、分化程度(III/IV级)、AFP阳性是发生远处转移的独立危险因素。肿瘤分化程度、T分期、N分期与肝癌的远处转移相关性已获得广泛认同。其中区域淋巴结转移(N1)具有最大的预测能力(HR7.753,95%CI5.349~11.238),肝细胞癌很少发生区域淋巴结转移,在一些大样本研究中,发生率仅为1.23%~7.5%[14-15],本研究中淋巴结转移率为4.2%(236/5 595)。但小肝癌淋巴结转移的预后较差[16],AJCC分期系统和美国国家综合癌症网络(NCCN)指南都认为区域淋巴结转移与远处转移一样是肝癌的终末阶段[17]。肿瘤分化高通常表明其恶性程度越高,侵袭能力越强,转移的可能性也就越大[18]。较高的T分期也表明肿瘤局部浸润的程度越广,远处转移的风险高。AFP作为肝癌诊断的肿瘤标志物,被广泛用于肝癌诊断与复发预测。既往的研究显示肝外转移性肝癌中AFP阳性率更高[19]。多发的肝癌结节比孤立的肝癌结节有更强的侵袭性,预后也更差[20]。婚姻状况对肝外转移的影响可能涉及复杂的社会心理因素。一项系统的综述研究表明,婚姻对肝癌的早期诊断可能有积极的影响[21]。与未婚患者相比,已婚患者往往有更多的家庭关怀及经济支持,他们对自己的健康状况也更关注。性别对肝外转移的影响尚有争议。在多因素Logistic回归分析后,性别因素与肝外转移没有统计学差异(P=0.056),被排除在外。但在一项大规模的HCC患者的回顾性研究中,女性预后明显好于男性[22],这种差异可能与雄激素的刺激和雌激素保护作用相关[23],有待日后的研究验证。肿瘤大小在以往的研究中通常被认为是肝外转移危险因素[24],Ishii等[25]发现对于肿瘤直径大于7 cm肝癌,术后肺转移的风险显著升高,但本研究中不同直径小肝癌的远处转移的情况无统计学差异(P=0.154)。

目前我们在Pubmed及中国知网中检索尚没有发现有对小肝癌远处转移风险预测的研究。相对于以往肝癌远处转移风险的研究,本研究有以下优点:首先,SEER数据库为本研究提供了充足的样本量和临床数据,研究结果有较高的可靠性。其次,一般而言,模型的AUC值不低于0.7,其预测准度被认为是可以接受的[26]。在本次研究中,训练组和验证组中的AUC值分别为0.805和0.829。因此,我们的列线图在预测小肝癌远处转移方面具有相对较高的准确性。最后,列线图能帮助外科医师直观地了解每个危险因素作用下远处转移的风险。肺部是肝癌最常见的肝外转移,并且肝癌肺转移在最初阶段很少有明显临床症状,因此建议高风险患者进行常规胸片或低剂量肺CT扫描。参考本模型的预测结果,同时结合患者的临床症状及实验室检查,对怀疑其他肝外转移部位(如骨、脑)患者,适时进行脑MRI,或PET/CT检查。

不可否认,本研究也存在一些局限性。首先,作为一项回顾性研究,本研究与其他同类研究一样,存在一定的选择偏倚。其次,SEER数据库缺乏相关的实验室检查。早先有报道碱性磷酸酶水平与肝外转移相关[19]。

综上所述,本研究确定了小肝癌患者远处转移密切相关的6 个危险因素,建立了一个具有较高准确性的列线图模型,帮助外科医师评估每个小HCC患者的远处转移风险,并通过加强高危人群监测与随访,为患者提供个体化的诊疗,提高患者的生存率。

猜你喜欢
训练组线图结节
结节是怎么长出来的
新型抗阻力训练模式改善大学生身体素质的实验研究
体检发现的结节,离癌症有多远?
一些图运算的调和指标与调和多项式的线图∗
产后妇女盆底功能障碍康复治疗方法及应用效果观察
查出肺结节,先别慌
甲状腺结节能 自己消失吗?
运动可延缓衰老
不同形式运动对2型糖尿病患者糖化血红蛋白百分比和部分体成分影响的Meta分析
一类图及其线图的Wiener指数