一种预测肾透明细胞癌患者远处转移风险的列线图模型

2022-07-29 03:10廖文彪熊云鹤孟令超杨嗣星
武汉大学学报(医学版) 2022年4期
关键词:线图病理预测

刘 浪 宋 超 廖文彪 熊云鹤 孟令超 杨嗣星

武汉大学人民医院泌尿外科 湖北 武汉 430060

肾癌起源于肾实质,有多种病理类型。其中肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)是最常见的类型,约占所有肾癌的75%[1,2]。在过去的几年里,ccRCC 各阶段的发病率都在增加,在男性和女性易患癌中分别排第7 位和第9 位。早期、局部肾癌患者治愈率高,5 年生存率大于90%,但多达1/3 的患者会出现转移或发展为转移,相比之下,远处转移后的ccRCC 患者预后较差,5 年生存率下降到12%,中位生存期仅约为13 个月[3,4]。我们需要一个有效的工具来预测ccRCC 患者的远处转移风险。列线图是一种可靠的统计模型,它通过结合肿瘤发生的一些危险因素,构建图形预测工具,并提供个性化、基于易获得证据、高度精确的风险评估[5]。甚至在许多癌症中,列线图的预测精度高于各类传统的分期系统[6-9]。迄今为止,已经有很多学者针对ccRCC 开发出一系列术后列线图对其预后等进行预测。Hutterer 等[10]建立了一个列线图来预测ccRCC 患者淋巴结转移的风险。Zhang 等[11]构建了一个列线图来对ccRCC 患者的疾病特异性生存率进行预测。但回顾以往文献,目前还没有可靠的工具来预测ccRCC 患者的远处转移风险。本研究旨在寻找远处转移性ccRCC 患者的主要危险因素,并构建列线图,为非转移性ccRCC 患者在首次就诊时的个体化风险评估提供参考工具。

1 资料与方法

1.1 一般资料本研究共纳入的19 393 例患者均来自于美国国立癌症研究所建立的SEER 公共数据库(www. seer. cancer. gov,2014—2015)。该数据库存储了美国各地的癌症监测数据,覆盖了美国约28% 的人口,并为各种癌症的人群研究提供数据[12]。筛选标准:病理编码为ICD-O-3 Hist/behave=8310/3,clear cell adenocarcinoma,NOS 且临床病理资料完整者。排除标准:临床病理资料不全或未知者。

本研究纳入的临床病理特征包括年龄、种族、性别、Fuhrman 分级、左右侧、T 期、N 期、肿瘤大小。采用总分期(包括局部、区域、远处)确定是否有转移,病例的TNM 分期均根据美国癌症联合委员会(AJCC)肿瘤分期第6 版。

1.2 统计学分析将纳入研究的患者按7∶3 的比例随机分为训练组和验证组,用卡方检验检验这些临床病理特征与ccRCC 转移的关系(见表1)。然后使用LASSO 回归法筛选出预测ccRCC 患者远处转移风险的有意义的危险因素组合,LASSO 回归法是以缩小变量集(降阶)为思想的压缩估计方法。它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,进而达到变量选择的目的[13,14]。本文在LASSO 回归模型中选择非零回归系数的临床病理特征,筛选出预测ccRCC 患者远处转移的最佳危险因素[15]。然后,整合LASSO回归模型中选择的临床病理特征,引入多因素Logistic 回归分析方法,构建列线图。检验标准定义以P≤0.05 具有统计学意义。

绘制出受试者工作特征(ROC)曲线,计算曲线下面积(AUC)用于检验我们的列线图在训练组和验证组中的性能;校准曲线用于评估在训练组和验证组中实际结果与列线图预测结果的一致程度。用bootstrap 法重复抽样1 000 次,计算出相对校正的一致性指数(C-Index)来验证列线图的预测性能。若C-Index和AUC>0.75,则认为我们建立的列线图有较好的预测性能,而在0.5~0.75则被认为可接受[16]。

最后我们计算出净收益,绘制出决策曲线,使用决策曲线分析(DCA)方法,用以判断列线图的临床效用[17,18]。

2 结果

2.1 病例特征将19 393 名患者被随机分为两组,如表1 所示。卡方检验结果有统计学意义的临床病理特征有种族、性别、Fuhrman 分级、T 分期、N分期、肿瘤大小,表明它们对ccRCC 患者远处转移有显著影响。

表1 ccRCC 患者发生远处转移风险的单因素分析结果

2.2 风险因素的选择在8 个临床病理特征中,根据训练队列选择了5 个临床病理特征(图1A 和1B),在LASSO 回归模型中,这5 个临床病理特征具有非零系数。这些特征包括年龄、种族、性别、Fuhrman 分级和T 分期(表2)。

图1 用LASSO 回归模型选择危险因素

表2 LASSO 回归筛选的5 个临床病理特征的多因素Logistic 回归分析结果

2.3 列线图的构建年龄、种族、性别、Fuhrman 分级和T 分期的多因素Logistic 回归分析结果如表2所示。上述预测因子被纳入模型中,并用列线图表示(图2)。

图2 预测ccRCC 患者远处转移风险的列线图

2.4 测试列线图的性能训练组和验证组的AUC值 分 别 为0.840 和0.835。ROC 曲 线 如 图3A 和图3B 所示。预测ccRCC 患者远处转移风险的列线图校准曲线在训练组和验证组中表现出良好的一致性(图4A 和图4B)。训练组和验证组的C-Index 分别为0.846 和0.843(P<0.05),表明列线图对ccRCC 远处转移的风险有很好的预测作用。

图3 两组列线图的ROC 曲线分析

图4 两组列线图的校准曲线

2.5 临床应用训练组和验证组列线图的决策曲线分析如图5A 和图5B 所示,可知用列线图预测远处转移风险时,当训练组和验证组的阈值概率分别为1%~70%和1%~69%时对ccRCC 患者进行临床干预后ccRCC 患者可能受益。

图5 两组列线图的决策曲线分析

3 讨论

ccRCC 有较高的发病率和死亡率,发生远处转移的ccRCC 患者预后较差。因此我们需要一种工具来帮助预测首诊时未发生转移的患者发生远处转移的可能性。列线图是数学模型中的一种直观的图形展示,它可以通过结合多种重要因素来预测特定的事件发展。在现有的模型中,列线图能够进行个性化风险评估,已经成为量化风险的可靠和方便的工具,从而促进疾病管理及相关决策的制定[19]。本 研 究 利 用SEER 数 据 库 对 大 量ccRCC 患者的临床病理特征进行分析,用LASSO 回归方法筛选出最佳的危险因素,并在此基础上构建列线图,预测ccRCC 患者的远处转移风险。LASSO 回归方法通过构造惩罚函数可以得到更精确的模型,在处理多重共线性的样本数据方面具有明显的优势[20]。

我们只使用了5 个易获得的变量,开发并验证了一种新的工具来预测ccRCC 患者的远处转移风险。将这些危险因素纳入一个简明的列线图中,从而能够个体化预测ccRCC 患者的远处转移风险。本研究为预测ccRCC 患者远处转移的风险提供了一个相对准确的预测工具。队列内部验证结果均表明其具有良好的识别和校准能力。

在我们的研究中,卡方检验结果显示年龄、性别、种族、Fuhrman 分级、T 分期、N 分期和肿瘤大小与肿瘤远处转移密切相关。其中,50~70 岁的患者比<50 岁的患者更容易发生转移,>70 岁的患者转移率相对较低,其原因可能是因为部分患者在肿瘤发生转移前死亡。本研究还发现,黑人比白人及其他种族人群(美洲印第安人/AK 土著人,在美国的亚裔/太平洋岛民)更不容易发生转移。为了进一步探讨影响ccRCC 远处转移的种族因素,我们用卡方检验将种族与其他临床病理特征进行了对比分析。结果显示,与白种人和其他种族患者相比,黑种人患者更年轻,女性更多,T 分期更低,肿瘤体积更小(见表3)。我们还发现女性的肿瘤转移率低于男性,这可能与男性吸烟和饮酒有关,这与以往的研究结果一致[21],以往还有研究提示男性比女性患者具有更大、更高分期、更高分级的ccRCC[22]。此外,有淋巴结转移、Fuhrman 分级高、T 分期较高以及肿瘤体积较大的患者也更容易发生转移,这也与以往的研究结果一致[23]。在本研究中,可以看出T分期对ccRCC 远处转移的影响最大。

表3 种族与其他临床病理特征的关系[例(%)]

选择年龄、性别、种族、Fuhrman 分级、T 分期5个因素,用LASSO 回归法构建列线图。各项内部验证都证明了我们列线图的稳定性和精确性。此外,决策曲线分析的结果表明,我们的模型对临床医生进行临床决策同样具有指导意义。

以往的研究也曾试图预测ccRCC 患者的术后转移风险。Sorbellini 等[24]利用T 分期、Fuhrman 分级、肿瘤大小、坏死、血管侵犯和初始诊断时的临床表现等因素构建了列线图,结果内部验证的AUC值为0.82,外部验证的AUC值为0.79。Leibovich等[25]开发了一种预测根治性肾切除术后肾透明细胞癌转移进展的模型,该方法将pT 期、pN 期、截断值为10 cm 的肿瘤直径、Fuhrman 分期、组织学肿瘤坏死纳入模型的构建,其内部验证的AUC值为0.84,外 部 验 证 的AUC值 为0.70~0.80。Klatte等[26]构建的列线图,除了纳入pT 分期和ECOG 评分外,还包括了KI-67、P53、内皮细胞VEGFR-1、上皮细胞VEGFR-1 和上皮细胞VEGF-D 等因子的表达水平,并将预测精度提高到0.90。然而,未对该列线图进行外部验证。Jeong 等[23]根据年龄、肿瘤大小和外观特征这3 个临床病理特征构建了一个预测模型。该模型得到的内部验证AUC值为0.843,外部验证的AUC值为0.805。

与上述研究相比,本研究有许多优点。首先,我们的模型可以预测所有没有发生转移的ccRCC患者的远处转移风险。其次,列线图仅使用5 个易获得的临床病理特征(年龄、性别、种族、Fuhrman 分级和T 分期)就能够准确预测ccRCC 患者的远处转移风险。最后,我们的模型在内部验证中的准确性和稳定性都很好,AUC值分别为0.840 和0.835。我们进一步采用DCA 的方法验证了该模型具有良好的临床应用效果。我们的列线图可以提供ccRCC 患者远处转移风险的准确概率,并帮助临床医生对需要早期干预以延长生存期的患者进行管理和决策。

虽然本研究具有上述优点,但仍存在以下不足。首先,本研究是一个回顾性研究,排除了数据不完整的个别病例,这可能导致选择性偏差,这就需要更多前瞻性研究来进一步验证;第二,本研究的模型所包含的风险因素较少。因此,在接下来的验证研究中应纳入更多的风险因素,进一步提高模型预测能力。

总之,本研究通过分析从SEER 数据库中获取的大量数据,确定了与ccRCC 患者远处转移密切相关的7 个危险因素。利用LASSO 回归分析,我们筛选了5 个最佳危险因素,建立了一个新的具有相对较高准确性的列线图,以帮助临床医生确定没有发生转移的ccRCC 患者的远处转移风险。通过对个体的风险评估,临床医生和患者可以提前采取必要的干预措施来延长患者的生存期。

猜你喜欢
线图病理预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
分析乳腺癌病理诊断对临床诊治的价值
选修2—2期中考试预测卷(A卷)
小细胞肺癌病理特征及免疫研究进展
术前MRI检查对宫颈癌病理分期及宫旁浸润评估的诊断价值
为何要病理会诊和免疫组织化学检测
一类图及其线图的Wiener指数