乳腺髓样癌临床预测模型的建立和验证:基于SEER数据库

2023-06-29 08:18史艳茹付月仙
医学新知 2023年3期
关键词:线图受体乳腺癌

付 茸,史艳茹,付月仙,吕 军,3

1.西安交通大学医学部公共卫生学院(西安 710061)

2.陕西省肿瘤医院输血科(西安 710061)

3.暨南大学附属第一医院临床研究部(广州 510630)

乳腺癌是女性最常见的恶性肿瘤,死亡率较高[1]。乳腺髓样癌(medullary carcinoma of breast,MCB)为乳腺癌独特的组织学亚型,是一种罕见的侵袭性乳腺恶性肿瘤[2-3]。MCB 发病率低,仅占所有乳腺癌的7%,发病年龄一般为40~50 岁[4]。目前,MCB 的组织病理学和生存预后情况仍存在争议。一般组织学分级较高、激素受体多为阴性和侵袭性的病理特征是预后不良的表现,但MCB患者的临床结局却表现良好[5]。MCB 在临床上的独特性,使其早期诊断和预后评估尤为重要。美国癌症联合委员会(The American Joint Committee on Cancer,AJCC)分期系统已被广泛用于确定临床治疗策略和评估临床风险,虽然现有的AJCC分期系统对肿瘤预后提供了有意义的预测,但其评估肿瘤临床风险方面存在局限,提示需要新的预测工具来提高预后评估的准确性。列线图作为一种可视化的预测工具,可以结合各种重要的相关因素来预测一个特定的端点[6-7]。通过建立列线图模型,不仅可提高患者预后的预测准确性,还能为临床医生提供基于多个参数组合的个体化预后信息,以便做出治疗决策风险评估[8-10]。因此,本研究通过回顾性分析SEER 数据库2000年至2015年MCB 患者的数据,筛选独立预后因素建立列线图模型并进行验证,以期为临床医生制定个性化的诊疗提供参考。

1 资料与方法

1.1 研究对象

本研究数据来源于SEER 数据库[11]2000年至2015年确诊的MCB 患者临床病例资料。纳入标准:①诊断年份为2000年至2015年;②使用国际肿瘤学疾病分类第三版(International Classification of Disease for Oncology Third Edition,ICD-3)的组织学代码8510/3 和解剖学代码C50;③有完整的生存信息。排除标准:①18 岁以下的患者;②未经显微镜检或仅通过尸检确认的病例;③变量不完整。

1.2 资料提取

SEER 数据库通过签署数据使用协议,免费向公众提供关于癌症的研究信息。根据纳入与排除标准,提取患者诊断年龄、种族、婚姻状况、组织学分级、偏侧、AJCC 分期、手术、放疗、化疗、区域淋巴结、雌激素受体和孕激素受体等相关信息。

1.3 模型构建与验证

利用R 软件的随机分配代码,按7 ∶3 的比例将患者随机分配入训练集和验证集,训练集中通过Cox 回归分析确定影响患者生存的危险因素并建立列线图,验证集用以验证模型的性能。

通过单因素Cox 回归分析对所有变量进行筛选,P<0.05 的变量进入多因素Cox 回归分析,获得与患者生存相关的独立危险因素。基于独立危险因素构建列线图,图中包含的每个变量被分配一个数值,代表变量对模型中结果变量的影响程度,计算每个变量对应值的总和,可在列线图上转换为MCB 患者5年和10年生存率。利用一致性指数(C 指数)和受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUC)评估列线图模型的预测准确性,两者的取值范围为0.5~1.0。通常认为0.7 以上区分度较好,预测准确性较高。校准图用于评估模型预测结果与实际结果之间的一致性,当校准曲线越接近45 度参考线时,说明模型的校准度越好。采用决策曲线分析(decision curve analysis,DCA)评估预测模型的临床有效性,横坐标是阈值概率,纵坐标是净获益率,“All”表示所有人接受治疗,“None”表示所有人不接受治疗,为两种极端情况,在相同阈值概率下,净获益率越大,模型的临床价值越高,患者在模型中采取某种治疗的获益度也较高。

1.4 统计学分析

应用SPSS 25.0 进行统计学分析,符合正态分布的连续变量以均数与标准差表示,分类变量以频数和百分比表示,卡方检验比较训练集和验证集患者临床特征有无差异,通过单因素和多因素Cox 回归分析确定与患者预后相关的独立危险因素,以P<0.05 表示差异具有统计学意义。利用R 4.1.1 构建列线图并进行验证。

2 结果

2.1 一般情况

共纳入2 086 例MCB 患者,其中训练集1 460例、验证集626 例。患者诊断年龄主要集中于40~59 岁,大部分为已婚白色人种、组织学分级程度较高、AJCC 分期Ⅱ期、区域淋巴结阴性、雌激素受体和孕激素受体阴性,超半数患者肿瘤位置在左侧,并已接受了手术、放疗或化疗。卡方检验显示,训练集和验证集患者在临床特征方面的差异均无统计学意义(表1)。

表1 乳腺髓样癌患者的基线特征(n,%)Table1.Baseline characteristics of patients with medullary carcinoma of breast (n,%)

2.2 单因素和多因素Cox回归分析

训练集中,单因素Cox 回归分析显示诊断年龄≥80 岁[HR=2.741,95%CI(1.010,7.442),P=0.047]、婚姻状况为离异/分居/丧偶[HR=1.590,95%CI(1.000,2.528),P=0.049]、AJCC 分期为Ⅱ期[HR=2.275,95%CI(1.277,4.052),P=0.005] 与Ⅲ期[HR=6.034,95%CI(2.773,13.132),P<0.001]、未行手术[HR=4.027,95%CI(1.167,13.891),P=0.027]与患者生存预后相关;多因素Cox 回归分析显示诊断年龄≥80 岁[HR=3.853,95%CI(1.509,9.837),P=0.004]、婚姻状况为离异/分居/丧偶[HR=1.626,95%CI(1.040,2.540),P=0.032]、AJCC 分期为Ⅱ期[HR=2.523,95%CI(1.494,4.258),P<0.001]与Ⅲ期[HR=8.087,95%CI(4.403,14.853),P<0.001]、未行手术[HR=4.983,95%CI(1.557,15.944),P=0.006]是影响MCB 患者预后生存的独立危险因素(表2)。

表2 训练集中单因素和多因素Cox回归分析Table 2.Univariate and multivariate cox regression analysis in training set

2.3 列线图的建立

基于多因素Cox 回归分析确定的MCB 患者预后独立危险因素构建列线图,如图1显示,AJCC分期对预后影响最大,其次是手术、诊断年龄和婚姻状况。

图1 预测乳腺髓样癌 5年和10年生存列线图Figure1.Nomogram predicting 5-year and 10-year survival of patientswith medullary carcinoma of breast

2.4 列线图的验证

通过C 指数对列线图模型进行验证,结果显示该模型C 指数(训练集和验证集分别为0.706和0.729)高于AJCC 分期系统C 指数(0.659 和0.698)。图2显示列线图训练集 5年和 10年预测生存 AUC 分别为 0.698 和 0.707,验证集 5年和 10年生存预测 AUC 分别是 0.748 和 0.729,以上结果表明列线图区分度较好,准确性较高、图3显示列线图的校准曲线接近45 度参考线,说明列线图的预测结果与实际观察结果的一致性较好,图4DCA 结果显示列线图模型在训练集中5年和 10年的获益程度高于 AJCC 分期系统,虽然在验证集中获益程度较低,但结合以上指标,列线图的预测性能总体上高于AJCC 分期系统。

图2 乳腺髓样癌ROC曲线Figure 2.The ROC curve of medullary carcinoma of breast

图3 乳腺髓样癌校准曲线Figure 3.Calibration curve for medullary carcinoma of breast

图4 乳腺髓样癌决策分析曲线Figure 4.The decision analysis curve of medullary carcinoma of breast

3 讨论

MCB 是一种罕见的浸润性乳腺癌组织类型,有独特的临床病理特征和人口统计学特征[5,12]。MCB 患者发病年龄较小,较其他常见的乳腺癌组织亚型有较好的预后,这可能与淋巴细胞浸润有关[12-13]。虽有研究也证明了MCB 的预后优于同为浸润性乳腺癌亚型的浸润性导管癌[14-16],但MCB组织学分级多为Ⅲ级,较高的组织学分级代表细胞分化程度较低,预后结局通常并不理想[17-18]。同时有研究发现,大部分MCB 患者雌激素受体、孕激素受体及人类表皮生长因子受体2 表达阴性,而三种受体表达阴性被定义为三阴性乳腺癌,而MCB 患者三阴性乳腺癌所占比例较高,此癌症类型又与癌细胞的侵袭性和不良预后有关[19-22],也有部分研究证明雌激素受体和孕激素受体阴性与MCB 良好的预后相关[15,23]。因此,MCB 的预后尚存争议,未来深入研究尤为重要。

目前,AJCC 分期系统主要用于肿瘤患者的预后评估,单独使用该系统存在一定局限,同一分期的患者其生存情况往往存在一定差异,表明可能存在其他影响事件结局的因素,因此有必要建立一个全面的预测模型,不仅包括AJCC 分期系统,还包括患者的人口统计学数据和有关治疗的相关参数。本研究通过建立列线图预测模型对MCB 患者的预后进行评估,结果显示年龄是MCB 患者的危险因素,年龄越大,预后越差。既往研究表明,随着年龄的增长,MCB 患者的总体生存率随之降低,这与本研究结果一致[24]。与已婚患者相比,未婚及离异/分居/丧偶患者的预后较差,可能原因是婚姻状况与心血管、内分泌、免疫功能以及癌症预后的改善有关,而婚姻状况良好的患者不容易出现转移性癌症,不仅可以避免治疗不足等情况发生,还可降低MCB 患者的死亡风险[25-27]。本研究结果显示,AJCC 分期是MCB 患者预后的危险因素,从列线图可以看出,Ⅲ期患者相较Ⅰ期和Ⅱ期患者的生存结局较差。AJCC 分期系统根据原发肿瘤大小和累及范围、有无区域淋巴结转移及程度、有无远处转移及程度分为3 期,级别越高,说明肿瘤越大,累及范围越广,淋巴结转移的几率也越高,因此患者的预后也较差[28]。本研究还发现放疗和化疗非MCB 患者的预后影响因素,虽然化疗和放疗是浸润性乳腺癌常用的辅助疗法,但通常认为MCB 患者预后较好,推测可能较少从全身治疗中获益,化疗和放疗对MCB 的预后影响现仍存争议[3]。手术是乳腺癌患者的常规疗法,而保乳术作为乳腺癌手术治疗的形式之一,与MCB 患者良好的长期预后有关,有研究结果表明,基于良好的生存结局,针对MCB 患者一般采用手术治疗,但迄今为止,评估MCB 患者保乳术后的预后研究较为有限[29]。

本研究通过列线图预测MCB 患者的预后风险,结果显示与AJCC 分期系统相比,列线图模型有较好的预测准确性。同时,校准图显示列线图模型预测结果与实际结果之间有较好的一致性,DCA 结果显示,列线图模型获益程度高于AJCC 分期系统,具有一定的临床价值。因此,本研究建立的列线图预测模型不仅可为临床医生选择个性化的治疗方案提供参考,还可帮助临床医生综合考虑患者情况,及时做出正确的治疗决策。本研究仍存一定的局限性。首先,本研究基于SEER 数据库,利用回顾性数据会带来一定的偏倚;其次,本研究只纳入了有完整信息的患者,这将排除很多研究病例,导致选择偏倚;最后,SEER数据库记录来自美国多个州县的临床资料,缺少亚洲人口的临床资料,导致研究结果外推性有限。如果未来可行,希望更多关于癌症的研究能够通过中国数据库进行开展,以此促进中国公共卫生事业和肿瘤防治的发展。

猜你喜欢
线图受体乳腺癌
临床-影像组学列线图术前预测直肠癌T分期
绝经了,是否就离乳腺癌越来越远呢?
基于箱线图的出厂水和管网水水质分析
乳腺癌是吃出来的吗
胸大更容易得乳腺癌吗
别逗了,乳腺癌可不分男女老少!
东山头遗址采集石器线图
Toll样受体在胎膜早破新生儿宫内感染中的临床意义
2,2’,4,4’-四溴联苯醚对视黄醛受体和雌激素受体的影响
Toll样受体:免疫治疗的新进展