李倩妮 徐灵燕 李 健 刘美娜
哈尔滨医科大学公共卫生学院卫生统计学教研室,150081 黑龙江 哈尔滨
乳腺癌是女性高发的恶性肿瘤,严重影响着患者的身心健康。在中国,乳腺癌居女性癌症发病首位和死亡的第4位,且呈上升趋势[1-2]。浸润性乳腺癌(invasive breast cancer,IBC)是指癌细胞穿透末梢导管或腺泡基底膜并向周围间质延伸而形成的一种恶性肿瘤,是乳腺癌中最常见的病理类型,约占全部乳腺癌的80%;相比于非浸润性乳腺癌,IBC的分化程度更低,复发和转移的风险更高,预后更差[3-4]。全乳切除手术是IBC的主要治疗手段,患者术后的局部复发率较高,达5%~30%[5-6];在患者的预后死亡中,患者可能死于IBC,也可能死于其他原因;目前多采用经典的生存分析方法对IBC全乳切除患者进行分析[7-8],其结局事件仅为由IBC所致的死亡,忽略了死于其他原因的竞争风险,可能会高估结局事件的发生风险[9]。竞争风险模型可将研究结局分为多种类型,把兴趣事件与竞争事件区分开来,是一种更加精确、合理的分析模型。因此,本研究利用竞争风险模型对多结局、多因素的IBC全乳切除数据进行分析,探讨患者预后的影响因素,并绘制列线图预测患者3年及5年的生存率,为准确判断患者预后、指导其治疗、改善结局提供更可靠的依据。
通过SEER*Stat软件从SEER数据库[Incidence- SEER Research Plus Data,18 Registries,Nov 2020 Sub(2000-2018)]数据模块中,提取浸润性乳腺癌并行全乳切除手术患者的临床资料。纳入标准:①诊断年份为2010—2018年;②病理学明确诊断为浸润性乳腺癌,肿瘤部位为“breast”,病理学特征符合国际疾病肿瘤分类形态学编码(International Classification of Diseases for Oncology)第三版(ICD-O-3);③手术方式包括总乳房切除术、根治性手术、改良根治术和扩大根治术;④性别为女性。排除标准:①生存时间为0;②仅有尸检或死亡证明;③非第一原发肿瘤;④研究因素信息缺失。
共纳入了18个研究因素,包括年龄、种族、婚姻状况、原发肿瘤位置、左右侧、肿瘤数量、组织学分级、病理类型、TNM分期、T分期、N分期、M分期、雌激素受体(estrogenic receptor,ER)状态、孕激素受体(progesterone receptor,PR)状态、人表皮生长因子受体-2 (human epidermal growth factor receptor-2,HER2)状态、分子亚型、放疗、化疗;各因素的分组及定义见表1。
表1 研究因素的分组及定义
表1 (续)
根据患者的生存状态和死亡原因,将本研究结局分为3种:①兴趣事件,乳腺癌特异性死亡(breast cancer-specific mortality,BCSM),定义为自确诊为IBC并接受全乳切除手术后,患者因IBC所致的死亡;②竞争事件,乳腺癌非特异性死亡,定义为自确诊IBC并接受全乳切除手术后,患者因其他原因所致的死亡;③删失,在随访结束后仍生存的患者。
本研究统计软件利用R-studio 4.1.1版本;采用的工具包有cmprsk、mstate、rms、survival等。所有的临床资料均使用例数和构成比[n(%)]进行统计描述;基于竞争风险模型进行单因素及多因素分析,将单因素分析结果中具有统计学意义的研究因素纳入多因素分析,最后确定独立预后影响因素;绘制列线图并采用C-index、ROC曲线及校准曲线验证模型的预测能力;C-index评估列线图的预测性能,范围为0.5~1.0,C-index越大表示该模型的准确度越高;ROC曲线的AUC值评价模型的区分度,AUC值越接近1表示区分度越好,一般情况下AUC值>0.7表示模型的区分度较好;校准曲线比较预测生存率与实际生存率的一致性,绘制的曲线越接近于中间45°倾斜的虚线拟合效果越好;检验水准α=0.05。
根据纳入排除标准,本研究共纳入患者129 808例,其中10 456例(8.1%)死于IBC,7 312例(5.6%)死于其他原因,112 040例(86.3%)删失。所有患者中,以中年组(40~<65岁)、白种人、已婚患者居多;IDC为主要的病理类型;组织学分级以2级为主;大部分患者表现为淋巴结阴性及无远处转移且以Ⅰ、Ⅱ期为主;ER或 PR阳性、HER2阴性的Luminal A型患者占多数;70.6%的患者未接受放疗;接受与未接受化疗的患者比例为1∶1。在死于IBC的患者中,组织学分级中3级所占比例为65.2%;大部分患者出现淋巴结转移为Ⅱ、Ⅲ期;Luminal A型患者居多;接受与未接受放疗的患者比例为1∶1;69.4%的患者接受化疗。见表2。
表2 患者的一般情况及结局分布
表2 (续)
单因素分析结果显示,年龄、种族、婚姻状况、原发肿瘤位置、肿瘤数量、病理类型、组织学分级、TNM分期、T分期、N分期、M分期、ER状态、PR状态、分子亚型、放疗、化疗均与患者的预后相关。多因素分析结果显示年龄、种族、婚姻状况、组织学分级、T分期、N分期、M分期、ER状态、PR状态、分子亚型、放疗、化疗为IBC全乳切除患者的预后因素。见表3。
表3 竞争风险模型分析结果
表3 (续)
将多因素分析结果中具有统计学意义的因素作为预测因素构建列线图,见图1。根据患者每项临床病理特征投射到上方刻度尺即可得到一个分值,将各个分值相加计算出总分,向模型下方的总分刻度尺划一道垂直线,即可获得该患者3年及5年的生存率。其中,N分期对乳腺癌特异性死亡影响最大,其次为T分期、分子亚型、M分期和组织学分级。列线图3年、5年的C-index分别为0.853、0.823,表明该列线图具有较好的准确性;3年、5年的ROC曲线AUC值分别为0.821、0.818,表明该列线图的区分度较好,见图2;患者3年、5年BCSM的预测概率与实际概率具有较为良好的一致性,表明该列线图的校准度良好,见图3。
图2 ROC曲线分析
图3 校准曲线
竞争风险模型用于分析具有多种结局事件的生存数据,包括兴趣事件和竞争事件;该模型同时考虑多种结局事件,降低了竞争事件对预后研究带来的影响。在以往预后研究中通常采用经典的生存分析,将兴趣事件作为结局事件,竞争事件视为删失,可能会高估结局事件的发生风险出现偏倚;如果竞争事件的比例>10%可能会导致显著偏倚,<10%可能会导致假阳或假阴性的结果[9]。本研究的研究对象为IBC全乳切除患者,利用竞争风险模型进行患者预后影响因素分析,研究结局分为兴趣事件、竞争事件和删失3类,兼顾乳腺癌非特异性死亡的竞争事件,增加了研究的可信度。利用列线图预测肿瘤患者预后,可以将各个因素对结局事件的影响大小量化并进行形象地展现;研究的列线图具有较好的预测性能,可以较为准确地评估患者的生存率,对临床决策和预后判断有重要的意义;其中患者BCSM风险低于75%的预测效果更好;列线图中涉及的临床病理特征对于任何临床医生都很容易获得,因此该模型对临床工作提供了一个实用的参考工具。
IBC全乳切除患者的预后影响因素分析结果显示老年患者、黑种人、单身是BCSM的危险因素,与既往研究结果一致[10-14];老年患者预后较差可能与其常伴有某些慢性疾病,对放化疗和较大的手术耐受性差等有关[15]。不同种族间存在的差异可能是由于种族遗传因素、激素水平、肿瘤生物学水平、社会或环境因素等造成的[11-12],本研究患者的临床资料均源于SEER数据库,因此得出的结论与我国患者情况是否相符还有待进一步研究。已婚患者可以获得更多的经济支持,有助于患者及早确诊并坚持规范性的治疗,同时还可以得到配偶一定的情感支持[13-14,16]。肿瘤的组织学分级越高,患者预后越差,可能与Ki-67基因的表达有关[17],Ki-67是一种可以直接反映肿瘤细胞增殖活性和数量的抗原,可作为反映肿瘤细胞的增殖速率和预后的指征[18],随着组织学分级的增高,Ki-67的增殖指数和细胞的增殖速率加快,肿瘤更易发生转移,预后越差[19]。肿瘤的直径越大、淋巴结转移率越高、出现远处转移的时间越早,患者的预后越差;还有研究表明,肿瘤大小会影响淋巴结的转移以及远处转移,且随着肿瘤的增大,转移的时间逐渐提前[20]。ER阳性、PR阳性患者对内分泌治疗的敏感性更高,预后较好;放化疗是IBC综合治疗的重要组成部分,全乳切除术后的辅助放疗及化疗可降低残留病灶复发和转移的风险,从而提高患者的生存率[21-23]。
然而对于IBC的分子亚型,多数研究表明Luminal A型患者预后最好,HER2阳性型和三阴性患者预后较差;本研究结果却显示HER2阳性型患者预后最好、Luminal A型患者预后最差。这种差异可考虑以下原因:有研究表明淋巴结状态和内分泌治疗对术后患者的预后具有一定影响[24];HER2阳性型和三阴性4~9枚淋巴结转移的比例均高于1~3枚和≥10枚[25],而本文2种亚型中1~3枚淋巴结转移的比例较高;研究表明ER、PR的表达水平是影响内分泌治疗的重要指标,Luminal A型乳腺癌ER、PR的表达为阳性,对内分泌治疗的敏感性更高,但对常规化疗的敏感性较低,而本研究未纳入内分泌治疗这一信息,这在一定程度上可能会影响结果的准确性,确切的原因有待更深入的研究和分析。
综上,基于竞争风险模型分析IBC全乳切除患者的预后影响因素,绘制的列线图,预测性能良好,可为患者的临床决策及预后判断提供帮助,具有重要的学术意义和临床现实意义。研究存在的局限性有:①以SEER数据库分析的结果为依据对我国国情进一步分析;②数据库缺少某些信息,如内分泌治疗、化疗方案、周期及剂量等,一定程度上可能会影响结果的准确性。