孟 轲,耿一萌,杨珍珍,冯 涵,李冰洁,马 望
郑州大学第一附属医院肿瘤科 郑州 450052
乳腺癌是威胁我国女性健康最主要的恶性肿瘤之一,其死亡率随年龄的增长逐年升高,于60岁年龄组达到第一个高峰,并于85岁及以上年龄组达到最高峰[1]。老年患者因缺乏对乳腺癌的认知且疏于乳房X线筛查或自检[2],一般在确诊时已达晚期,加之老年患者依从性差,故治疗效果并不理想。因此科学的风险筛查是老年乳腺癌研究的重点。
细胞自噬又称为Ⅱ型细胞死亡,是细胞在自噬相关基因(autophagy-related gene,ARG)的调控下利用溶酶体降解自身受损细胞器和大分子物质的过程,在细胞新陈代谢、细胞内稳态维持中发挥重要作用;自噬异常与多种疾病密切相关,如癌症和神经退行性疾病等[3]。正常生理情况下自噬可以通过降解错误折叠的蛋白质、受损的细胞器等抑制肿瘤形成;然而一旦肿瘤形成,自噬作为保护细胞存活的机制,可以为多种癌细胞提供丰富的营养,促进肿瘤生长[4-6]。有研究[7]表明自噬基因ATG2B、ATG4D、ATG9B在乳腺癌组织中的表达低于癌旁正常组织。据报道[8]Beclin-1是乳腺癌必需的自噬调节因子,在乳腺癌的发生过程中起肿瘤抑制作用,其等位基因的缺失可能与乳腺癌发生发展过程中的自噬缺陷有关。这些发现提示自噬在乳腺癌的发展过程中扮演着重要角色,ARG有可能是潜在的乳腺癌预后标志物。本研究探讨了ARG与老年女性乳腺癌预后的关系。
1.1 数据来源
1.1.1乳腺癌病例信息 从TCGA(https://portal.gdc.cancer.gov/)下载老年(60岁以上)女性乳腺癌患者504例的转录数据及临床数据集。下载数据时TCGA数据库更新至2019年9月10日。
1.1.2乳腺癌ARG数据 使用来自Ensemble数据库的基因注释文件处理原始数据。从人类自噬数据库HADb(http://www.autophagy.lu/)中下载已知的232个ARG,与从TCGA中提取得到的老年女性乳腺癌患者ARG表达矩阵比对,最终确定222个ARG用于分析。
1.2 老年女性乳腺癌ARG相关风险评分的构建使用Caret包将病例按7∶3以无放回随机抽样的方式分为训练集(n=356)和验证集(n=148)。乳腺癌患者总生存期定义为从随机化开始至因任何原因死亡的时间。在训练集中,以222个ARG表达水平作为自变量,以总生存为结局,通过Cox回归分析,使用AIC算法进行优化,筛选与老年女性乳腺癌总生存期密切相关(预后相关)的ARG。以风险评分的中位数作为临界值,将乳腺癌患者分为高风险组和低风险组,比较2组预后相关ARG的表达水平。使用DAVID数据库(http://david.ncifcrf.gov/)对筛选出来的预后相关ARG进行GO功能富集分析和KEGG通路分析。ARG相关风险评分=∑βn×基因n表达水平的平均值,其中β为预后相关ARG的Cox回归系数。
1.3 基于ARG相关风险评分的老年女性乳腺癌预后预测模型的构建及评价在训练集中,以年龄(连续变量)、临床分期(等级资料,同向赋值)、TNM分期(等级资料,同向赋值)作为协变量,以ARG相关风险评分为自变量,以总生存为结局,进行Cox回归分析,构建老年女性乳腺癌预后预测模型。在训练集和验证集中,利用构建的模型分别预测患者3、5、10 a生存概率,绘制时依ROC曲线,计算曲线下面积(AUC),用于评估模型的预测能力。
1.4 统计学处理采用R Studio 1.2.1335进行数据分析。检验水准α=0.05。
2.1 训练集和验证集中乳腺癌病例的一般信息见表1。
2.2 老年女性乳腺癌ARG相关风险评分的构建单因素Cox回归分析得到23个ARG,经多因素Cox回归分析,AIC优化,最终纳入7个老年女性乳腺癌预后相关ARG(表2)用于构建风险评分。以风险评分的中位数作为界值,将乳腺癌患者分为高风险组和低风险组,2组7个ARG表达的热图见图1。
2.3 老年女性乳腺癌预后相关ARG的功能富集分析GO功能富集分析结果表明,这7个ARG参与的生物学过程主要有巨噬细胞分化、蛋白质定位至前自噬体结构、自噬等;涉及的细胞成分主要有内体膜回收;涉及的分子功能主要有半胱氨酸肽酶活性。KEGG通路分析结果表明这些基因与自噬(动物)等通路显著相关。
2.4 基于ARG相关风险评分的老年女性乳腺癌预后预测模型的预测价值经多因素Cox回归分析,在调整了年龄、临床分期、T分期、N分期和M分期等因素后,得到基于ARG相关风险评分的预测模型,各变量参数见表3。
在训练集和验证集中,利用Cox回归模型对患者3、5、10 a生存概率进行预测,利用预测值和实际随访结果绘制ROC曲线,结果见图2。
表1 乳腺癌病例的一般信息 例
表2 老年女性乳腺癌患者预后相关ARG Cox回归筛选结果
图1 低风险组和高风险组7个预后相关ARG表达的热图
表3 基于ARG相关风险评分的预测模型各变量参数
上:训练集;下:验证集
自噬是真核细胞中高度保守的进化过程,参与了一系列细胞稳态的维持。基于ARG的预后预测指标已在包括浆液性卵巢癌、结肠癌和非小细胞肺癌等多种恶性肿瘤中得到报道[9-11]。研究[12]表明,自噬蛋白与乳腺癌预后关系密切。推测ARG在老年乳腺癌预后评估中可能具有广阔的应用前景。
我们基于TCGA和HADb数据库,利用Cox回归模型,筛选出7个老年女性乳腺癌预后相关ARG,并利用于这7个ARG构建了风险评分。这7个ARG中,自噬相关基因4A(autophagy related gene 4A,ATG4A)和ATG4D在自噬体形成过程中起到关键作用[13],ATG4A对于维持具有癌症干细胞特性的亚群以及调节体内宫颈癌细胞的致瘤性是必不可少的[14],而ATG4D可以在结直肠癌的发展中发挥抑癌作用[15]。ATG9B普遍表达于乳腺组织中,其表达缺失可改变乳腺癌中自噬细胞运输的机制,从而加速乳腺癌的进展[16]。NKX2-3(NK2 transcription factor related,locus 3)是NKX家族的重要成员,有研究[17]表明其通过调节Wnt信号通路参与了结肠癌的发生发展。有研究[18]发现,丝裂原蛋白活化激酶9(mitogen-activated protein kinase 9,MAPK9)缺失的乳腺肿瘤模型小鼠的肿瘤潜伏期缩短,肿瘤多样性和基因组不稳定性增加。干扰素γ(interferon gamma,IFNG)作为肿瘤免疫监视和肿瘤发生的调节剂,在乳腺癌组织中的表达水平略高于其邻近的非癌组织[19-20]。囊泡相关膜蛋白3(vesicle-associated membrane protein 3,VAMP3)可以介导含有ATG9和ATG16L1的囊泡之间的异型融合,这与自噬体形成过程密切相关[21],也进一步提示风险评分中的各ARG存在内部联系;此外,有研究[22]表明富含胆固醇的膜微结构缺陷可促使VAMP3所介导的自噬体生成及乳腺癌多柔比星耐药的发生。
我们利用Cox回归分析,建立了一个基于ARG相关风险评分,并经年龄、临床分期、T分期、N分期、M分期调整的老年女性乳腺癌预后预测模型。ROC分析结果表明,该模型预测老年女性乳腺癌3、5及10 a生存率的准确性良好,有助于高危患者的识别及建立更精确的个体化治疗策略。
本研究也存在一些局限性。因ARG的临床检测较少,缺少足够的病例,不能验证该模型的实际预测能力;此外,风险评分中包含的ARG的相互关系还需要进一步研究。
综上,我们建立了一个包括7个ARG的老年女性乳腺癌预后预测的方法,但仍需前瞻性临床试验进一步验证自噬相关指标在预测老年女性乳腺癌预后方面的临床价值。