成天琼,陈学农
(1.遵义医科大学 研究生院,贵州 遵义 563099;2.遵义医科大学附属医院 针灸科,贵州 遵义 563099)
结肠癌(Colon cancer,CC)是世界上常见的侵袭性消化道肿瘤,随着中国经济和生活方式的改善,中国的结肠癌发病率近年来总体呈上升趋势[1-2]。尽管对治疗方案的改进如靶向治疗等已大大改善了结肠癌患者的临床结局,但大多数患者由于局部复发和远处转移而使治疗失败。因此,预测远处转移和不良预后的风险对结肠癌的治疗至关重要。最近,越来越多的证据表明癌细胞的代谢与其来源的正常细胞有很大不同[3]。癌细胞中的葡萄糖代谢主要特征是葡萄糖摄取增加和有氧糖酵解增强[4]。糖酵解增强和谷氨酰胺分解是癌症代谢重编程的主要标志,代谢重编程和低氧导致多种癌症对传统化疗药物的抵抗,这使癌细胞能够维持较高的增殖速率并抵抗某些细胞死亡信号[5-6],这种现象是发现新的治疗靶标和新的抗癌药物的焦点。除了提供细胞能量外,糖酵解的代谢中间体在大分子生物合成中也起着关键作用,因此在营养供应减少的情况下赋予了癌细胞更多的优势[4]。糖酵解的致癌调控和糖酵解成分的多方面作用表明了肿瘤糖酵解的生物学意义,有必要阐明结肠癌糖酵解的潜在机制。基于此背景,本研究用来自TCGA的结肠癌mRNA表达数据鉴定出与糖酵解显著相关的231个mRNA,并开发了一个4糖酵解基因风险谱来有效地预测CC患者的预后,为CC的诊断和治疗提供了新的靶标,可促进人类对CC发病机理的认识并提高诊断和治疗水平。
1.1 临床信息和mRNA表达数据收集 从TCGA(https://cancergenome.nih.gov/)中下载结肠癌患者的临床数据和mRNA表达谱。一共包括473个CC样本和41个相邻的正常组织样本。提取具有完整临床信息的444例结肠癌患者资料,包括性别、年龄、TNM分期、生存时间和生存状态等。
1.2 数据处理和风险参数计算进行基因富集分析 确定CC和正常组之间所鉴定的糖酵解相关基因集是否存在显著差异。接下来,分析CC样品和邻近的非癌性组织中mRNA的表达水平,借助R语言limma包,以|log2|>1且P<0.05为筛选标准,提取差异表达的糖酵解基因。使用单变量Cox回归分析确定与总体生存率(Overall survival,OS)相关的糖酵解相关基因,然后对其进行多变量Cox回归以筛选与预后有关的糖酵解基因并获得风险比(Hazard ratio,HR)。然后将筛选的糖酵解基因分为危险型(HR> 1)和保护型(0
1.3 统计学分析 使用Kaplan-Meier生存曲线和对数秩方法(Log-rank)估计风险参数的准确性。然后进行多变量Cox分析以检测风险参数是否独立于其它临床特征,以上所有统计分析均使用R 3.6.1(www.r-project.org)进行,P<0.05具有统计学意义。
2.1 筛选预后相关糖酵解基因 首先,我们获得了473例CC患者的临床数据和mRNA的表达数据集。GSEA确定glycolytic process、hallmark glycolysis、reactome glycolysis三个糖酵解相关基因集在CC中上调(见图1)。使用Wilcoxon秩和检验分析了473个CC和41个正常癌旁样品中326个糖酵解相关基因的表达,并鉴定了231个差异表达的糖酵解相关基因(FDR<0.05,|log2FC|>1)。
A:glycolytic process;B:hallmark glycolysis;C:reactome glycolysis。图1 正常组织和结肠癌组织3个糖酵解基因集的GSEA富集
对CC中326个差异表达的糖酵解相关基因的表达进行单变量Cox回归分析,以鉴定预后相关的糖酵解差异表达基因。数据显示,6个差异表达的糖酵解相关基因的表达与CC患者的OS相关(P<0.05)。接下来,进行多变量Cox回归分析进一步确定STC2、ANKZF1、GPC1、PPARGC1A四个糖酵解相关基因为CC的独立预后标志物。STC2,ANKZF1 和 GPC1是高风险基因,HR> 1是危险因素,患者生存率较低;PPARGC1A是保护性基因,HR <1是保护因素,患者生存率较高(见表1)。
表1 结肠癌中4个OS相关糖酵解基因
我们通过分析cBioPortal数据库(http://cbioportal.org)中的526个CC样品,评估了4个风险基因的改变。结果显示,共42例(8%)的样品查询的风险基因发生突变。STC2基因、ANKZF1基因各在1.3%的病例发生错义突变;GPC1基因在2.3%的病例中发生改变,表现为截断突变、错义突变和深度删除;PPARGC1A基因在4%的病例中发生了改变(见图2A)。相邻的正常组织和CC组织之间的4个基因的表达差异的比较发现在结肠癌组织中4个糖酵解基因中STC2(见图2B)、ANKZF1(见图2C)、GPC1(见图2D)显著上调;PPARGC1A(见图2E)显著下调。
A:526个结肠癌临床样本中选定糖酵解基因的改变;B-E:4种选定糖酵解基因的表达。图2 鉴定与患者生存有关的mRNA
2.2 基于糖酵解基因标签的预后风险评分模型的建立与验证 通过线性组合所选基因的表达值,这些基因的权重由多变量Cox回归分析的系数加权而来,我们建立了以下预后风险参数公式。风险参数= 0.0511×SCT2的表达+0.0806×ANKZF1的表达+ 0.0328×GPC1的表达+ (-0.2469)×PPARGC1A的表达。计算每个患者的风险参数,并使用中位数将患者分为高风险组和低风险组。患者的风险评分分布(见图3A)和生存状况(见图3B)如图所示。Kaplan -Meier曲线显示,高风险分组的患者预后较差,而低风险参数组的患者死亡率较低(对数秩检验:P<0.001,见图3C)。此外,热图显示了4种mRNA的表达谱(见图3D),与低风险组相比,高风险组中风险型mRNA(STC2,ANKZF1和 GPC1)的表达水平更高。相反,高风险组中保护型mRNA(PPARGC1A)的表达水平低于低风险组。使用ROC曲线测量了5年OS的预后风险模型的预测性能,AUC值为0.704(见图3E)。
A:患者的mRNA风险参数分布;B:结肠癌患者的生存状况(红点表示死亡的患者,蓝点表示存活的患者;C:高风险分(红线)和低风险分(蓝线)患者的 OS 的 Kaplan-Meier 生存曲线;D:四个糖酵解基因表达谱的热图;E:ROC 曲线显示结肠癌患者在5年 OS 时的 AUC 值,AUC=0.704。图3 与风险参数相关的4糖酵解基因可预测结肠癌患者的OS
通过单因素和多因素分析将风险参数的预后价值与临床病理参数进行比较。选择具有完整临床数据的样品(见表2),444名CC患者的中位年龄为69岁。在441例患者中,有76例(17.2%)患有Ⅰ期肿瘤,有178例(40.3%)患有Ⅱ期肿瘤,125例(28.3%)患有Ⅲ期肿瘤, 62例(14.0%)患有Ⅳ期肿瘤。我们将风险评分、TNM分期、年龄作为独立的预后指标,因为这些因素在单变量(见图4A)和多变量(见图4B)分析中均有差异。值得注意的是,风险参数显示出显著的预后价值(P<0.001)。
表2 结肠癌患者临床病理资料
Kaplan-Meier生存曲线和对数秩检验显示高危组的患者预后较差,OS的单变量Cox回归分析显示了一些可预测CC生存的临床病理参数,包括年龄,TNM分期和风险评分。然后,我们使用Kaplan-Meier生存曲线来验证上述结论,该结论显示出一致的结果,年龄大于65岁(见图4C),T3-4期(见图4D),M1期(见图4E),N1-2期(见图4F)与预后不良相关。这些结果进一步证实了分析的可靠性。经过进一步的数据挖掘和分层分析后,生存曲线未受年龄(≤65或者>65岁)的影响,可认为4个糖酵解基因是CC患者的可靠预后指标,其中高危组的患者预后较差(见图5A)。在男女两个亚组高风险评分组患者预后较差,基于糖酵解基因标签的风险参数可用于预测CC患者的预后(见图5B)。但是,当我们根据TNM将CC患者分为不同亚组时,风险参数不再可以单独用作T1-2、N0和M1亚组的预后指标(见图5C),表明该风险参数受CC患者TNM分期的影响,这一点需要进一步探索。
A:单因素Cox;B:多因素Cox;C-F:风险评分分布与临床参数之间的关系。图4 CC患者OS的Cox回归分析
A:年龄;B:性别;C:TNM分期。图5 Kaplan-Meier曲线评估临床特征分组患者的风险参数的预后价值
最近的研究表明,年龄和转移、分期等临床病理特征不足以精确地预测癌症患者的预后,于是越来越多的mRNA被鉴定为肿瘤进展或预后的生物标志物。例如Deepankar Chakroborty等[7]的研究表明L1TD1是结肠癌的预后标志;Piero Dalerba等[8]认为CDX2可作为II期和III期结肠癌的预后生物标志物;郑红等[9]的研究表明USP6不仅可作为结肠癌独立预后因素,还促进结肠癌的侵袭和转移。然而,这些生物标记物,特别是单个基因表达水平可能受到多种因素的影响,不足以准确独立地预测患者的预后,从而阻止了这些标记物被用作可靠和独立的预后指标。因此,本研究使用由多个预后相关标志物组成的统计模型,结合每个组成糖酵解基因的预测效果以改善预测能力。在评估肿瘤患者的预后方面,该类模型比使用单一生物标志物准确[10- 11],故这种模型得以广泛应用。
高通量基因测序技术的飞速发展为大型生物数据研究奠定了基础[12-13],从单个标本中提取大量的基因组数据,可以鉴定新的诊断、预后或药理生物标志物[14]。在最近的研究中,常常通过使用微阵列和RNA测序数据构建基因表达水平或突变新的预后标志,然后使用Cox比例风险回归模型进行识别和验证[15-16]。在当前的研究中,我们确定了3个在GSEA中显示出显著差异的糖酵解基因集。进行单因素和多因素Cox回归分析最终确定出4种糖酵解基因组合对CC患者有预后预测价值。我们使用TCGA中的CC数据集收集糖酵解相关基因并比较正常和CC组织的数据。Kaplan-Meier生存估计显示低风险参数的患者预后较好。但是,由于TCGA数据库中缺乏患者的转移和复发信息,我们只能使用OS评估患者的预后,这是我们研究的局限性之一。此外,在分层分析中,当我们根据TNM将CC患者分为不同亚组时,风险参数不再可以单独用作T1-2、N0和M1亚组的预后指标,表明该风险参数受CC患者TNM分期的影响,这一点需要进一步探索。在这项研究中,用生物信息学方法探索mRNA危险因素的特征及其临床意义,并探索了一种新的挖掘潜在预后标志物的方法。
肿瘤的特征在于不受控制的细胞增殖,这不仅消除了对细胞周期的控制,而且还促进了细胞能量代谢,最终导致肿瘤细胞的生长和分化[17]。早在1920年,德国生物学家奥托·沃伯格(Otto Warburg)发现了癌细胞中能量代谢的异常[18]。细胞能量主要来自糖代谢,大部分能量由ATP提供,尽管有氧气,但肿瘤细胞主要依靠糖酵解来进行代谢,并消耗大量葡萄糖且伴有乳酸的产生。葡萄糖代谢异常的这种现象被称为有氧糖酵解或Warburg效应[19]。很多恶性肿瘤中糖酵解增强,包括CC,其促进合成代谢,与肿瘤的发生发展息息相关[20]。研究表明,肿瘤细胞能量异常,可以通过调节底物的摄取和与糖酵解相关的酶来精确调节ATP的合成,使其适应营养微环境,满足恶性增殖所需的能量和营养,并迅速增殖[21]。Sun等[22]的研究表明二氯乙酸逆转糖酵解表型可在体内外抑制转移性乳腺癌细胞的生长。Xu等[23]报道了抑制癌细胞中糖酵解作用是克服与线粒体呼吸缺陷和缺氧有关耐药性的新策略。最近的研究表明,有氧糖酵解在CC中起重要作用,白介素22通过靶向调控己糖激酶-2促进人结肠癌细胞有氧糖酵解和CC的进展[24]。NDRG2通过抑制糖酵解和谷氨酰胺分解抑制大肠癌细胞的生长和增殖[25]。有研究表明,酪蛋白激酶1δ(CK1δ)和酪蛋白激酶1ε(CK1ε)参与DNA复制、分化和凋亡,从而参与肿瘤发生发展的调节。CK1δ/ε的特异性抑制剂IC261可以抑制结肠癌细胞的生长,并增加有氧糖酵解的水平,这是由p53依赖性方式调节的,表明靶向调控CK1δ/ε和糖酵解可能是结肠癌的另一治疗方向[26]。但是,尚未建立基于糖酵解相关基因标签的结肠癌预后评分系统。故我们使用生物信息学方法,确定了与细胞有氧糖酵解相关的基因(STC2、ANKZF1、GPC1和PPARGC1A),并证明了其在CC中的预后价值。该风险评分模型还需要在多中心临床试验和前瞻性研究中进一步验证。
STC2是一种分泌型糖蛋白激素,可调节许多生物学过程,包括细胞增殖、凋亡、肿瘤发生和动脉粥样硬化[27]。最近的研究表明,STC2表达在多种肿瘤中上调,包括结肠癌, STC2过表达与晚期肿瘤分级、肿瘤浸润、转移和不良预后相关[28]。沉默STC2后,大肠癌细胞的生存能力、迁移和侵袭显著降低[29]。ANKZF1促进结肠癌的血管生成,这可能解释为什么ANKZF1上调与结肠癌的不良OS相关,ANKZF1可能是特异性的结肠癌的标志物,将来可能会用于个性化药物[30]。GPC1外泌体及其调控性miRNA是检测和靶向治疗结直肠癌的特异性标志物[31]。PPARGC1A调节线粒体的生物发生,减少血管平滑肌细胞的衰老,通过协调参与葡萄糖和脂肪酸代谢的多种基因的表达,在代谢重编程中起着至关重要的作用[32],葡萄糖代谢和缺氧可以促进肿瘤进展。使用Kaplan-Meier分析和Cox回归分析,我们发现高STC2、ANKZF1、GPC1表达结肠癌患者的OS较差。STC2、ANKZF1、GPC1、PPARGC1A可能是诊断和评估结肠癌患者预后的潜在肿瘤生物标志物。
总之,本研究基于4个糖酵解相关基因的表达水平构建了新的结肠癌预测风险评分模型,可预测CC患者的预后,较高的风险参数表明CC预后较差。这些结果为开发结肠癌细胞能量代谢为靶点的药物及为结肠癌的临床治疗提供了新的思路和方法。