郭 然,侯世科,陈孝储
乳腺癌是近年来女性中发病率和病死率最高的恶性肿瘤,在我国每年新发的病例约有27.9万,并以2%的速度逐年增长[1]。尽管当前的一系列综合治疗措施使早期乳腺癌患者的生存率大幅度提高,但仍有约30%的患者会在远期出现复发或转移[2]。因此进一步寻找能够提示乳腺癌患者预后指标并完善其治疗策略,对于提高该类患者的治疗效果尤为重要。磷酸甘油酸激酶1 (phosphoglycerate kinase 1, PGK1) 是糖酵解过程中一种重要的催化酶,有研究表明,其在肝细胞癌、结肠癌、胰腺癌、肾细胞癌等多种癌症中均会异常表达,并调控肿瘤细胞的增殖和转移[3-6]。但PGK1在乳腺癌患者中能否作为一种提示患者预后的指标仍有待进一步探索,其作用机制也有待更为深入的挖掘,故本研究拟通过公开的癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库和生物信息学方法分析PGK1对乳腺浸润癌患者肿瘤分期及生存率的影响,以及潜在的相关机制,从而为乳腺浸润癌的预后判断和治疗指导方面提供一定的参考。
1.1生存曲线分析 从包含TCGA数据网站(http://www.linkedomics.org)下载乳腺浸润癌患者数据集TCGA_BRCA RNASeq和TCGA_BRCA Clinical,筛选出同时包含基因表达数据和生存时间数据信息的患者共1051例。按照PGK1基因的表达水平由高到低进行排序,将排在前50%的患者设为高表达组(n=526),其余患者设为低表达组(n=525),并应用GraphPad Prism 软件绘制2组患者的生存曲线。
1.2PGK1在不同肿瘤分期中的比较 筛选出同时包含肿瘤分期信息和基因表达水平的患者数据,根据肿瘤的TNM分期,将患者分别归入相应的各组,比较不同分期乳腺浸润癌患者的PGK1基因相对表达水平。
1.3PGK1相关基因筛选 利用Omisc软件,将患者检测的所有基因表达水平逐一与PGK1表达水平进行相关性检验,根据相关系数选取与PGK1表达相关性最高的50个基因,并绘制基因热图[7]。
1.4富集分析 将筛选出的50个相关基因导入String在线数据库(http://string-db.org/)进行基因本体(gene ontology, GO)富集分析(生物学过程、 细胞组成、分子功能)和京都基因与基因组百科全书通路(the Kyoto Encyclopedia of Genes and Genomes Pathway, KEGG 通路)富集分析。
2.1PGK1表达差异对生存时间的影响 PGK1高表达组乳腺浸润癌患者的中位生存时间低于PGK1低表达组,差异有统计学意义(P<0.05)。见图1。
图1 2组乳腺浸润癌患者生存曲线比较
PGK1为磷酸甘油酸激酶1
2.2不同分期乳腺浸润癌患者PGK1表达水平比较 ①根据临床分期将乳腺浸润癌患者分组,则4组间PGK1表达水平差异有统计学意义(F=6.079,P<0.01)。Ⅰ期患者PGK1表达水平显著低于Ⅱ~Ⅳ期的患者,IV期患者PGK1表达水平显著高于Ⅰ~Ⅲ期的患者(P<0.05)。②根据病理学T分期,4组间PGK1表达水平差异有统计学意义(F=8.373,P<0.01),T2期患者PGK1表达水平显著高于T1期和T3期患者,T4期患者PGK1的表达水平均高于其他3期的患者(P<0.05)。根据N分期4组间PGK1表达水平差异无统计学意义(F=0.860,P=0.461)。根据M分期,M1期患者PGK1表达水平高于M0期患者(t=-2.77,P=0.006)。见图2。
图2 不同分期乳腺浸润癌患者PGK1表达水平比较
PGK1为磷酸甘油酸激酶1
2.3PGK1相关基因的筛选 在检测的20 154个基因中,有11 872个基因与PGK1存在相关性(P<0.05),见图3A。选取与PGK1表达相关系数最高的前50个基因,并绘制基因热图,见图3B。其中细胞死亡诱导DFFA样效应因子c(Cell death-inducing DFFA-like effector c, CIDEC)和水通道蛋白7(Aquaporin-7, AQP7)与PGK1表达水平的相关系数最高(分别为r=0.8220,P<0.05;r=0.8216,P<0.05)。见图3C和3D。
2.4GO富集分析和KEGG通路富集分析 对筛选的50个基因进行GO富集分析可见,主要涉及的生物学过程包括代谢过程、对刺激的反应、生物调节、多细胞组织过程和细胞通讯;主要涉及的细胞组分为膜、细胞外空间、囊、细胞质和内膜系统;主要涉及的分子功能为蛋白质结合、离子结合、转运活动、水解酶活性和脂质结合。见图4。KEGG通路富集分析可见主要涉及的信号通路为PPAR信号通路、调节脂肪细胞中的脂肪分解、AMPK信号通路、脂肪细胞因子信号通路和酪氨酸代谢通路。
PGK1由417个氨基酸组成,是糖酵解途径中的一种重要催化酶,可催化 1,3-二磷酸甘油酸和ADP 生成3-磷酸甘油酸和1分子ATP,为生理过程提供所需能量[8]。近年来研究发现,PGK1还在多种肿瘤中高表达并发挥调控肿瘤细胞增殖与转移的作用。Wang等[9]在前列腺癌细胞中发现,PGK1高表达可通过抑制黏附相关蛋白E-钙黏素的表达,从而降低细胞之间的黏附,增加肿瘤细胞的侵袭能力。Xie等[10]发现PGK1在肝细胞癌组织中存在显著过表达,且PGK1的过表达与肝细胞癌患者的不良预后相关。抑制PGK1表达后可显著降低癌细胞的增殖和转移,但是在乳腺浸润癌中PGK1是否同样发挥重要作用却鲜有报道。本研究通过对公开数据库的挖掘发现,PGK1高表达的乳腺浸润癌患者远期生存率更低,且病理分期越高的患者,PGK1表达水平越高,这表明PGK1可提示乳腺浸润癌患者预后不良。与Fu等[11]研究结果类似,该研究发现敲低PGK1表达可通过影响缺氧诱导因子1α的功能,逆转乳腺浸润癌细胞的上皮-间质转化过程,并显著抑制肿瘤细胞侵袭。这可能与肿瘤细胞代谢特点有关,正常细胞在向恶性肿瘤转化的过程中往往伴随着代谢途径的重塑,即无论氧供是否充足,都主要依靠糖酵解途径供能,也称为warburg效应,这也是肿瘤细胞为了适应自身过快增殖而造成的低氧低糖微环境所发生的一种改变[12]。
图3 PGK1相关基因筛选结果
A.PGK1与各基因的相关性分析结果;B.与PGK1表达相关系数最高的前50个基因;C.CIDEC基因与PGK1表达的相关系数基因;D.AQP7基因与PGK1表达的相关系数;CIDEC为细胞死亡诱导DFFA样效应因子c,AQP7为道蛋白7
图4 GO富集分析
PGK1是糖酵解途径中重要的催化酶之一,其高表达可提高肿瘤细胞的代谢水平,增强肿瘤对无氧环境的适应能力[13]。但除了在糖酵解发挥重要作用外,PGK1是否还参与到了其他的信号通路从而影响乳腺肿瘤患者预后仍有待深入探索,为此本研究进一步探索了与PGK1表达相关系数较高的基因及其相关机制。本研究结果显示,CIDEC基因和AQP7与PGK1表达水平的相关系数最高,CIDEC基因又被称为脂肪特异性蛋白27,该基因位于 3 号染色体 3p25,编码一个细胞死亡诱导DNA碎片因子样效应子家族的成员,蛋白分子量为 27.3 kDa,其在脂肪组织中的表达水平最高,可促进脂肪细胞内脂滴的形成,并可能介导脂肪细胞的凋亡[14]。Grahn等[15]报道,CIDEC在人脂肪细胞中过表达,其可增加细胞中甘油三酯含量并降低脂肪分解作用,而敲除将小鼠的 CIDEC基因可见机体对储存脂肪酸的消耗增加[16],这提示CIDEC或许可通过促进脂肪蓄积,从而提高肿瘤组织能量供应,促进肿瘤生长。
AQP7是水通道蛋白家族13个成员之一,其编码的蛋白质定位在质膜上,允许水、甘油和尿素在细胞膜上运动,该基因同样在脂肪组织中呈高表达,在脂肪组织中编码的蛋白有利于甘油的流出[17]。既往研究发现AQP7与多种肿瘤的发生相关,其过表达可促进肿瘤细胞的迁移与增殖,并参与肿瘤的血管生成、局部侵袭和远处转移,有研究表明AQP7在乳腺中分布较为广泛,其高表达可能一方面通过增加微血管的水渗透性参与细胞生长,另一方面通过调节细胞膜对甘油的通透性而提高肿瘤组织的能量供应[18]。富集分析结果可见,PGK1可以预测乳腺浸润癌患者预后不良的潜在机制主要涉及其对物质代谢的影响,特别是脂质的代谢,这也与肿瘤组织无限增殖需要大量能量供应相一致。
综上所述,本实验通过数据挖掘证实PGK1在提示乳腺浸润癌患者预后中发挥重要作用,这可能与其通过调控物质代谢水平,从而为肿瘤细胞提供更多能量,促进肿瘤细胞生长有关,这为乳腺浸润癌的机制和药物治疗研究提供了一定参考;但同时PGK1可能涉及多条信号通路,这仍有待于进一步研究。