邱雨欢,李留霞
(郑州大学第一附属医院妇产科,河南 郑州 450000)
子宫内膜癌(endometrial cancer,EC)是全球女性中第六大最常见癌[1],也是女性生殖道最常见的恶性肿瘤之一[2],好发于围绝经期及绝经后女性,是为数不多的死亡率不断上升的人类恶性肿瘤之一[3]。大多数EC患者在Ⅰ期被诊断[4],预后较好,5 a生存率可达90%,但是晚期EC的预后较差,Ⅲ期和Ⅳ期患者的5 a生存率分别为47%~69%[5]和15%~17%[6-7]。早期发现和治疗是提高EC患者生存率的最佳途径。因此,对EC发生发展的相关机制进行研究及寻找其可能的干预靶标是改善疾病的诊治和预后的重要方法。
基因表达综合数据库(Gene Expression Ominibus,GEO)中储存了大量癌症组织的基因表达谱数据,目前在基因芯片技术的发展和生物信息学相关工具不断完善的背景下[8],对GEO数据库中癌症相关组织的基因表达谱数据进行分析有助于更快地发现肿瘤组织中的差异表达基因(differentially expressed genes,DEGs),并可进一步寻找到影响疾病发生发展的关键分子,将其作为治疗的靶标,在多种肿瘤机制研究中得到了广泛应用[9]。迄今为止,EC最全的分子研究是通过国家癌症研究所资助的癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库完成的。从基因的角度探索EC的发生、发展机制,将会为EC的诊断及治疗的个体化提供依据。本研究通过生物信息学分析的方法,基于GEO数据库和TCGA数据库筛选与EC发病和预后相关的差异表达基因,以期为EC的研究提供新思路。
1.1 基因芯片数据集信息收集下载GEO数据库中EC的3组高通量测序基因芯片数据,分别为GSEl7025、GSE101158和GSE63678,数据检测类型均为Expression profiling by array,种属设定为Homo sapiens。见表1。
表1 基因芯片数据集信息
1.2 DEGs的提取和分析在基因表达数据集中,以正常组织样本为对照组,以EC组织为实验组,使用在线分析工具GEOZR分别对GSE63678、GSE17025和GSE115810数据集进行分析,筛选在EC中的DEGs,筛选条件为|logFC|≥1并且P<0.05。利用在线软件Bioinformatics and Evolutionary Genomics构建韦恩图,3个数据集的交集被认为是共有DEGs,logFC>0为表达上调的基因,logFC<0为表达下调的基因。
1.3 基因本体论(gene ontology,GO)富集分析和京都基因和基因组百科全书(Kyoto Encyclopedia ofGenes and Genomes,KEGG)通路分析使用DAVID在线数据库分别对表达上调和下调共有DEGs进行功能注释,包括生物过程、细胞组分和分子功能的GO富集分析以及KEGG信号通路分析,P<0.05为差异有统计学意义。
1.4 蛋白-蛋白互作网络(theprotein-proteininteractionnetwork,PPI)构建和分析使用String数据库对上述所得的108个共有DEGs进行分析,构建PPI网络并使用Cytoscape软件进行可视化,使用Cytohubba插件对PPI网络上所有DEGs进行评分,以其中最高相关度的前10个DEGs作为EC发病相关的关键基因。
1.5 关键基因的生存分析生存期(free-survival,FS):从手术病理诊断为EC当日到死亡时间间隔,或至研究终点。下载TCGA数据库中EC数据。利用R的survminer包根据关键基因的表达量进行分组,然后分析其与FS的关系。累计总生存率采用Kaplan-Meier法计算。采用log-rank检验进行差异分析。使用Benjaminiand Hochberg法对得到的假设检验P值做多重检验校正。P<0.05为差异有统计学意义。
2.1 DEGs的提取分别筛选出DEGs(GSEl7025中的6 074个,GSE63678中的1 493个和GSE101158中的483个)。3个数据集所有DEGs之间的重叠包含108个DEGs,如Venn图(图1)所示。与正常组织相比,EC组织中上调基因88个,下调基因20个。
图1 GSE63678、GSE1702和GSE115810数据集的Venn图
2.2 DEGs的GO富集分析和KEGG信号通路分析表达上调基因主要富集在RNA聚合酶Ⅱ启动子转录的调控,DNA模板,序列特异性DNA结合、蛋白质的细胞外基质、神经元分化的正向调节这些生物过程,而表达下调基因主要富集在细胞黏附和核苷酸连接这些生物过程。见表2。KEGG信号通路分析结果显示,表达上调的差异基因主要富集于Wnt信号通路,无KEGG通路在下调基因中富集。见表2。
表2 EC组织中DEGS的GO和KEGG途径富集分析
表2(续)
2.3 DEGs的PPI构建基于String数据库在线分析DEGs的PPI关系,纳入PPI标准为综合得分>0.4,共得到93个PPI节点和104条蛋白互作关系,在所有DEGs中占比86.1%。见图2。使用Cytoscape软件的Cytohubba插件对PPI节点进行评估,选择具有最高度连通性的10个节点DEG作为EC的关键基因(图3),可能在EC发生发展中起到关键作用的基因有JUN、UBE2I、WT1、GATA2、WNT2、CXCL12、ZEB1、TCF4、FOXL2、PRKCA,其在EC均表达上调。
图2 使用Cytoscape构建的DEGs的PPI蛋白互作网络
图3 Cytohubba插件分析出的10个关键基因的互作关系
2.4 关键基因的GO富集分析和KEGG信号通路分析10个关键基因GO富集分析及KEGG信号通路分析结果显示,DEGs主要在细胞核分裂和细胞周期调节等生物过程中发挥重要作用,主要与Wnt信号通路及肿瘤相关信号通路有密切关联。见表3。
表3 EC组织中关键基因的GO和KEGG途径富集分析
2.5 关键基因生存分析结果显示WNT2、TCF4和FOXL2基因的高表达与EC的生存时间有密切关系。见图4。
图4 关键基因的生存曲线
EC的全基因组关联研究[10]主要由国际子宫内膜癌协会联盟推动,并确定了16个与该疾病风险相关的遗传区域。已有研究证实,基因组学改变和信号转导通路的异常在EC发病中起重要的调控作用[11]。Bafligil等[12]对EC的常见变异在EC遗传易感性的作用进行了研究,发现通过多基因风险评分(polygenic risk score,PRS)评估遗传变异的组合效应将成为把患者分为高风险和低风险层的一种手段。此外,将EC的PRS与其他已知的EC风险因素(例如肥胖[13])相结合,可以进一步提高风险分层的准确性[14]。
本研究通过生物信息分析,共筛选108个EC和正常子宫内膜组织差异表达基因,包括上调的差异基因88个,下调的差异基因20个。
108个差异表达基因进行GO富集分析及KEGG信号通路分析的结果表明:差异基因主要富集于RNA聚合酶Ⅱ启动子转录的调控,DNA模板,序列特异性DNA结合、蛋白质的细胞外基质、神经元分化的正向调节及细胞黏附等生物学过程,主要富集于Wnt信号通路。10个关键基因依然富集于细胞核分裂和细胞周期调节生物学途径等生物过程,主要与Wnt信号通路及癌症相关通路信号通路等有关联。
GO分析和PPI分析表明:细胞周期相关的基因和通路在EC发生发展过程中起重要作用。由此可见,细胞周期失调是EC发病的主要机制。
JUN基因翻译转录因子-1(Activator Protein-1,AP-1)是调节细胞周期的重要转录因子。AP-1信号通路被发现是细胞中重要的信号转导通路[15]。通过丝裂原活化蛋白激酶信号通路可以调节JUN基因转录水平,影响AP-1蛋白表达。AP-1表达的增加与多种人类肿瘤相关,在肿瘤形成和进展过程发挥重要作用。UBE2I是E2酶家族的成员,参与翻译后蛋白表达的调控。多项研究表明UBE2I在多种癌症的发生发展中起着关键作用,包括乳腺癌、肝癌[16]、肺癌、头颈部鳞状细胞癌、骨肉瘤[17]和肝细胞癌[18]。WT1编码的蛋白是一种转录因子蛋白,参与了生长因子、细胞周期调控因子、凋亡调节因子和分化标志等基因的转录调控。WT1免疫治疗的临床试验表明,WT1蛋白是一种较强的肿瘤相关抗原,自身能引起一些免疫学和肿瘤学的改变[19]。WT1及其编码蛋白在恶性血液病和实体肿瘤如乳腺癌[20]、肺癌、胰腺癌、前列腺癌等中高表达。ZEB1是控制上皮-间充质转化(epithelial-mesenchymal transformation,EMT)的转录因子网络的主要元素。EMT是一种可逆的胚胎转分化程序,允许从上皮状态部分或完全转变到间充质状态。ZEB1的表达被认为促进了迁移、侵袭和转移,也是大多数人类癌症临床预后较差的决定因素[21]。在人结肠癌、胰腺癌[22]、肺癌和乳腺癌细胞系中,ZEB1的强制表达增加了体外侵袭和迁移能力以及体内转移能力。如今,越来越多的证据表明肿瘤异质性、EMT和ZEB1水平升高是导致耐药性的主要驱动因素[23]。有研究表明,丙戊酸可调控ZEB1启动子[24],可以通过下调丙戊酸来抑制ZEB1和EMT。此外调控ZEB1的DNA内切酶Mus81可能被BET4抑制剂靶向调控[25],它的靶向性代表了一种处理ZEB1介导的耐药的创新治疗方法。ZEB1的下调降低了EC细胞在体内和体外的侵袭和转移能力。FOXL2是编码叉头转录因子的单外显子基因,FOXL2蛋白在调节细胞分裂、增殖和分化相关基因的表达方面起重要作用[26],主要表达于卵巢、眼睑和垂体。FOXL2的上调可能促进了耐化疗性胃癌的转移和EMT[27],并显著缩短了生存时间。以上参与EC发病的关键分子有望成为具有临床价值的EC生物标志物和治疗靶标,仍需结合进一步实验验证。
10个关键基因KEGG通路富集分析结果提示这些基因主要与Wnt信号通路及癌症相关通路信号通路等有关联。
Wnt信号通路是研究最多的信号通路之一[28],在细胞分化、增殖、存活、迁移等多个生物学过程中发挥着关键作用[29]。Wnt信号通路通过刺激和抑制机制受到严格调控,当这些调控机制因突变而丢失或改变时,Wnt信号异常激活,导致细胞过程失调[30]。Wnt信号的过度激活与肿瘤发生和癌症进展有关,Wnt靶基因与肿瘤增殖、转移、EMT、复发、化疗耐药和抗肿瘤免疫调节相关[31]。最近,越来越多的研究评估Wnt信号在妇科恶性肿瘤中的作用[32]。Wnt信号通路分为两类:典型的β-catenin依赖和非典型的β-catenin独立通路。典型途径是一种基本的生长控制途径,已知在许多领域有重要的作用,包括癌症。非典型途径介导细胞极性和调节细胞内钙的水平[33]。妇科恶性肿瘤中大多数Wnt信号通路异常存在于典型通路中。最近,越来越多的研究评估Wnt信号在妇科恶性肿瘤中的作用。具体来说,Wnt信号促进卵巢癌的转移和耐药[34],在肿瘤发生中起着至关重要的作用,不仅与EC复发有关,还参与人类乳头状瘤病毒在宫颈癌相关肿瘤发生和转移。研究表明,Wnt/β-catenin信号通路在妇科恶性肿瘤中的活性不仅阐明了这些癌症的重要行为,而且也阐明了Wnt/β-catenin信号通路在未来治疗中的可能靶点[35-36]。Wnt/β-catenin信号通路参与正常子宫内膜的调节和子宫内膜增生或恶性肿瘤的异常发展。正常的子宫内膜经历周期性的结构变化,这是女性月经周期的一部分。在增殖期,雌激素促进子宫内膜腺体和间质的增殖,在黄体/分泌期,黄体酮诱导子宫内膜分化和分泌活性。这个周期的不平衡,特别是连续的无对抗的雌激素,可导致子宫内膜增生和/或恶性肿瘤。针对Wnt/β-catenin信号通路的靶向治疗已开始在多种癌症类型中进行评估[37],但由于Wnt信号通路抑制剂的全身毒性[38-39],需要进一步研究药物对特定组织的靶向性,Wnt/β-catenin信号通路抑制剂在妇科恶性肿瘤中的作用仍需进一步研究及评估。有研究证实了WNT2的mRNA和蛋白水平在宫颈癌中表达上调。此外,通过抑制WNT2/βcatenin通路,敲除WNT2导致细胞运动性下降和侵袭性逆转EMT。鉴于这些发现,WNT2是宫颈癌一个潜在的预测因子和一个有希望的治疗靶点。在本研究中,高WNT2表达与EC的预后不良有关。
TCF4是T细胞家族的一个转录因子,与β-catenin结合,调节Wnt靶基因的转录,是Wnt信号通路的重要组成部分[40]。无翼型Wnt信号通路在胚胎发育中起着重要作用,该通路的失调会导致肿瘤等病理状况[41]。
相关研究表明FOXL2可抑制宫颈鳞癌细胞增殖[42],主要通过降低Ki67表达[43]来促进细胞凋亡。关于FOXL2在其他类型肿瘤中的作用机制已得出各种结论[26]。然而,它在EC中的作用尚不清楚,因此,需要用分子实验进一步澄清。
多基因组学改变和信号转导通路的异常在EC发病中起重要的调控作用。JUN、UBE2I、WT1、GATA2、WNT2、CXCL12、ZEB1、TCF4、FOXL2及PRKCA基因相对高表达的改变可能在EC的发病中发挥着重要作用,但仍需要进一步的研究来阐明这些潜在的生物标志物在EC进展中的作用和潜在机制。WNT2、TCF4和FOXL2基因在EC的预后可能有着密切关系。Wnt信号通路对于子宫内膜癌的发病有重要作用,为子宫内膜癌新的诊断标志物和治疗靶点筛选提供新思路。然而,本研究有局限性,因为研究结果未在临床样本中得到验证,还需要更深入的实验研究。