张明洁,史菲菲,何嘉欢,刘红彦
(河南大学人民医院,河南 郑州)
卵巢癌(ovarian cancer, OC)是我国第三大妇科恶性肿瘤,其致死率极高[1]。浆液性卵巢癌是OC最常见的组织学类型,约占70%[2]。由于OC早期缺乏有效的筛查方法,因此得到确诊时通常是疾病晚期,5年生存率仅为30%~40%[3]。目前卵巢癌的发病机制尚不明确,用于诊断疾病发生发展的生物标记物也有限[4]。因此,对OC相关的特定生物标志和信号通路研究将有助于揭示OC的分子发病机制,改善患者预后。本研究从GEO数据库下载不同的基因数据集,采用GEO2R筛选出浆液性卵巢癌的差异表达基因并对其进行一系列分析,筛选出关键基因并分析其与患者总生存期关系,为浆液性卵巢癌分子机制的深入研究和诊疗策略的制定提供一定的理论依据。
GEO(Gene Expression Omnibus)数据库是免费的微阵列芯片和基因谱数据库,本研究从GEO数据库[5](http://www.ncbi.nlm.nih.gov/geo/)筛选数据集GSE36668[6]、GSE54388[7]、GSE38666[8]。GSE36668包含4个浆液性卵巢癌组织样本和4个正常卵巢组织样本,GSE54388包含16个浆液性卵巢癌组织样本和6个正常卵巢组织样本,GSE38666包含18个浆液性卵巢癌组织样本和12个正常卵巢组织样本,如图1。
采用GEO自带分析软件GEO2R[9](http://www.ncbi.nlm.nih.gov/geo/geo2r)对GSE36668、GSE54388、GSE38666基因数据集进行分析,以P<0.05,|log (FC)| >1为标准筛选浆液性卵巢癌组织和正常卵巢组织的差异表达基因(differential methylation gene, DEGS)。然后采用Venny2.1.0[10](https://bioinfogp.cnb.csic.es/tools/venny/index.html)在线工具重叠三个数据集之间的DEGS。
图1 GSE36668、GSE54388、GSE38666基因数据集样本
图2 A.上调差异表达基因B.下调差异表达基因
DAVID(functional Annotation bioinformatics microarray analysis, http://david .abcc.ncifcrf.gov/)是一个功能注释工具综合数据库[11]。为了更加深入了解DEGS的功能,本研究应用DAVID对DEGS分别进行GO(gene ontology)功能和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析,P值<0.05具有统计学意义。
采 用STRING[12](search tool for the retrieval of interacting genes, https://stringdb.org/)在 线 工 具 构 建DEGS的蛋白互作(protein-protein interaction, PPI)网络,中心度分数>0.4被认为是重要的。输出TVS格式,并导入到Cytoscape 3.5.1软件[13](http://www.cytoscape.org/download.php)。随后在Cytoscape软件引入插件cytoHuba筛选PPI网络的Hub基因,同时应用插件MCODE构建PPI网络的功能模块。
GEPIA(http://gepia.cancer-pku.cn/)是用于癌症和正常基因表达谱分析及交互式分析的网络服务器[14]。我们利用GEPIA在人体图中进行了肿瘤组织和正常组织样本的中值表达分析。Kaplan-Meier是用于评估ECA、TCGA和GEO数据库基因对生存的影响的一种常用网络工具[15]。本研究采用Kaplan-Meier方法探索Hub基因与浆液性卵巢癌患者总生存率之间的关系。
通过GEO2R在线工具,本研究从GSE36668基因数据集的浆液性卵巢癌组织和正常卵巢组织中筛选出6504个DEGS,其中包括3296个上调和3208个下调的DEGS;从GSE54388基因数据集筛选出3592个DEGS,包括2134个上调和1458个下调的DEGS;从GSE38666基因数据集筛选出12450个DEGS,包括9506个上调和2944个下调的DEGS。重叠三个数据集的上调DEGS获得867个上调的DEGS;重叠三个数据集的下调DEGS获得616个下调的DEGS。Venny图见图2。
为了进一步研究DEGS在浆液性卵巢癌的功能,采用DAVID数据库对全部DEGS进行GO功能和KEGG通路富集分析,GO功能分析发现上调的DEGS主要在细胞核、细胞质、细胞膜等结构表达,参与细胞分裂、姐妹染色的单体的凝聚力、细胞增殖、转录正调控、蛋白质结合、细胞的黏附等生物学过程;下调的DEGS主要在细胞质、细胞膜、细胞外基质外来体等结构表达,参与转录正负调控、细胞增殖负调控、细胞黏附、蛋白质结合、特定DNA序列结合、锌离子结合等生物过程(表1)。上调差异表达基因KEGG通路富集在细胞周期、癌症、抗生素生物合成、代谢和PI3K-Akt信号通路;下调差异表达基因KEGG通路富集在干细胞功能性调控、癌症、蛋白聚糖和黏着斑等信号通路(表2)。
表1 与浆液性卵巢癌相关的差异表达基因的主要GO富集分析
采用STRING和Cytoscape绘制DEGS的PPI网络并图像可视化(图3A)。采用插件MCODE筛选PPI功能模块(图3B)。运用插件CytoHubba筛选 出10个Hub基 因,包 含AKT1、GAPDH、CKD1、CCNB1、CDC20、BRCA1、CCNA2、AURKB、TOP2A、MAD2L1(图4)。
在人体图中肿瘤和正常样品的中值表达显示了CDC20、AURKB、CCNB1、AKT1和GAPDH的表达情况(图5)。采用Kaplan-Meier方法评估Hub基因与浆液性卵巢癌患者的预后关系,发现CDC20(P=0.015)、AURKB(P=0.039)、CCNB1(P=0.019)、AKT1(P=0.0031)和GAPDH(P=0.041)的高表达与浆液性卵巢癌患者预后不良相关(图6)。我们推测,CDC20、AURKB、CCNB1、AKT1和GAPDH基因可能是浆液性卵巢癌预后不良的潜在生物标记物。
图3 DEGS的PPI网络(A)和顶级模块(B)
图4 针对浆液性卵巢癌组织和正常组织,采用CytoHubba插件筛选出10个Hub基因,A.红色表示高富集,黄色表示低富集,B.Hub基因的度值
表2 与浆液性卵巢癌相关的差异表达基因的KEGG通路分析
卵巢癌是妇科恶性肿瘤中最常见的死亡原因,尽管卵巢癌通常对铂类化合物和紫杉烷类药物的一线化疗药物反应良好,但大多数患者会复发并产生化学耐药性[16]。因此,了解该病的特定生物标志对于疾病的早期诊断和治疗至关重要。
本研究表明,CDC20、AURKB、CCNB1、AKT1及GAPDH基因是卵巢癌差异表达中的上调基因,其过表达与卵巢癌患者的预后差相关。CDC20(细胞分裂周期20)是细胞有丝分裂后期促进复合物APC活化所需的纺锤体组装检查点分子,从而调控染色体单体分离,使细胞分裂进入分裂后期[17,18]。研究表明,CDC20的敲低可降低胰腺肿瘤细胞[19]和肝癌细胞[20]的增殖并诱导G2/M细胞周期停滞。CDC20也被认为与多种肿瘤的预后相关,如结直肠癌[21]、胰腺癌[22]、肺癌[23]和乳腺癌[24]。AURKB(极光激酶B)是一种丝氨酸/苏氨酸激酶,主要参与调控细胞有丝分裂和减数分裂过程[25]。研究证明,AURKB在多种恶性肿瘤如结直肠癌[26]、神经母细胞瘤[27]和肺癌[28]细胞中高表达。CCNB1的高表达与多种肿瘤的发生发展相关,如膀胱癌[29],大肠癌[30],乳腺癌[31]和垂体腺瘤[32]。根据文献报道,AKT1基因E17K是乳腺癌的潜在生物标志[33];AKT1基因在骨肉瘤组织中高表达,敲低该基因可以抑制骨肉瘤细胞的生长[34];是硬化性肺细胞瘤的遗传标志[35]。GAPDH酶是有氧糖酵解途径的关键酶,其功能具有多效性,GAPDH的非糖酵解功能包括调节细胞死亡、细胞自噬及DNA修复等,被认为是癌症和神经退行性疾病等多种疾病的潜在治疗靶点[36]。
本研究进一步进行了功能富集分析,以寻找与这些差异基因相关的蛋白功能。在GO分析中,细胞分裂、细胞增殖及转录的正负调控被富集。细胞的异常增殖与肿瘤的发生有关,表明有相关癌基因的过度表达或抑癌基因的表达降低。此外,PI3K-Akt、蛋白聚糖及黏着斑信号通路被富集。PI3K-Akt信号通路参与多细胞过程,其过度激活与肿瘤的发生、细胞增殖、细胞生长、细胞凋亡、侵袭、转移、免疫微环境及癌细胞的耐药性密切相关[37]。富含亮氨酸的小蛋白聚糖(SLRP)是细胞外基质的组成成分,可以调节细胞的增殖、迁移和血管生成。蛋白聚糖是一类调节胶原纤维形成的SLRP,也是一种天然的泛酪氨酸激酶抑制剂,可以减少肿瘤的生长[38]。经多种体内外的肿瘤模型研究发现,蛋白聚糖具有抑制肿瘤生长、血管生成及肿瘤迁移的功能,是对抗实体肿瘤的理想候选药物[39]。黏着斑是大的、含整合素的多蛋白跨膜组装物,将细胞骨架与周围的细胞外基质相连,在细胞黏附和信号传导中起关键作用,是上皮细胞稳态、组织损伤反应和肿瘤发生的主要调节因子[40]。
图5 肿瘤组织和正常组织在人体图中的中位表达,A.CDC20,B.AURKB,C.CCNB1,D.AKT1,E.GAPDH
图6 CDC20、AURKB、CCNB1、AKT1、GAPDH基因表达水平与浆液性卵巢癌患者的预后关系
综上所述,通过从GEO数据库筛选基因数据集并鉴定出浆液性卵巢癌和正常组织的DEGs。采用GO功能和KEGG通路富集分析进一步表明了DEGs在浆液性卵巢癌的作用。此外,研究表明CDC20、AURKB、CCNB1、AKT1及GAPDH基因可能与患者的预后差有关。本研究为进一步研究浆液性卵巢癌的发生发展、筛选预后标志物及潜在治疗靶点提供了一定的研究基础。