基于TCGA和Oncomine数据库前列腺癌关键基因的筛选

2020-02-03 09:10:36瞿根义向茂林徐勇阳光王佳威汤乘
浙江医学 2020年24期
关键词:抵抗性去势前列腺癌

瞿根义 向茂林 徐勇 阳光 王佳威 汤乘

前列腺癌(prostate cancer,PCa)是泌尿外科常见的恶性肿瘤[1]。近年来我国PCa发病率呈逐年上升趋势,目前在泌尿系肿瘤中居第二位[2]。PCa患者易发生骨转移,转移后5年生存率低于29%,而且经过内分泌治疗后,大部分患者最终会发展为去势抵抗性PCa[3]。因此,深入研究PCa发生、发展的机制,具有重要的临床意义。生物信息学是将计算机技术和分子生物学相结合的技术,为基因的研究提供了方法。癌症和肿瘤基因图谱(cancer genome atlas,TCGA)和Oncomine数据库是大型肿瘤基因芯片数据库,具有大样本和丰富的临床数据。本研究利用TCGA和Oncomine数据库深入挖掘PCa差异表达基因,然后进行基因本体论(gene ontology,GO)和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路分析,建立蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络,并筛选Hub基因,最后通过Meta分析筛选影响PCa发生、发展的关键基因。

1 资料和方法

1.1 资料来源 通过TCGA数据库(https://cancergenome.nih.gov/)下载公开的PCa RNA测序数据,包括PCa组织499例,癌旁正常组织52例。

1.2 差异表达基因的获取 采用R 3.5.3软件的edgeR软件包对数据进行标准化及差异表达分析,筛选logFC绝对值>1.5,FDR<0.05的基因为差异表达基因。采用ggplot2软件包对数据进行图形可视化。

1.3 差异表达基因的GO和KEGG通路分析 通过DAVID数据库(https://david.ncifcrf.gov)对差异表达基因进行GO和KEGG通路分析,P<0.05为差异有统计学意义;其中GO分析包括生物学过程(biological process,BP)、细胞组成(cell composition,CC)和分子功能(molecular function,MF)。采用R 3.5.3软件及相应的cluster Profiler包进行注释和可视化。

1.4 差异表达基因的PPI网络分析 通过STRING数据库(https://string-db.org/)对差异表达基因进行分析并构建PPI网络[4]。采用 Cytoscape软件中的Cytohubba筛选PPI网络中连接程度前10位Hub基因。

1.5 Hub基因与PCa相关数据的获取和Meta分析 通过Oncomine数据库(https://www.oncomine.org)获取Hub基因与 PCa 相关数据,检索条件:(1)基因:Hub;(2)分析类型:癌组织与正常组织的比较分析;(3)肿瘤类型:PCa;(4)阈值:P<0.0001,倍数变化>2,基因排序为排名前10%。采用Meta分析获取的Hub基因与PCa相关数据,得出关键基因。

2 结果

2.1 PCa差异表达基因的筛选结果 最终筛选出PCa差异表达基因919个,其中表达上调基因424个,表达下调基因495个,火山图见图1(插页);差异最显著的前50个基因热图见图2(插页)。

2.2 差异表达基因的GO和KEGG通路分析结果 GO分析显示,差异表达基因BP中主要富集于突触传递、细胞间信号传导、跨膜转运和细胞分化,CC中主要富集于细胞外空间、细胞外区域、质膜的组成部分和质膜,MF中主要富集于序列特异性DNA结合、钙离子结合和结构分子活性,见表1和图3(插页)。KEGG通路分析显示,差异表达基因主要富集于神经活性配体-受体相互作用、药物代谢-细胞色素P450和细胞色素P450代谢异种生物,见表2和图4(插页)。

2.3 差异表达基因的PPI网络分析结果 构建的PPI网络中,差异表达基因919个,其中表达上调基因424个,表达下调基因495个。连接程度前10位Hub基因分别是 CDC20、CCNA2、BUB1B、HJURP、AURKB、TTK、KIF4A、MKI67、CENPA、NCAPH,见图 5(插页)。

2.4 Hub基因与PCa相关数据的Meta分析结果 最终获得4个关键基因,分别是HJURP、KIF4A、CENPA、NCAPH,Meta分析结果见图6(插页)。

图1 前列腺癌(PCa)与癌旁正常组织差异表达基因的火山图(红点所示为上调基因,绿点所示为下调基因,黑点所示为无显著差异的基因)

图2 前列腺癌(PCa)与癌旁正常组织差异表达最显著的前50个基因热图

图3 PCa差异表达基因GO分析的可视化图(PCa为前列腺癌,GO为基因本体论)

图4 PCa差异表达基因KEGG通路分析的可视化图(PCa为前列腺癌,KEGG为京都基因与基因组百科全书)

图5 蛋白质-蛋白质相互作用(PPI)网络中连接程度前10位Hub基因

图 6 关键基因在前列腺癌(PCa)组织中表达的 Meta分析结果(a:HJURP;b:KIF4A;c:CENPA;d:NCAPH)

3 讨论

随着我国人口老年化的加剧,PCa发病率明显升高。PCa的生物学特性是骨转移,一旦发生转移,PCa患者的生活质量及生存预后均会受到较大影响[5]。因此,深入挖掘PCa发生、发展的关键基因具有重要的临床意义。

TCGA是由美国癌症研究所和美国人类基因组研究所在2006年共同发起的项目,主要利用高通量测序技术建成的一个综合的、多维的癌症地图,以提高对癌症的发生、诊断和治疗的理解,以及对癌症发病机制的认识[6]。本研究从TCGA数据库下载PCa RNA测序数据,利用生物信息学技术挖掘出PCa差异表达基因919个,其中表达上调基因424个,表达下调基因495个。然后采用DAVID数据库对差异表达基因进行富集分析,GO分析显示BP中差异表达基因主要富集于突触传递、细胞间信号传导、跨膜转运和细胞分化,CC中主要富集于细胞外空间、细胞外区域、质膜的组成部分和质膜,MF中主要富集于序列特异性DNA结合、钙离子结合和结构分子活性;而KEGG通路分析显示,差异表达基因主要富集于神经活性配体-受体相互作用、药物代谢-细胞色素P450和细胞色素P450代谢异种生物。进一步利用STRING数据库构建PPI网络,连接程度前10位Hub基因分别是CDC20、CCNA2、BUB1B、HJURP、AURKB、TTK、KIF4A、MKI67、CENPA、NCAPH。最后采用Oncomine数据库筛选出PCa关键基因4个,分别是HJURP、KIF4A、CENPA、NCAPH。

表1 PCa差异表达基因GO分析结果

表2 PCa差异表达基因KEGG通路分析结果

HJURP是一种蛋白质编码基因,作为CENPA的伴侣蛋白,在G1早期介导CENPA与着丝粒的组装,从而使得细胞分裂过程中的染色体以高保真分离[7]。CENPA为着丝粒蛋白A,在细胞分裂中也起着至关重要的作用。研究表明,CENPA表达升高与多种癌症的发展有关[8]。PCa相关研究表明,HJURP出现显著高表达,且与生存预后相关,可作为PCa生化复发及生存预后的潜在标志物[9]。KIF4A位于人类染色体Xq13.1,参与染色体的浓缩与分离,是有丝分裂胞质分裂和后期纺锤体动力学的关键调控因素,同时对细胞有丝分裂和DNA损伤修复发挥着关键的调控作用,与肿瘤的发生、发展也密切相关[10]。同样,PCa相关研究显示,KIF4A出现异常高表达,且与生存预后显著相关[11]。另有研究发现,KIF4A表达与雄激素受体水平呈正相关,在PCa患者中KIF4A与雄激素受体形成自动调节的正反馈,并通过下调KIF4A的表达来改善恩杂鲁胺的耐药性,同时增强去势抵抗性PCa细胞对内分泌治疗的敏感性[12]。NCAPH通过调节拓扑异构酶Ⅱ的活性和染色体的分离,从而在细胞有丝分裂过程中发挥重要的调控作用。研究表明,NCAPH通过上皮间质转化机制来影响肿瘤细胞的迁移与侵袭[13]。PCa相关研究显示,NCAPH同样出现显著高表达,且与去势抵抗性PCa的发生密切相关,与PCa发展为去势抵抗性PCa的时间有关,可作为去势抵抗性PCa患者生存预后的标志物[14],但具体机制目前尚未阐明。笔者认为对Hub基因和关键基因作进一步研究,将会为PCa发生、发展的机制挖掘更多新的发现。

综上所述,本研究基于TCGA和Oncomine数据库获取PCa关键基因4个,包括HJURP、KIF4A、CENPA、NCAPH。但仍需要深入研究,进一步阐明这些基因在PCa发生、发展机制中的具体生物学功能,为PCa治疗提供新的线索和方向。

猜你喜欢
抵抗性去势前列腺癌
前列腺癌复发和转移的治疗
关注前列腺癌
认识前列腺癌
Vestigial like family member 3 is a novel prognostic biomarker for gastric cancer
前列腺癌,这些蛛丝马迹要重视
去势抵抗性前列腺癌的药物治疗新进展
去势抵抗性前列腺癌的治疗进展
多西他赛/米托蒽醌联合泼尼松治疗激素抵抗性前列腺癌的临床效果评价
去势与不去势对公犊牛生产性能的影响
大畜去势经验谈