基于Oncomine和TCGA数据库探究TOP2A在卵巢癌中的表达及意义

2020-06-28 01:21:54张凯刘玉林胡佳丽郭飞薛凤霞
国际妇产科学杂志 2020年3期
关键词:卵巢癌卵巢数据库

张凯,刘玉林,胡佳丽,郭飞,薛凤霞

卵巢癌(ovarian cancer,OC)是全世界女性生殖系统肿瘤中预后最差、死亡率最高的妇科恶性肿瘤之一,文献报道预计2019年美国卵巢癌新发病例数将达22 530例,其中13 980例患者因罹患卵巢癌而死亡[1]。与其他许多实体肿瘤一样,卵巢癌的发生、发展是一个涉及多因素、多种基因改变的复杂分子过程[2]。因此,寻找与卵巢癌发生发展和预后相关的关键基因,揭示关键基因在卵巢癌发病过程中的作用机制,为提供新的靶向治疗药物奠定基础。近年伴随着高通量测序和生物信息学的飞速发展,肿瘤相关的数据库成为挖掘肿瘤相关基因的工具,而Oncomine(www.oncomine.org)数据库则是目前世界上最大的癌基因芯片数据库,该数据库整合了GEO、TCGA和已发表文献来源的RNA和DNA-seq数据,旨在用于探究肿瘤相关基因信息的数据挖掘平台。癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划也是一种在线的肿瘤基因数据库,通过更好地了解癌症疾病的遗传基础,以期提高诊断、治疗和预防癌症的能力。

拓扑异构酶ⅡA(topoisomeraseⅡA,TOP2A)基因编码DNA拓扑异构酶Ⅱα,它是一种在转录过程中控制和改变DNA拓扑状态的酶,参与染色体的分离、DNA复制、染色质浓缩等细胞生物学行为过程[3]。目前有研究发现在乳腺癌[4]、膀胱癌[5]、非小细胞肺癌[6]等多种实体肿瘤中均存在TOP2A基因的异常表达,但是关于该基因在卵巢癌中表达情况的研究较少,作用和功能仍不明确。因此,探究TOP2A基因在卵巢癌中的表达情况,及其与卵巢癌患者的临床预后情况,帮助妇科肿瘤医生更好地从分子生物学水平理解其发生、发展的机制,具有非常重要的临床意义。

1 资料与方法

1.1 从Oncomine数据库中提取数据 Oncomine数据库是一个基因芯片集合的数据分析平台,本研究从中筛选并提取出卵巢癌相关的数据,设定的筛选条件如下:①Cancer Type:ovarian cancer;②Gene:TOP2A;③Analysis Type:Cancer vs Normal Analysis;④Data Type:mRNA或DNA;⑤临界值设定为:P-value <10-4,fold change >2,gene rank=top 10%。

1.2 TOP2A基因在上皮性卵巢癌中的突变情况 通过cBioPortal(www.cbioportal.org)网站获得的TCGA数据库中的606例上皮性卵巢癌样本,其中311例具有完整的基因序列和拷贝变异资料,应用oncoprint选项功能分析TOP2A基因变异情况。

1.3 TOP2A基因相关蛋白及其功能分析 利用STING数据库分析TOP2A基因和相关蛋白,构建TOP2A相关蛋白网络树状图,并进行基因功能富集分析。

1.4 Kaplan-Meier Plotter对卵巢癌患者进行生存分析通过Kaplan-Meier Plotter数据库在线检索卵巢癌患者的总体生存时间和无瘤进展生存时间。

1.5 统计学方法 采用SPSS 22.0软件进行统计学分析,正常卵巢组织和卵巢癌组织间比较采用t检验,生存分析用Kaplan-Meier和Log-rank检验分析,P<0.05为差异有统计学意义。

2 结果

2.1 TOP2A基因在不同肿瘤中的表达情况 对Oncomine数据库进行检索分析后共纳入涉及TOP2A基因相关性研究结果462项,挑选出高表达125项和低表达7项差异有统计学意义的结果进一步分析。在膀胱癌中高表达6项,低表达0项;在脑和中枢神经系统肿瘤中高表达10项;在乳腺癌中高表达18项,低表达1项;宫颈癌中高表达4项,低表达0项;在肺癌中高表达17项,低表达0项;其他肿瘤中高表达4项,低表达1项;卵巢癌中高表达的4项,低表达0项。见图1(见后插二)。

图1 Oncomine数据库中TOP2A基因在不同类型肿瘤中的表达情况

2.2 TOP2A基因在卵巢癌中的表达 通过挖掘分析Oncomine数据库涉及的TOP2A基因在卵巢癌组织和正常卵巢组织中有差异表达的7项研究,文章分别发表在《British Journal of Cancer》、《Cancer Research》、《ClinicalCancerResearch》、《ProceedingsoftheNational Academy of Sciences of USA》和《Cancer Science》。综合分析发现,与对照组(正常卵巢组织)相比,TOP2A基因在所有差异表达基因中的中位数值排名为218.0,P=8.03×10-6,表明卵巢癌组织中TOP2A的表达量高于正常卵巢组织。见图2(见后插二)。

图2 Oncomine数据库中TOP2A基因在卵巢癌中的表达情况

2.3 TOP2A基因在不同卵巢癌研究芯片中的表达 在 Adib Ovarian[7]、Bonome Ovarian[8]、Lu Ovarian[9]、Welsh Ovarian[10]、Yoshihara Ovarian[11]和 TCGA Ovarian 7项芯片中研究发现,有4项研究揭示在卵巢癌组织中TOP2A表达高于正常卵巢组织,差异有统计学意义,分别是芯片研究 WelshOvarian(t=8.728,P<0.05),LuOvarian(t=5.727,P<0.05),TCGAOvarian(t=16.571,P<0.05)和 Bonome Ovarian(t=11.064,P<0.05)。Oncomine数据库中TOP2A基因在不同卵巢癌芯片中的表达情况见图3。综合比较,TOP2A基因在卵巢癌组织与正常卵巢组织表达差异有统计学意义,且在卵巢癌组织中高表达(P<0.05)。

图3 TOP2A基因在不同卵巢癌芯片中的表达情况

2.4 TOP2A基因在上皮性卵巢癌中的突变情况 在311例上皮性卵巢癌样本中有12例发生TOP2A基因变异,突变率为4%,包括扩增3例,深度缺失3例,截短突变3例,框内突变1例,错义突变2例,见图4(见后插二)。

图4 TOP2A基因在上皮性卵巢癌中的变异情况

2.5 TOP2A基因相关蛋白网络关系及其功能分析 利用STING数据库分析TOP2A基因主要相关蛋白,主要蛋白包括Discs大同源物关联蛋白5(DLGAP5)、细胞分裂周期基因 20(CDC20)、泛素结合酶 E2C(UBE2C)、PDZ 结合激酶(PBK)、细胞周期蛋白依赖性激酶1(CDK1)、DNA拓扑异构酶1(TOP1)、非染色体结构维护凝缩蛋白Ⅰ复合体G亚基(NCAPG)、非洲爪蟾驱动蛋白样蛋白2靶蛋白(TPX2)、纺锤体检测点丝/苏氨酸激酶(BUB1)、细胞周期蛋白B2(CCNB2),构建获取TOP2A相关蛋白相互作用网络图,见图5(见后插二)。并将以上蛋白进行生理过程富集分析,可发现其主要富集在卵母细胞减数分裂、细胞周期、孕酮介导的卵母细胞成熟、P53信号通路等,见表1。

图5 TOP2A相关蛋白网络作用关系图

2.6 TOP2A表达水平与卵巢癌患者预后的Kaplan-Meier生存分析 通过Kaplan-Meier Plotter数据库对卵巢癌患者进行生存分析,在线检索TOP2A与卵巢癌患者的总体生存时间和无瘤进展生存时间的关系。研究发现TOP2A高表达的卵巢癌患者的总体生存时间和无瘤进展生存时间明显短于TOP2A低表达的卵巢癌患者(P<0.05)。不同病理类型的卵巢癌亚组分析显示,卵巢浆液性囊腺癌患者中TOP2A高表达组的总体生存时间与低表达组比较偏低,而2组无瘤进展生存时间差异无统计学意义(P>0.05);在卵巢子宫内膜样腺癌患者中TOP2A高表达组的无瘤进展生存时间较低,总体生存时间与低表达组比较差异无统计学意义(P>0.05),见图6(见后插二)。

图6 TOP2A的表达与卵巢癌预后之间的关系

3 讨论

卵巢癌是最常见的三大恶性肿瘤之一,其病死率为妇科生殖道肿瘤之首[12]。中国每年新发病例约52 100例,且逐年增加,死亡病例约22 500例[13]。由于早期卵巢癌隐蔽性高,缺乏特异性的筛查指标,许多患者发现时肿瘤细胞已经发生转移和腹腔扩散,失去了最佳治疗时期,目前晚期(Ⅲ~Ⅳ期)上皮性卵巢癌的标准治疗方案是肿瘤细胞减灭术联合铂类为基础的化疗,但是晚期患者很快出现局部复发和远处转移,且产生了对化疗药物的耐药,导致了晚期卵巢癌患者的5年生存率低于30%,预后极差。因此,探究有效的卵巢癌基因生物标志物对于了解肿瘤形成机制、患者预后和靶向药物的治疗起到关键作用。

表1 与TOP2A基因密切相关的基因及基因功能富集分析

TOP2A基因是位于人类17号染色体长臂12~21区域上,编码DNA拓扑异构酶Ⅱα,该核酶参与染色体浓缩,染色单体分离和催化双链DNA链的瞬时断裂和重新结合,使2条链可以彼此穿过,从而改变了DNA的拓扑结构,达到降低DNA转录和复制过程中发生扭转应力,避免打结和缠绕[14-15]。研究显示,TOP2A基因在多种恶性实体瘤中异常高表达,且TOP2A高表达者通常恶性程度更高,预后更差。Ma等[16]研究发现TOP2A可以作为非小细胞肺癌的预后指标,并且其可能通过与TPX2基因蛋白共同调节癌症的发展。Labbé等[17]对原发性和转移性前列腺癌进行了全基因检测分析,发现原发性和转移性前列腺癌中TOP2A、果蝇Zeste基因增强子人类同源物2(EZH2)mRNA水平和蛋白表达显著上调,强调了前列腺癌细胞中的TOP2A和EZH2是驱动致癌基因的关键,通过联合检测TOP2A和EZH2基因,以早期识别可能受益于辅助或新辅助靶向治疗方法的转移潜力增加的患者。研究已发现与TOP2A阴性表达的子宫内膜癌患者相比,TOP2A过度表达的子宫内膜癌患者的总生存期和无病生存期更短,预后更差[18-19]。蒽环类药物常被用作乳腺癌患者的术后辅助治疗,研究发现TOP2A被认为是这些药物的分子靶点,因此,TOP2A扩增和过表达在蒽环类药物治疗乳腺癌患者中具有潜在的预测价值[20]。Oncomine数据库拥有全世界最全的癌症基因芯片数据以及临床信息,有利于研究者探索和发现新的癌症生物标志物和新的治疗靶点。通过Oncomine数据分析可以得到不同肿瘤中癌基因的表达差异,还可以进行富集和Meta分析,因其整合了大量数据的优势,避免了因为样本量的问题而导致的误差,分析结果也因此具有较高的可信度。本研究发现TOP2A基因在膀胱癌、乳腺癌、宫颈癌以及肺癌等不同类型肿瘤中的表达,总共132项研究存在TOP2A的差异表达,其中包括125项高表达和7项低表达。

TOP2A基因在肿瘤中的作用及其机制尚不明确,本研究通过TCGA数据库中相关研究发现其在卵巢癌患者中的总体突变率为4%,且变异以扩增、深度缺失和截短突变为主。通过STRING蛋白分析工具筛选出与TOP2A蛋白发生相互作用的10种蛋白DLGAP5、CDC20、UBE2C、PBK、CDK1、TOP1、NCAPG、TPX2、BUB1和CCNB2,对这些蛋白进行通路途径的富集分析可知,主要参与了卵母细胞减数分裂、细胞周期、孕酮介导的卵母细胞成熟、P53信号通路和泛素介导的蛋白水解等生理过程。Xiong等[21]认为TOP2A可以通过调节细胞周期和p53信号通路,从而影响吸烟相关性肾透明细胞癌的发生发展。宫颈癌常由人乳头瘤病毒(HPV)引起,病毒感染人体之后导致p53和视网膜母细胞瘤蛋白分别被病毒肿瘤蛋白E6和E7灭活,从而导致细胞周期的紊乱,TOP2A和ki-67等核蛋白由于细胞分裂增加而表达也明显增加,因此联合TOP2A抗体和ki-67抗体检测可应用于宫颈癌的免疫组织化学进行筛查[22-23]。Zhang等[24]研究显示TOP2A在结肠癌组织中的表达明显高于癌旁组织,体外实验通过转染特异性小干扰RNA,使结肠癌细胞中TOP2A基因沉默,从而导致TOP2A蛋白的表达缺失,进而抑制细胞增殖和侵袭能力,而这一现象可能的潜在机制为敲除TOP2A不仅影响细胞凋亡相关蛋白(bcl-2和bax)和侵袭相关蛋白(MMP-2和MMP-9)的表达,还降低了细胞外调节蛋白激酶(ERK)和蛋白激酶B(AKT)的磷酸化水平。

Kaplan-Meier Plotter数据库是用来预测基因与肿瘤预后相关的在线分析平台。本研究发现TOP2A与卵巢癌患者的总体生存率和无瘤进展率存在负相关,即高表达TOP2A卵巢癌患者的总体生存时间和无瘤进展生存时间要短于TOP2A低表达者。进一步分层分析发现,TOP2A表达水平对卵巢浆液性囊腺癌患者的总体生存时间的影响较卵巢子宫内膜样腺癌的总体生存时间影响更为显著,相反,TOP2A对卵巢子宫内膜样腺癌患者的无瘤进展生存时间影响较卵巢浆液性囊腺癌患者的无瘤进展生存时间影响大。Ferrandina等[25]研究表明在高级别卵巢癌和晚期疾病中观察到TOP2A mRNA表达显著升高,并且核TOP2A蛋白过表达的患者总体生存时间明显降低。此外,Faggad等[26]也发现TOP2A在卵巢癌组织中高表达,并且表达量越高预后越差。TOP2A基因编码的拓扑异构酶Ⅱα与细胞的分裂增殖密切相关,而拓扑异构酶Ⅱα的异常高表达则加快了断裂卵巢肿瘤细胞中DNA双螺旋结构链,促进DNA复制和转录的进行,从而增加了肿瘤细胞的分裂增殖能力,导致卵巢癌患者预后不良[27-28]。

综上,基于Oncomine数据库和TCGA数据库分析发现TOP2A在卵巢癌组织中高表达,且与卵巢癌患者的预后有关,术前评估卵巢癌患者中TOP2A表达,这可能有助于评估患者的风险状况、预后和预测价值。同时为TOP2A作为肿瘤治疗的新靶点提供新的依据,也为卵巢癌的治疗提供新的方向。

猜你喜欢
卵巢癌卵巢数据库
保养卵巢吃这些
卵巢多囊表现不一定是疾病
卵巢癌:被遗忘的女性“沉默杀手”
如果卵巢、子宫可以说话,会说什么
数据库
财经(2017年2期)2017-03-10 14:35:35
Wnt3 a和TCF4在人卵巢癌中的表达及临床意义
数据库
财经(2016年15期)2016-06-03 07:38:02
数据库
财经(2016年3期)2016-03-07 07:44:46
数据库
财经(2016年6期)2016-02-24 07:41:51
microRNA与卵巢癌转移的研究进展