周潇妮,付振华,张琦玲,陈敏杰,蔡丽萍
(南昌大学a.研究生院医学部2017级; b.研究生院医学部2018级;c.玛丽女王学院2019级; d.第一附属医院妇产科,南昌 330006)
卵巢肿瘤具有多种复杂的组织学类型,其中上皮性来源的高级别浆液性卵巢癌(high-grade serous ovarian cancer,HGSOC)是原发性卵巢恶性肿瘤中最常见和最具代表性的组织学类型之一[1]。腹腔内广泛转移加上对化疗药物的耐药是导致晚期HGSOC高病死率的主要原因。目前针对HGSOC的标准化治疗方案主要是进行最大程度的肿瘤细胞减灭术,同时联合铂类药物的化疗[2]。尽管此方案对初治患者有着较好的疗效,但近75%的患者会在2年内复发,且目前尚缺乏针对复发患者有效的药物[3]。本研究基于GEO和TCGA两大肿瘤基因组数据库,从拷贝数异常(copy number variations,CNVs)的角度出发,探讨细胞周期相关基因在HGSOC发生及发展中的作用,从中寻找到相关靶点,为其靶向药物的研发提供参考。
从TCGA数据库(http://www.tcga.org/)中下载截至2019年6月5日的临床HGSOC患者的CNVs基因,并以10%的突变频率为截值获取所需的CNVs基因。
对美国国家生物技术信息中心(National Center of Biotechnology Information,NCBI)中的GEO(http://www.ncbi.nlm.nih.gov/geo/)基因表达综合数据库进行全面搜索,以“ovarian cancer”和“ovarian carcinoma”作为搜索的关键词,从该数据库中直接下载HGSOC患者的DEG。之后设定P值10-9为截值,获得所需要的HGSOC中DEG上调或下调的基因。
以“cell cycle”“G0”“G1”“S”“G2”“M”等与细胞周期及其各个时期有关的关键词作为筛选条件,分别从GSEA网站(https://www.gsea-msigdb.org/)的GO、KEGG、REACTOME、BIOCARTA数据库中获取与细胞周期相关的通路和基因。整合与HGSOC细胞周期相关、同时发生CNVs和差异表达的基因,获取共突变基因。
将被筛选出的共突变基因输入STRING网站(https://string-db.org/),获取HGSOC患者基因表达蛋白之间的网络关系图。
将被筛选出的共突变基因输入cBioPortal网站(http://cbioportal.org/),获取HGSOC患者基因关联性分析图和基因表达率图谱。
将被筛选出的共突变基因输入KM-PLOT网站(https://kmplot.com/analysis/),得到对应HGSOC患者特定基因表达时的无进展生存率(PFS)和总体生存率(OS)数据。
从GO、KEGG、REACTOME和BIOCARTA数据库中确定178条与细胞周期相关的通路,同时建立包含3213个与细胞周期相关基因的集合(图1)。从图2可以发现,4个数据库中各基因之间均存在交集。
从TCGA数据库中筛选出拷贝数扩增基因共1999个;拷贝数缺失基因共47个。从GEO数据库中筛选出差异表达上调基因共827个;差异表达下调基因共950个。
将以上数据与之前筛选出的3213个与细胞周期相关的基因进行整合,最终确定36个与HGSOC细胞周期相关、同时发生CNVs及差异表达的共突变基因。具体筛选步骤见图3。
通过进一步的整合分析可以发现,这36个共突变基因均来自拷贝数扩增组,拷贝数缺失组为0个,见图4。推测这些基因可能是通过拷贝数扩增导致DEG上调,影响到细胞周期而发生HGSOC。
将36个共突变基因利用STRING网站构建成基因表达蛋白的PPI网络图谱(图5),同时,结合从cBioPortal网站下载的基因关联性分析结果(表1)发现:MECOM、PRKCI的共表达概率约为32.5%,PRKCI、ECT2的共表达概率约为30.1%。提示在HGSOC患者中MECOM、PRKCI及ECT2出现共表达的概率较大,推测这3个基因之间可能共用同一条信号通路,在该信号通路的作用下促使HGSOC的发生发展,此推测待在后续实验中进一步验证。
表1 36个共突变基因的关联性分析
从cBioPortal网站下载的图6A中可以发现,被筛选出的36个共突变基因在HGSOC患者中的扩增表达量均较高,特别是MECOM、PRKCI、ECT2等在超过30%的HGSOC患者中存在高表达。另外,根据之前得到的DEG、CNVs数据分别制作出相对应的图形(图6B—C)。通过KM-POLT网站下载的生存率曲线制作成生存预后分析图(图6D)。发现ECT2、RAD51AP1、YWHAZ、RAD21、SMC4、TFB2M等6个基因与HGSOC的不良生存预后显著相关(HR>1,P<0.05)。若HGSOC患者中存在以上基因的高表达,则该患者的PFS与OS将大幅度下降(P<0.05),见图7。推测这6个基因很有可能作为HGSOC不良生存预后因子,在该疾病发生及发展的过程中发挥着重要作用,可作为HGSOC药物治疗的潜在靶点。
近年来,HGSOC患者基因的靶向治疗具有较好的前景。其中,PARP抑制剂奥拉帕利目前已经被FDA批准,推荐用于存在BRCA1、BRCA2基因突变的HGSOC患者的一线维持治疗;同时还可用于铂敏感复发的晚期HGSOC患者的二线维持治疗[4]。然而针对部分携带不同突变基因的HGSOC患者,PARP抑制剂的疗效有所区别,这其中的机制尚未完全掌握。为此,寻找到更多HGSOC的治疗靶点,为携带不同突变基因的HGSOC患者提供新的选择,最终通过进一步实现“去化疗”来改善晚期HGSOC患者化疗耐药的弊端是笔者研究的目的。
CNVs是指长度≥1 kb的DNA片段不同于参考基因组的情况,有10%~13%的DNA变化是由CNVs导致[5]。CNVs是人类遗传变异的一个主要来源,它与基因的点突变一样,会对个体差异造成影响。STRANGER等[6]发现,CNVs与人类基因组中17.7%的基因表达活性相关,并且拷贝数扩增时可使其覆盖区域或临近区域的基因表达活性增强。同时,REID等[7]通过对全基因组的研究,证实了基因组区域中常见的CNVs事件,并且这些CNVs事件经常在卵巢癌中发生,促进了该疾病的发生及进展。另外有研究表明1、2、3、4、5、6、9、11和12号染色体CNVs均与卵巢癌的转移密切相关[8]。因此,本研究从CNVs的角度出发,试图挖掘出影响HGSOC发生及发展的靶点。
细胞周期是一个细胞复制其相关基因组,生长并分裂为2个子细胞的过程,它包含了生命最基本的特性之一。细胞周期调控涉及到很多基因和蛋白质的参与,从而形成了一个复杂的信号分子网络系统。有研究[9]发现,包括卵巢癌在内的各种恶性肿瘤最主要的生物学特征是肿瘤细胞的失控性增殖,而细胞周期调控紊乱会导致细胞的失控性增殖。因此,研究细胞周期及其相关基因的表达,有望找到肿瘤发生及发展的本质。
本研究已挖掘出与细胞周期相关,同时发生CNVs及差异表达的基因。最终发现有6个共突变基因与HGSOC的不良生存预后显著相关,这6个基因分别为:ECT2、RAD51AP1、YWHAZ、RAD21、SMC4、TFB2M。其中ECT2、RAD51AP1、YWHAZ、RAD21已被证实与HGSOC之间的相关性。
1)ECT2主要定位于细胞核中,它在体外能够激活RHOA、RAC1和CDC42,但在细胞中取决于具体环境的不同而具有更高的选择性。从卵巢癌患者的肿瘤组织和已建立的细胞系中可以发现ECT2蛋白在大多数HGSOC患者中存在高表达,提示ECT2蛋白与HGSOC的发生及发展密切相关[10]。2)RAD51AP1是一个在双链DNA修复过程中起着重要作用的基因,它的表达与HGSOC之间表现出高度的同源性[11]。此外,HSAMir-140-3P是RAD51AP1的一个潜在调节因子,如果RAD51AP1是HGSOC的癌基因,那么靶向hsa-mir140-3p可能是一种靶向RAD51AP1的方法[12]。3)YWHAZ是14-3-3家族蛋白中的一员,影响着多种重要的细胞学过程。YWHAZ的过度表达与多种肿瘤的预后呈负相关,YWHAZ可能有助于早期癌症的发展并促进其向浸润癌发生转变[13]。原发性肿瘤中YWHAZ的高表达与肿瘤的早期复发和远处转移显著相关[14]。SHI等[15]发现,YWHAZ的高表达与HGSOC的不良预后有关,它能够促进HGSOC细胞的增殖和迁移。4)RAD21是一种双链断裂修复蛋白,它是黏蛋白复合物的组成部分,在染色体分离和DNA修复中起着重要的作用。RAD21在未分化卵巢癌中已被证实存在过度表达[16]。AHN等[17]研究也发现,RAD21与突变的P53相互作用可增加S1PR1的转录活性,从而增强HGSOC细胞的侵袭性。
总之,本研究筛选出的ECT2、RAD51AP1、YWHAZ、RAD21基因已被证实与HGSOC的发生及发展密切相关。另外,目前针对SMC4、TFB2M基因与HGSOC之间关联性的研究较少,后续将进行实验验证,以挖掘出HGSOC临床治疗的新靶点。