高元峰,刘昭前,李 珊,肖望重,欧阳荣
(1. 湖南中医药大学第一附属医院药学部,湖南 长沙 410007;2. 中南大学湘雅医院临床药理研究所,湖南 长沙 410008)
长链非编码RNAs(long non-coding RNAs, lncRNAs)和环状RNAs(circular RNAs, circRNAs)是内源性非编码RNAs(non-coding RNAs, ncRNAs)的重要组成。虽然它们都不能编码蛋白,但却均具有生物学功能和在哺乳动物细胞分布广泛的特性,使得它们越来越受到研究者的关注。lncRNAs和 circRNAs被发现之初,受限于当时的研究条件,长期被认为是DNA基因组转录的“噪音”,是RNA聚合酶Ⅱ转录的副产物,且被认为没有生物学功能。随着测序技术的发展,lncRNAs和circRNAs的研究不断深入,不仅在数量上取得巨大突破,还针对它们的功能角色进行了广泛研究。这些成果为我们进一步了解肿瘤的发生、发展开拓了新的视野。本课题组一直致力于lncRNAs和circRNAs的研究。本文对lncRNAs和circRNAs的分类、特征、生物学功能等进行比较,深入了解与区分,以期更好识别肿瘤生物标志物。
lncRNAs是一类长度大于200 个核苷酸的非编码 RNA,属线性RNA[1]。一般来说,lncRNAs通常较长,具有mRNA样结构,经过剪接,具有polyA尾巴与启动子结构。目前研究发现,它的亚型包括:反义链lncRNAs、内含子lncRNAs、基因间lncRNAs、启动子相关lncRNAs、非翻译区(untranslated region,UTR)相关lncRNAs[1]。
circRNAs则是一类不具5′末端帽子和3′末端 polyA尾巴,并以共价键形成环形结构的特殊RNA分子。具体来说,circRNAs是借助套索结构或内含子的互补配对,以反向剪切的方式来形成的[2]。可分为3类:外显子circRNAs(exonic circRNA,ecRNA)、内含子circRNAs(intronic circRNA,ciRNA),以及由外显子和内含子共同组成的circRNAs(exon-intron circular RNAs,EIciRNA)[2-3]。
lncRNAs和circRNAs在下面4个特征上的区别为,① 丰度:虽然lncRNAs在组织中分布广泛,但lncRNAs的表达丰度相对较低。在实际检测中,甚至有些lncRNAs用qPCR检测不到其表达;circRNAs 在组织中分布也较为广泛,其表达丰度较lncRNAs要高,研究表明,circRNAs较对应线性lncRNAs的表达甚至超过10 倍之多[4]。② 稳定性:lncRNAs具有polyA尾巴与启动子结构,类似于mRNA,相对不稳定;circRNAs 具有共价闭合环结构,缺乏5′端的帽子结构和3′末端 polyA尾巴,不易被RNA核酸外切酶降解,这使其比lncRNAs分子更稳定[5]。③ 保守性:lncRNAs保守性较低;circRNAs以磷酸二酯键使得首尾相连,成环的特点揭示了它具有高度的保守性,同时在进化上也是高度保守的[4]。④ 时空特异性:大多数的lncRNAs在组织分化发育过程中,都具有明显的时空特异性;circRNAs同样具有时空特异性,如circRNA S-7(circular RNA sponge for miR-7)主要存在于细胞质[6]。
随着对lncRNAs 和 circRNAs研究的深入,已挖掘出数目庞大的lncRNAs 和 circRNAs,且对它们生物学功能的解读日益完善。研究表明,lncRNAs 和 circRNAs在肿瘤发生、发展中扮演关键的角色。下面从表观遗传调控、基因转录水平调控、蛋白水平调控、miRNA竞争调控方面,来总结它们生物学功能的差异。
3.1表观遗传调控表观遗传调控是lncRNAs的重要机制之一。研究表明,lncRNAs能通过DNA甲基化影响肿瘤发生、发展。例如lncRNA ZEB1-AS1就具有启动子区低甲基化的现象[7]。此外,lncRNAs还可影响染色质修饰或其在染色体上的定位。lncRNA Xist能促进染色质修饰复合物的表达,从而调控DNA、RNA和组蛋白的数量[8]。干预lncRNA HOTAIR能调整其在HOXD基因簇的空间位置,最终间接沉默HOXD[9];而circRNA关于表观遗传调控的报道尚不多见。
3.2基因转录水平调控lncRNAs可作为配基,与相应转录因子结合,形成复合体,调控基因转录的活性。例如,lncRNA TSLC1-AS1与TSLC1 mRNA形成一定结构的复合体,使得TSLC1 mRNA不被RNA酶降解,从而影响TSLC1蛋白的表达[10]。circRNAs也能够通过RNA-RNA模式来调控基因的表达,如EIciRNA通过U1 snRNA介导其亲本基因的表达明显增加[11]。
3.3蛋白水平调控一般来说,lncRNAs和circRNAs不具有编码蛋白能力,但却可以调控蛋白活性。如lincRNA-UFC1能结合到HuR蛋白特定结构域,影响其活性,从而增加细胞中β-catenin蛋白表达[12]。CircIMP3也能绑定到IMP3蛋白特定结构域[3]。最新的研究显示,大约两万条lncRNAs具有编码蛋白质的能力[13],Legnini等[14]也发现,circ-ZNF609能通过特殊剪切及蛋白翻译帽依赖方式来编码蛋白。故lncRNAs和circRNAs究竟是编码蛋白,抑或是调控蛋白活性尚需要进一步研究。
3.4miRNA竞争调控一些lncRNA会携带某些miRNA的“种子序列”,像海绵一样结合miRNA,从而阻止miRNA同其靶mRNA结合(ceRNA机制)。例如,lncRNA GAPLINC通过与miR311-3p竞争性结合,削弱miR311-3p对CD44的表达水平,进而调控细胞的迁移和增殖[15]。
circRNAs在ceRNA机制中与lncRNAs类似,如Deng等[16]研究表明circ_0009910能调控miR449a,并进一步调控miR449a的功能靶基因IL-6R,从而促进骨肉瘤发生、发展。类似这样的circRNAs还有circWDR77、circGFRA1、circRNA_0008219等。
虽然lncRNAs和circRNAs的生物学功能还未能阐明,越来越多的研究表明,它们与人类疾病进展密切相关,尤其是肿瘤。本课题组已经认识到某些基因存在既可转录成线性RNA,也可以转录成环状RNA,不同的剪接模式使得它们在不同的肿瘤中扮演不同的角色。在这里我们首次总结在肿瘤中,从同一亲本基因(母体基因)转录出来的lncRNAs和circRNAs。
4.1锌指E盒结合因子1(zincfingerE-boxbindinghomeobox1gene,ZEB1) ZEB1基因位于染色体10p11.2,具有多种剪接变异体。其中,lncRNA ZEB1-AS1被证明在多种肿瘤中异常上调,包括肝癌、骨肉瘤、胶质瘤。研究表明,lncRNA ZEB1-AS1能调控母体基因ZEB1 mRNA的表达,从而促进肿瘤转移[7],其还能与miR200s产生竞争调控[17]。我们在CircNet(http://circnet.mbc.nctu.edu.tw/)数据库中,发现了其环状的转录本circZEB1,其在肺癌组织中高表达,并可能受miR1413p、miR200a的调控[18]。
4.2INK4基因座中反义非编码RNA(antisensenon-codingRNAintheINK4locusgene,ANRIL) ANRIL基因位于染色体9p21,其可以转录成线性及环状的RNA。其中,lncRNA ANRIL在多种癌症中高表达,包括肝癌、乳腺癌、鼻咽癌、黑色素瘤、宫颈瘤、骨肉瘤、甲状腺癌、结直肠癌、胆囊癌、前列腺癌。研究发现,lncRNA ANRIL发挥效应与竞争性调控miR122有关[19]。此外,过表达的lncRNA ANRIL能调节let-7a/TGF-β1/Smad信号通路,进而促进细胞的增殖和迁移[20]。circANRIL在不同组织和细胞系中的表达比线性lncRNA ANRI的表达要高[4]。circANRIL能结合到60s亚基重要组成蛋白PES1,从而介导p53活化,最终诱导肿瘤细胞凋亡和抑制增殖[4]。
4.3浆细胞瘤多样异位基因1(plasmacytomavarianttranslocation1gene,PVT1) PVT1基因位于染色体8p24,其也具有上述特征。有数据表明,lncRNA PVT1促进宫颈癌发生发展与负调控miR424有关[21],其还能使miR195启动子区域H3K27me3水平升高[22]。此外,lncRNA PVT1参与的肿瘤还包括胃癌、黑色素瘤、乳腺癌、肺癌、骨肉瘤、前列腺癌。circPVT1是一个新的与胃癌发生、发展及预后相关的生物标记物,它在胃癌组织中异常高表达,且能通过调控miR125家族成员,促进细胞增殖[23]。
4.4锌指和BTB结构域基因46(zincfingerandBTBdomaincontaining46gene,ZBTB46) ZBTB46基因位于染色体20q13。lncZBTB46是在乳腺癌lncRNA芯片中被首次发现的,它在乳腺癌组织中异常上调[24]。circZBTB46也已经被鉴定,后续的功能还有待进一步研究[25]。
总之,lncRNAs和circRNAs既有区别又有联系,对它们在肿瘤中的角色和机制的研究拓宽了我们对肿瘤发生、发展的理解。整体来说,circRNAs的起步相较lncRNAs要晚,许多机制研究都是沿用了lncRNAs的套路,且当前对lncRNAs和circRNAs大都从ceRNA(与miRNA竞争调控)的角度来阐述,不利于它们的深入研究。另外,lncRNAs和circRNAs在肿瘤中有独特的表达和功能,它们被认为是下一个肿瘤诊疗的新靶标。然而,许多关键问题仍需要深入探讨:① 影响肿瘤发生、发展的基因大体上可分为两类:促癌基因和抑癌基因。其中,常见的促癌基因包括EGFR、bFGF、PDGF、VEGF、IGF-1等;抑癌基因包括p53、p16、PTEN、Rb、E2F-1 等。尽管上述多个功能基因早已明确,但是它们与lncRNAs和circRNAs之间相互作用的研究报道略少。另外,我们不得不思考的一个问题是mRNA、lncRNAs和circRNAs,哪个更适合作为生物标记物?② lncRNAs和circRNAs 究竟能不能编码蛋白?怎么编码蛋白?哪些能编码蛋白?③ lncRNAs和circRNAs与肿瘤发生、发展及化疗预后的关系虽有报道,但还不太明确。④ lncRNAs和circRNAs及microRNA之间关系模糊,一般认为是符合ceRNA理论,但有没有不是ceRNA的现象?另外,细胞内是如何平衡它们与miRNA的关系?lncRNAs和circRNAs的研究仍处于起步阶段,仍需要更多深入的探讨,以便进一步确认它们在肿瘤发生、发展中的功能角色。尽管lncRNAs和circRNAs在各肿瘤中的分子机制尚未完全阐明,但是lncRNAs和circRNAs可能在不久的将来能彻底改变肿瘤的诊断和治疗。