环状RNA的研究现状及展望

2014-08-30 07:14夏世金胡明冬刘露梅邰先桃
中华肺部疾病杂志(电子版) 2014年6期
关键词:内含子环状外显子

夏世金 高 文 胡明冬 刘露梅 邰先桃

环状RNA(circular RNA, circRNA)或称环形RNA,是新近确认的一类特殊的非编码RNA(non-coding RNA, ncRNA)分子,是继microRNA(miRNA)后RNA家族的一颗极具发展潜力的正在升起的新星,也是RNA领域最新的研究热点,方兴未艾。通过与疾病关联的miRNA相互作用,circRNA在疾病中发挥着重要的调控作用,有巨大潜力成为新型的临床诊断标志物。

circRNA是一类主要由一个以上外显子构成的环形RNA分子,大量存在于真核细胞,具有一定的组织、时序和疾病特异性。circRNA最先在植物类病毒中被发现[1],随后在研究肿瘤抑制基因DCC、人Ets-1基因及小鼠Sry基因时,发现从核前体mRNA(precursor messenger RNA, pre-mRNA)加工而来的RNA呈环状[2-5],表明真核细胞中也存在着非线性RNA: circRNA。早期,关于circRNA的文献报道少,且表达水平低下,故在很长一段时间里,circRNA被认为是错误可变剪接(alternative splicing )而形成的副产品,属于自然界中一种极罕见现象[5-6],甚至被当做遗传意外或实验人为因素所致,并未引起学术界重视。

随着RNA测序(RNA sequencing, RNA-seq)和生物信息学等技术的快速发展,人们在大规模研究转录组数据时发现,circRNA并不像之前所认为的那样是一种极罕见现象,反而大量存在于真核细胞中。Danan等[6]发现,circRNA在古生菌细胞普遍存在,并认为其极有可能具有生物学功能。同时,Salzman等[7]也证实circRNA在人类细胞基因表达中是一个普遍现象,并可能扮演着多种生物学功能的重要角色。Jeck等[8]采用高通量测序方法,在人成纤维细胞中检测到超过25 000种circRNA,认为circRNA是RNA剪切后所形成的一类极稳定的保守性产物,此外还发现circRNA可被小型干扰RNA(small interfering RNA,siRNA)降解。Memczak等[9]研究证实circRNA参与转录后调控,Hansen等[10]的研究则揭示circRNA可作为miRNA海绵(miRNA sponge)来影响基因的调控与表达。尽管circRNA被发现已有30余年,但由于技术限制等原因,circRNA一直处于被学术界忽视的地位。但随着近年有关circRNA的几项突破性研究的发现,尤其是国际著名权威刊物Nature发表两篇有关circRNA生物学功能的论文[9-10],震惊学术界,从此拉开揭开circRNA神秘面纱的序幕,circRNA已引起国内外学术界的关注,并将掀起研究热潮。

一、circRNA的形成与特征

1. circRNA的形成: 生命体的遗传信息通过转录从DNA传递到RNA,再通过翻译传递到蛋白质。通常情况下,真核生物基因在转录后通过前体mRNA剪接(pre-mRNA splicing)去除基因内的非编码内含子序列,然后将含有蛋白编码信息的外显子序列顺序地连接在一起,形成成熟的线形RNA分子。包括人在内的高等真核生物可以通过可变剪接,由一个基因产生多种不同功能的成熟RNA及其相应蛋白产物。前体mRNA可变剪接在基因组及蛋白质组功能多样性中发挥重要作用,现已发现约90%的人类基因都存在前体mRNA可变剪接亚型[11]。

在真核生物中存在一种反向的可变剪接,使得基因的外显子序列反向首尾连接形成环形RNA。circRNA由特殊的前体mRNA可变剪接产生,剪接形式具有多样性,其形成方式可归结为两大类:外显子环化(exon circularization)和内含子环化(intron circularization)。

Jeck等[8]提出了外显子环化circRNA的两种不同形成模型:套索驱动的环化(lariat-driven circularization)和内含子配对驱动的环化(intron-pairing-driven circularization)。前者与外显子跳读(exon skipping)有关,一个外显子的3′剪接供体(splice donor)与另一个外显子的5′剪接受体(splice acceptor)共价结合,即套索驱动的环化由外显子组成的剪接供体和剪接受体共价结合,接着切除内含子,然后形成circRNA(图1A①);后者则先由两个内含子通过碱基互补配对形成环状结构,再切除内含子,最后形成circRNA(图1A②)。Jeck等[8]发现这两种模型均包含有互补性ALU重复序列的长的侧翼内含子(long flanking introns)。近期Zhang等[12]利用特殊核酸酶对环形RNA的富集,采用全新的计算分析流程,在人源胚胎干细胞H9中发现了近万条环形RNA,并首次证明了内含子RNA互补序列介导的外显子环化(环形RNA形成),证实外显子环化依赖于两侧的内含子互补序列,为内含子配对驱动的环化模型提供了有力证据;还发现不同区域间内含子互补序列的竞争性配对,可以选择性地产生线形RNA或是环形RNA。同时,在人类基因组内含子区域中蕴涵着大量的互补序列,这些互补序列的选择配对及其动态调控使得同一个基因可产生多个环形RNA,这种现象可被称为可变环化(alternative circularization);此前,Zhang等[13]提出了内含子自身环化所形成的circRNA(circular intronic RNA, ciRNA)模型,揭示circRNA也可来源于内含子(见图1B) 。上述一系列研究的新发现为深入阐明circRNA的外显子环化、内含子环化和可变环化的机制奠定了理论根基,以全新的理论视角揭示了基因表达在转录/转录后水平的复杂性和多样性。

注:(A):外显子环化形成circRNA的机制,①示套索驱动的环化,②示内含子配对驱动的环化;(B):内含子环化形成circRNA的机制

2. circRNA的特征: 根据目前的文献报道,circRNA具有以下重要特征:(1)circRNA由特殊的可变剪切产生,大量存在于真核细胞的细胞质中[5],但少部分内含子来源的circRNA则存在于核酸内[12],具有一定的组织、时序和疾病特异性;(2)广泛存在于人体细胞中,有时甚至超过它们线性异构体的10倍之多[7-8];(3)与传统的线型RNA(linear RNA,含5'和3'末端)不同,circRNA分子呈封闭环状结构,不易被核酸外切酶RNase R降解,比线性RNA更稳定[8,14-15];(4)具有高度保守性[7-8],部分具有快速的进化性改变[12-13];(5)大多数来源于外显子,少部分由内含子直接环化形成;(6)circRNA分子富含miRNA应答元件(miRNA response element, MRE),可充当竞争性内源RNA(competing endogenous RNA, ceRNA),与miRNA结合,在细胞中起到miRNA海绵的作用,进而解除miRNA对其靶基因的抑制作用,上调靶基因的表达水平[10];(7)大部分是非编码RNA[7]。circRNA的其他特征还有待阐明。

二、 circRNA的功能

1. circRNA参与转录后调控功能: 小脑变性相关蛋白1反义转录物(antisense to the cerebellar degeneration-related protin 1 transcript, CDR1as)是一种circRNA,拥有至少60个与微小RNA-7(microRNA-7, miR-7)相结合的保守结合位点,从而充当miR-7海绵,有效影响miR-7靶基因活性[9-10]。CDR1as和miR-7在发育的中脑区域具有共同高表达的特点,在斑马鱼胚胎中,CDR1as的过表达造成中脑体积减少,且中脑体积的减少可通过注射miR-7前体得以部分恢复,这表明CDR1as的生物学效应至少部分通过其与miR-7相互作用而产生[10]。CDR1as是miR-7的环状抑制剂,对miR-7起负调控作用[16],发挥天然miRNA海绵功能[17]。此外,Hansen等[10]研究发现,睾丸特异性基因Sry的circRNA具有16个微小RNA-138(microRNA-138, miR-138)的靶位点,可与miR-138相互作用,充当miR-138海绵。

circRNA充当miRNA海绵,竞争性抑制miRNA的转录调控,实际上代表了一类新型的ceRNA调节物(图2A)。相较于其他类型的ceRNA,circRNA在细胞中表达量高且稳定性强,并具有更多与miRNA结合的位点,能够更加快速、稳定地结合或释放大量miRNA,高效发挥其调控miRNA的作用,比线性的ceRNA更具有突出的ceRNA活性。环状RNA也可能是细胞外miRNA海绵,一些环状RNA有可能存在病毒miRNA的结合位点,与病毒miRNA的结合,从而破坏免疫应答[9]。然而,circRNA作为miRNA海绵,与miRNA相互作用的具体机制仍有待进一步探明。

2. circRNA的其他功能: 除外作为miRNA的环状抑制剂,circRNA也可能与RNA结合蛋白(RNA-binding protein, RBP)结合(图2B),或者与其他RNA通过碱基互补配对[18-19](图2C)。Zhang等[12]封闭内含子环化的circRNA-ci-ankrd52的表达,发现ankrd52 mRNA表达显著减少,表明circRNA可正调控其自身基因的表达;还发现此类circRNA主要位于核内,不同于胞质内表达的circRNA,MRE较少,但能够正调控RNA聚合酶Ⅱ的转录活性。此外,circRNA还能与阿格蛋白(argonaute, AGO)紧密结合,影响mRNA的转录翻译[9-10](图2B)。

注:(A):circRNA可作为miRNA的环状抑制剂,充当miRNA海绵;(B):circRNA可与蛋白结合;(C):circRNA可与其他RNA通过碱基互补配对结合

三、 circRNA在疾病发生中的作用

通过与疾病关联的miRNA相互作用,circRNA在疾病中发挥着重要的调控作用。人类全基因组关联分析(genome-wide association study, GWAS)显示,靠近基因INK4/ARF的染色质9p21.3与动脉粥样硬化的易感性具有单核苷酸多态性(single nucleotide polymorphism, SNP),而有研究显示,基因INK4/ARF可被多梳家族(polycomb group, PcG)复合物抑制[20]。circRNA cANRIL是基因INK4/ARF的反义转录物[21],可通过有差异的PcG募集来抑制INK4/ARF表达,从而影响动脉粥样硬化的发生[22]。

Hansen等[23]已证实CDR1as与miR-7在小鼠大脑中共表达,可影响中脑发育[9]。Ghosal等[24]则发现CDR1as亦可能与帕金森病有关。Lukiw[25]发现,在ciRS-7(也被称为CDR1as)的海绵功能缺失时,miR-7表达上调,极有可能下调阿尔茨海默病相关靶点蛋白表达,如泛素化蛋白连接酶A[26-27]。由于miR-7可调控一些致癌基因,因而CDR1as可通过调控miR-7以影响肿瘤的产生[16]。circRNA在疾病发生中的作用与机制研究,目前尚处在起步阶段。

四、 circRNA的研究方法

由于circRNA绝大部分由外显子环化构成,故在此针对性介绍外显子环化circRNA的检测研究方法。

1. 分子生物学方法: circRNA相较于线性RNA没有3′端,在凝胶中移动的速度比相同长度的线性RNA慢,这种效应可被增强型交联凝胶法(increased gel cross-linking)放大[28]。然而,与同源基因形成的其他转录物相比较,circRNA包含有更少的总核苷酸序列,从而在弱交联凝胶(low cross-linking gel)中移动较慢。基于此,我们可通过northern blot法来对circRNA进行鉴别[8,29]。经由核酸外切酶RNase H降解或单一水解后,circRNA可线性化成为大小可预测的单一产物[4, 30],因此,通过双向凝胶电泳(two-dimensional gel electrophoresis)或琼脂糖凝胶电泳(gel trap electrophoresis)方法可更进一步确认RNA的环化[23, 28, 31]。除以上几种方法之外,酶法(enzymatic method)分析也可为circRNA的研究提供有力支持。核酸外切酶RNase R(RNase R exonuclease)[14]、烟酸磷酸酶(tobacco acid phosphatase)[10]、终止子核酸外切酶(terminator exonuclease)[10]可降解大部分线性RNA,但不能降解circRNA,用这3种酶对特定RNA进行处理,通过对处理前后的数据进行定量分析,可甄别circRNA。

套索RNA(lariat RNA)与circRNA一样,均为环形结构,都对核酸外切酶不敏感[14]、比线性RNA移动更慢[28],但是,circRNA具有明显的索尾插接序列(backsplice sequence),能轻易与套索RNA区分。此外,套索RNA在被核酸外切酶消化前,更易被脱支酶切除,因此区分二者并不难。

2. 基因组学方法: 目前基因组学方法有两条途径:一条是从目前已存在的转录物模型(transcript models)中选取候选接头(candidate junctions)[7, 21],另一条是通过与基因组序列阅读框匹配来识别接头[32]。第一条途径主要对来自单一cDNA片段另一端的末端配对阅读序列(paired-end reads sequence)的独立遗传图谱进行分析[7]。第二条途径则是通过识别来自于从哺乳动物到线虫的损耗型rRNA的RNA-seq资料中的索尾插接序列遗传密码,对此类损耗型rRNA文库(rRNA-depleted libraries)进行分析统计以鉴别出circRNA[9]。此外,Danan等[6]及Jeck等[8]先用RNase R进行消化,然后采用高通量测序的方法对RNase R不敏感RNA进行分析,此种“CircleSeq”技术可深入分析circRNA,但需要大量的RNA输入,且对核酸内切酶污染极度敏感。

3. 其他: 近期,Glažar等[33]建立了circRNA专用数据库“circBase”,该数据库对目前已发表的circRNA资料进行整合统一,同时提供已知的及新的circRNA测序资料,旨在为circRNA的研究提供一个较好的交流平台。目前,Arraystar率先开发了世界上第一款商业化circRNA芯片,为系统探索不同生理及病理条件下circRNA的表达规律提供实验研究平台。circRNA的研究方法需要进一步完善。

五、展望

目前,circRNA的命名尚未统一。“ciRS-7”表明其与miR-7结合,而“CDR1as”则表明其与CDR1基因有关,尽管是同一个circRNA,但由于研究者各自的研究角度不同而造成命名的不一致,Kosik[34]则建议将之统一命名为circR-1。因此,亟需构建一个更恰当的、适用的和公认的circRNA命名体系,以避免命名的混乱。

circRNA是RNA匣子里的一颗璀璨明珠,也是RNA家族中继miRNA后又一颗冉冉升起的新星。尽管目前人们对circRNA的了解仅仅是冰山一角,阐明circRNA生物学功能与机制还相当遥远,但天然生成的circRNA作为miRNA海绵,通过与miRNA相互作用从而调控miRNA靶基因的表达,这丰富了人们对动物自然进化的认知,颠覆了RNA仅仅是DNA与编码蛋白之间的平凡使者的传统理念,呈现出成为进化驱动者的潜能[33]。circRNA的组织特异性和稳定性使其有可能成为一种良好的生物标志物;circRNA与疾病发生的密切相关,通过与疾病关联的miRNA相互作用,circRNA在疾病发生中发挥着重要的调控作用,可望成为新型的疾病临床诊断标志物,在疾病的防治领域展现出光明的潜在的应用前景。

参 考 文 献

1 Sanger HL, Klotz G, Riesner D, et al. Viroids are single-stranded covalently closed circular RNA molecules existing as highly base-paired rod-like structures[J]. Proc Natl Acad Sci U S A, 1976, 73(1): 3852-3856.

2 Nigro JM, Cho KR, Fearon ER, et al. Scrambled exons[J]. Cell, 1991, 64(3): 607-613.

3 Cocquerelle C, Daubersies P, Majerus MA, et al. Splicing with inverted order of exons occurs proximal to large introns[J]. EMBO J, 1992, 11(3): 1095-1098.

4 Capel B, Swain A, Nicolis S, et al. Circular transcripts of the testis-determining gene Sry in adult mouse testis[J]. Cell, 1993, 73(5): 1019-1030.

5 Cocquerelle C, Mascrez B, Hétuin D, et al. Mis-splicing yields circular RNA molecules[J]. FASEB J, 1993, 7(1): 155-160.

6 Danan M, Schwartz S, Edelheit S, et al. Transcriptome-wide discovery of circular RNAs in Archaea[J]. Nucleic Acids Res, 2012, 40(7): 3131-3142.

7 Salzman J, Gawad C, Wang PL, et al. Circular RNAs are the predominant transcript isoform from hundreds of human genes in diverse cell types[J]. PLoS One, 2012, 7(2): e30733.

8 Jeck WR, Sorrentino JA, Wang K, et al. Circular RNAs are abundant, conserved, and associated with ALU repeats[J]. RNA, 2013, 19(2): 141-157.

9 Memczak S, Jens M, Elefsinioti A, et al. Circular RNAs are a large class of animal RNAs with regulatory potency[J]. Nature, 2013, 495(7441): 333-338.

10 Hansen TB, Jensen TI, Clausen BH, et al. Natural RNA circles function as efficient microRNA sponges[J]. Nature, 2013, 495(7441): 384-388.

11 Wang ET, Sandberg R, Luo S, et al. Alternative isoform regulation in human tissue transcriptomes[J]. Nature, 2008, 456(1): 470-476.

12 Zhang XO, Wang HB, Zhang Y, et al. Complementary Sequence-Mediated Exon Circularization[J]. Cell, 2014, 159(1): 134-147.

13 Zhang Y, Zhang XO, Chen T, et al. Circular intronic long noncoding RNAs[J]. Mol Cell, 2013, 51(6): 792-806.

14 Suzuki H, Zuo Y, Wang J, et al. Characterization of RNase R-digested cellular RNA source that consists of lariat and circular RNAs from pre-mRNA splicing[J]. Nucleic Acids Res, 2006, 34(8): e63.

15 Suzuki H, Tsukahara T. A view of pre-mRNA splicing from RNase R resistant RNAs[J]. Int J Mol Sci, 2014, 15(6): 9331-9342.

16 Hansen TB, Kjems J, Damgaard CK. Circular RNA and miR-7 in cancer[J]. Cancer Res, 2013, 73(18): 5609-5612.

17 Hentze MW, Preiss T. Circular RNAs: splicing′s enigma variations[J]. EMBO J, 2013, 32(7): 923-925.

18 Wilusz JE, Sharp PA. Molecular biology. A circuitous route to noncoding RNA[J]. Science, 2013, 340(6131): 440-441.

19 Tay Y, Rinn J, Pandolfi PP. The multilayered complexity of ceRNA crosstalk and competition[J]. Nature, 2014, 505(7483): 344-352.

20 Jacobs JJ, Kieboom K, Marino S, et al. The oncogene and Polycomb-group gene bmi-1 regulates cell proliferation and senescence through the ink4a locus[J]. Nature, 1999, 397(6715): 164-168.

21 Salzman J, Chen RE, Olsen MN, et al. Cell-type specific features of circular RNA expression[J]. PLoS Genet, 2013, 9(9): e1003777.

22 Burd CE, Jeck WR, Liu Y, et al. Expression of linear and novel circular forms of an INK4/ARF-associated non-coding RNA correlates with atherosclerosis risk[J]. PLoS Genet, 2010, 6(12): e1001233.

23 Hansen TB, Wiklund ED, Bramsen JB, et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA[J]. EMBO J, 2011, 30(21): 4414-4422.

24 Ghosal S, Das S, Sen R, et al. Circ2Traits: a comprehensive database for circular RNA potentially associated with disease and traits[J]. Front Genet, 2013, 4: 283.

25 Lukiw WJ. Circular RNA (circRNA) in Alzheimer′s disease (AD). Front Genet, 2013, 4: 307.

26 Bingol B, Sheng M. Deconstruction for reconstruction: the role of proteolysis in neural plasticity and disease[J]. Neuron, 2011, 69(1): 22-32.

27 Lonskaya I, Shekoyan AR, Hebron ML, et al. Diminished parkin solubility and co-localization with intraneuronal amyloid-beta are associated with autophagic defects in Alzheimer's disease[J]. J Alzheimers Dis, 2013, 33(1): 231-247.

28 Tabak HF, Van Der Horst G, Smit J, et al. Discrimination between RNA circles, interlocked RNA circles and lariats using two-dimensional polyacrylamide gel electrophoresis[J]. Nucleic Acids Res, 1988, 16(14A): 6597-6605.

29 Hurowitz EH, Brown PO. Genome-wide analysis of mRNA lengths in Saccharomyces cerevisiae[J]. Genome Biol, 2003, 5(1): R2.

30 Jeck WR, Sharpless NE. Detecting and characterizing circular RNAs[J]. Nat Biotechnol, 2014, 32(5): 453-461.

31 Schindler CW, Krolewski JJ, Rush MG. Selective trapping of circular double-stranded DNA molecules in solidifying agarose[J]. Plasmid, 1982, 7(3): 263-270.

32 Fonseca NA, Rung J, Brazma A, et al. Tools for mapping high-throughput sequencing data[J]. Bioinformatics, 2012, 28(24): 3169-3177.

33 Glažar P, Papavasileiou P, Rajewsky N. circBase: a database for circular RNAs[J]. RNA, 2014, 20(11): 1666-1670.

34 Kosik KS. Molecular biology: Circles reshape the RNA world[J]. Nature, 2013, 495(7441): 322-324.

猜你喜欢
内含子环状外显子
外显子跳跃模式中组蛋白修饰的组合模式分析
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
外显子组测序助力产前诊断胎儿骨骼发育不良
基于GEO数据库分析circRNAs在胃癌组织中的表达
基因内含子遗传变异与鸭蛋壳品质关联性分析
“垃圾DNA”不“垃圾”
外显子组测序助力产前诊断胎儿骨骼发育不良
陆地棉GhDHN1基因结构及内含子生物信息学分析
第78届莫斯科数学奥林匹克(2015)
环状RNA参与肿瘤发生发展的机制