季少平
(河南大学 医学院,河南 开封 475004)
非编码RNA 是指那些不被翻译成蛋白质的RNA 分子,除去那些看家RNA(如rRNA和tRNA)以及siRNA和microRNA,其调控基因表达的机制不同于长非编码RNA(lncRNA),因此不在此讨论之列。lncRNA 通常被认为是那些大于200核苷酸长度,几乎没有可编码大于100 氨基酸开放读框的RNA 分子。和编码RNA 相比,lncRNA 也经过拼接,也有帽子结构和多聚A 尾巴,但缺乏开放读框,有些lncRNA 一度被称为假基因(pseudogene)。对lncRNA的研究,使人们认识了基因表达调控的一个新层面。
lncRNA 对生命过程的调节可能解释了人类具有相似数量的蛋白质编码基因(与其他物种相比),却具有更为复杂的生物学表型[1-2]。研究[2]显 示,在人类转录的RNA中98%为lncRNA,而lncRNA的数量与物种的复杂性成正比关系。和编码基因的转录相比,lncRNA的启动子区具有更为保守的序列[3-4]。lncRNA 主要通过表观遗传学调节基因转录,决定基因表达与否。由于RNA 具有较弱的催化活性,它们往往需要通过募集蛋白质复合物(具有酶活性)对特定区域进行修饰。lncRNA 可作为一个平台,把两种染色质修饰复合物连接在一起,协同作用于目标基因进行表观遗传学修饰。以往,除了参与氨基酸转运、RNA 拼接和蛋白质合成的RNA(如rRNA和tRNA)外,其他lncRNA的转录都被认为是基因表达的副产品,但近年的研究改变了人们对lncRNA的认识,它们在生命的多个过程中起着重要作用。lncRNA 呈现序列多样性,具有亚细胞分布特色,表现出组织和细胞特异性,并具有调节的时空特性。lncRNA 主要涉及转录和转录后调节、基因组修饰、X-染色体失活以及mRNA 降解。此外,lncRNA 还具有协助蛋白质的亚细胞定位、诱导蛋白质构象改变、以及细胞形态维持等作用。在生命过程中的不同阶段以及不同的组织器官,共有基因组的95%得到转录。因此,lncRNA的数量要远大于编码RNA的数量[5]。从碱基序列上看,lncRNA 在进化上缺乏保守,呈多样性,在功能上其三维结构的构象可能更为重要。相对于小的非编码RNA 如siRNA和microRNA,我们对lncRNA的认识远远落后。
在高等生物,染色质修饰(如组蛋白的甲基化、乙酰化、磷酸化和DNA 甲基化等)在时空上对于基因表达特异性非常重要,尤其在发育的不同阶段,它们决定了一些基因在何时与何地表达与否。这些修饰决定了转录过程中蛋白质因子(如转录因子、转录激活子和转录抑制子等)能否接近目标DNA(如启动子和增强子等),从而决定了目标基因的开放与关闭。而修饰染色质的酶复合物是广泛表达的,但是如何特异地修饰特定的DNA 位点是分子生物学家所关心的,也是目前最难搞清楚的领域。
在研究X- 染色体剂量补偿效应、等位基因失活以及同源基因表达不平等时,发现lncRNA 对这些复杂现象的调节,主要通过参与对基因组的表观遗传学调节。而阻断这些lncRNA 参与的表观遗传学调节,可导致一系列发育障碍或疾病,可见lncRNA 在生命过程中的重要性。研究比较清楚的两个lncRNA Air和Kcnqlot1参与了等位基因的表达失活调节,在基因组印记(genomic imprinting)中起着重要作用。它们通过与染色质修饰复合物结合,对特定基因座位的组蛋白修饰,进而抑制母系或父系等位基因的表达。Air首先聚集于Slc22a3基因的启动子区,募集甲基化转移酶G9a,介导组蛋白H3K9的甲基化。在小鼠,Air利用位于Igf2r基因第二个内含子内部的启动子得以转录,参与对来自父系Igf2r、Slc22a2和Slc22a3基因的表达抑制。而Air的截断突变,导致G9a不能有效地聚集于Slc22a3基因的启动子区,进而导致等位基因的同时转录,丢失了对父系等位基因的特异抑制[5]。
lncRNA与染色质修饰复合物间的作用也是导致X- 染色体失活的原因。目前已知,至少有7个lncRNA 参与了这一过程,其中包括Xist。在雌性动物X 染色体的一条上,所有基因的表达都被关闭,而只有一条X 染色体的基因得以表达,这样使得雌性动物具有与雄性动物一样的X- 连锁的基因表达。Xist从将要失活的X 染色体上转录,然后与PRC2(polycomb represive complex 2)结合,使得PRC2沿X 染色体扩散,并在PRC2的H3K27三甲基酶活性的作用下最终沉默整条染色体。Xist的转录也是受到另一个lncRNA rep A的诱导,rep A与PRC2结合并导致Xist启动子区H3K27的三甲基化而激活Xist的转录。rep A 转录于Xist的5'端保守区且与Xist的转录方向一致,rep A 含有7.5个由28nt构成的串联重复序列,折叠成两个保守的柄环结构。在对基因组DNA 进行的广泛表观遗传学修饰分析中发现,组蛋白不同位点的甲基化对编码和非编码RNA的转录具有类似的作用,但是DNA 甲基化对二者的影响不同[6]。
在介导染色质重塑时,除蛋白质可结合多种lncRNA 外,一种lncRNA 也好像可与多种蛋白质结合。许多参与染色质重塑、抑制基因表达的酶并没有DNA 结合结构域,却有RNA 结合结构域,可能暗示着lncRNA 在染色质重塑中的重要性。如Kcnqlot1、Airn、Xist、HOTAIR与PRC1 或PRC2 结合,介导组蛋白2(H2)的第119位赖氨酸的单泛素化、组蛋白3(H3)的第27位赖氨酸的二甲基化或三甲基化。这些蛋白分子与不同lncRNA的结合,可能通过构象的改变决定了它们对目标基因的选择特异性,而lncRNA 可能起着变构诱导样的作用。lncRNA与DNA 形成3 股核酸链杂交,利于DNA 甲基转移酶3b对DNA的甲基化修饰[7],但这种作用方式是否为普遍现象尚有待研究。
已发现的lncRNA 大多涉及基因的转录,它们通过对转录因子的募集与活性调节,最终实现对基因表达的精细调控。lncRNA 除了通过顺式作用直接调节目标基因的表达外,还可通过反式作用经调节转录因子的表达进而影响目标基因的表达。例如,来自HOXC的lncRNA HOTAIR 通过反式作用影响其他HOX 座位的转录因子基因表达。lncRNA 可通过与RNA 聚合酶Ⅱ结合,影响整个转录“机器”而对大多数基因的转录产生影响。如人类的Alu RNA和B2RNA,受到热休克诱导,可与RNA 聚合酶Ⅱ结合而广泛抑制基因的转录。
此外,lncRNA 本身的转录,也可引起相邻基因的转录抑制。已知SRG1的转录可干扰临近基因的转录元件与其启动子的结合,导致其他基因无法转录而受到抑制[8-9]。除了抑制基因表达外,lncRNA 也可介导激活基因的表达。Evf-2 能与Dlx-2协同特异地增强Dlx-5/6 增强子的活性,促进相关基因的转录[10]。
RNA 聚合酶Ⅱ与增强子结合并对该区域进行双向转录,可转录出一种新的lncRNA 称为eRNA,这种eRNA 在远端增强子的帮助下将沉默区段内的某个特定基因“解救”出来,增加目标基因的转录水平[11-12]。因此,eRNA 更具有特异性,更具有用于基因治疗的潜力。广泛的研究表明,被沉默的基因启动子区,有大量的lncRNA-蛋白复合物覆盖,在DNA序列上形成很大的区段。而且随着生命过程的变化,这种覆盖是处于一种动态的过程。处于关闭状态的基因可能在增强子的帮助下,重新被激活。增强子通过顺式和反式作用,激活转录,而染色质回折形成环形,使得距离较远的大跨度的DNA 靠近,方便增强子与目标区域的直接接触也是必要的。
lncRNA 在植物中的表达更为广泛,其主要原因是应对随时的环境变化。在哺乳动物,lncRNA 广泛参与了细胞对外部刺激的应激调节。在DNA 损伤时,一个位于基因间的受p53 诱导表达的lncRNA licnRNA-p21,与核蛋白K 一起介导广泛的基因表达抑制[13]。其意义在于DNA 损伤后的修复最为重要,其他基因的表达多被暂停,如果DNA 能得以修复,那么细胞就得以生存。另一个DNA 损伤诱导表达的lncRNA gadd7可直接与TDP-43(TAR DNA 结合蛋白)结合,而阻止TDP-43与Cdk6的mRNA 结合,从而导致该mRNA的降解[14]。另外发现,一种饥饿诱导的lncRNA,Rncs-1 可抑制Dicer的活性,阻断Dicer对双链RNA的加工,抑制micro-RNA 对其他基因表达的调控[15],但其意义仍不清楚。
翻译后修饰可通过改变蛋白质的构象而影响蛋白质的活性。lncRNA 也可作为分子伴侣帮助蛋白质改变构象,而影响其活性。在DNA 损伤信号调节下转录的一种非编码RNA 可通过调节一种RNA 结合蛋白TLS(Translocated in Lipo Sarcoma),使其构象改变,从无活性变为有活性[16]。此外,另一个lncRNA,是一个激素受体的RNA 激活子(SRA)可促进核蛋白复合物SRC-1及相关核受体的激活,而调节激素相关基因的表达[17]。
另外,特定基因的反义转录形成的lncRNA,也能与正义链形成双链RNA,经Dicer加工后产生siRNA,经RNAi降解mRNA 或抑制目标基因的翻译[18-19]。小核RNA 通过与RNA 聚合酶Ⅱ起作用,或调节转录后加工对目标基因的表达水平进行调节。在转录时,一些位于被抑制座位的基因虽然没有mRNA 转录,但却可转录出小的非编码RNA,并形成柄环结构与PRC2复合物结合,参与介导目标基因的抑制[20]。
lncRNA 帮助目标蛋白的亚细胞定位。例如,一种酵母蛋白Mei2p需要与MeiRNA(一种lncRNA)结合后从胞质转运到核内[21];而5S核糖体RNA 通过遮蔽转录因子TFIIA的核定位信号而使TFIIA留在胞质[22]。有两种lncRNA,MEN epsilon和MEN beta,他们与Paraspeckle(一种核内蛋白核酸结构)中的蛋白组分结合,对维持Paraspeckle结构完整与数量十分重要。而Paraspeckle可能是核内储存RNA的一个重要场所[23-24]。lncRNA与疾病特别是肿瘤发生、发展间关系的研究已有许多报道。最近的研究显示,HOTAIR的表达水平升高与乳腺癌的生长与转移能力密切相关。在上皮癌细胞中过表达HOTAIR,导致PCR2 在基因组内广范围地重新分布、并改变组蛋白的甲基化模式,使细胞更像胚胎成纤维细胞,同时增加细胞的浸润和转移能力[25]。
由于lncRNA 种类繁多、结构多样、序列缺乏保守性,因而给lncRNA的研究带来很大困难。相信随着新的技术进步,例如一些类似ChIP(染色质免疫沉淀)技术的引入,通过不同方式鉴定出更多lncRNA及其介导的生物学功能,将为我们认识生命过程中,基因表达在不同层面的调控大有帮助,随着作用机制的阐明,并将产生巨大的应用潜力。lncRNA 一级序列缺乏保守性,我们不能从lncRNA的序列同源性上预测其生物学活性,也不能从其结合的靶点上推测其生物学活性的相似性,其可能的机制是由于lncRNA的结合导致蛋白靶分子构象改变而影响了功能。未来的研究分析lncRNA 活性仍离不开蛋白质分子,尤其是一些与转录相关的转录因子、增强子、转录激活子或转录抑制子等。
在生长发育的不同阶段、不同时期以及其他条件下,确定更多的远端增强子在lncRNA 介导下的作用,对于我们认识经lncRNA 介导的复杂的表观遗传学修饰很有帮助。通过调节lncRNA的表达,或人工设计的lncRNA 调控分子可望用于肿瘤或其他疾病的基因治疗。相信随着研究的深入,一个新的领域正在对我们敞开,为分子生物学家提供了新的机遇与挑战。
[1]Mattick J S.RNA regulation:a new genetics?[J].Nat Rev Genet,2004,5(4):316-323.
[2]Taft R J,Pheasant M,Mattick J S.The relationship between non-protein-coding DNA and eukaryotic complexity[J].Bioessays,2007,29(3):288-299.
[3]Carninci P,Kasukawa T,Katayama S,et al.The transcriptional landscape of the mammalian genome[J].Science,2005,309(5740):1559-1563.
[4]Ponjavic J,Ponting C P,Lunter G.Functionality or transcriptional noise?Evidence for selection within long noncoding RNAs[J].Genome Res,2007,17(3):556-565.
[5]Birney E,Stamatoyannopoulos J A,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447(7146):799-816.
[6]Sati S,Ghosh S,Jain V,et al.Genome-wide analysis reveals distinct patterns of epigenetic features in long noncoding RNA loci[J].Nucleic Acids Res,2012,40(20):10018-10031.
[7]Schmitz K M,Mayer C,Postepska A,et al.Interaction of noncoding RNA with the rDNA promoter mediates recruitment of DNMT3band silencing of rRNA genes[J].Genes Dev,2010,24(20):2264-2269.
[8]Hirota K,Miyoshi T,Kugou K,et al.Stepwise chromatin remodelling by a cascade of transcription initiation of non-coding RNAs[J].Nature,2008,456(7218):130-134.
[9]Ponting C P,Oliver P L,Reik W.Evolution and functions of long noncoding RNAs[J].Cell,2009,136(4):629-641.
[10]Feng J,Bi C,Clark B S,et al.The Evf-2noncoding RNA is transcribed from the Dlx-5/6ultraconserved region and functions as a Dlx-2transcriptional coactivator[J].Genes Dev,2006,20(11):1470-1484.
[11]Kim T K,Hemberg M,Gray J M,et al.Widespread transcription at neuronal activity-regulated enhancers[J].Nature,2010,465(7295):182-187.
[12]Wang D,Garcia-Bassets I,Benner C,et al.Reprogramming transcription by distinct classes of enhancers functionally defined by eRNA [J]. Nature,2011,474(7351):390-394.
[13]Huarte M,Guttman M,Feldser D,et al.A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53response[J].Cell,2010,142(3):409-419.
[14]Liu X,Li D,Zhang W,et al.Long non-coding RNA gadd7 interacts with TDP-43and regulates Cdk6mRNA decay[J].EMBO J,2012,31(23):4415-4427.
[15]Hellwig S,Bass B L.A starvation-induced noncoding RNA modulates expression of Dicer-regulated genes[J].Proc Natl Acad Sci USA,2008,105(35):12897-12902.
[16]Wang X,Arai S,Song X,et al.Induced ncRNAs allosterically modify RNA binding proteins in cis to inhibit transcription[J].Nature,2008,454(7200):126-130.
[17]Lanz R B,McKenna N J,Onate S A,et al.A steroid receptor coactivator,SRA,functions as an RNA and is present in an SRC-1complex[J].Cell,1999,97(1):17-27.
[18]Watanabe T,Totoki Y,Toyoda A,et al.Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes[J].Nature,2008,453(7194):539-543.
[19]Beltran M,Puig I,Pena C,et al.A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition [J].Genes Dev,2008,22(6):756-769.
[20]Kanhere A,Viiri K,Araujo C C,et al.Short RNAs are transcribed from repressed polycomb target genes and interact with polycomb repressive complex-2[J].Mol Cell,2010,38(5):675-688.
[21]Yamashita A,Watanabe Y,Nukina N,et al.RNA-assisted nuclear transport of the meiotic regulator Mei2p in fission yeast[J].Cell,1998,95(1):115-123.
[22]Rudt F,Pieler T.Cytoplasmic retention and nuclear import of 5Sribosomal RNA containing RNPs[J].EMBO J,1996,15(6):1383-1391.
[23]Clemson C M,Hutchinson J N,Sara S A,et al.An architectural role for a nuclear noncoding RNA:NEAT1 RNA is essential for the structure of paraspeckles[J].Mol Cell,2009,33(6):717-726.
[24]Sasaki Y T,Ideue T,Sano M,et al.MEN epsilon/beta noncoding RNAs are essential for structural integrity of nuclear paraspeckles [J].Proc Natl Acad Sci USA,2009,106(8):2525-2530.
[25]Gupta R A,Shah N,Wang K C,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J].Nature,2010,464(7291):1071-1076.