长非编码RNA的研究进展

2013-04-06 00:40季少平
河南大学学报(医学版) 2013年3期
关键词:增强子染色质构象

季少平

(河南大学 医学院,河南 开封 475004)

非编码RNA 是指那些不被翻译成蛋白质的RNA 分子,除去那些看家RNA(如rRNA和tRNA)以及siRNA和microRNA,其调控基因表达的机制不同于长非编码RNA(lncRNA),因此不在此讨论之列。lncRNA 通常被认为是那些大于200核苷酸长度,几乎没有可编码大于100 氨基酸开放读框的RNA 分子。和编码RNA 相比,lncRNA 也经过拼接,也有帽子结构和多聚A 尾巴,但缺乏开放读框,有些lncRNA 一度被称为假基因(pseudogene)。对lncRNA的研究,使人们认识了基因表达调控的一个新层面。

lncRNA 对生命过程的调节可能解释了人类具有相似数量的蛋白质编码基因(与其他物种相比),却具有更为复杂的生物学表型[1-2]。研究[2]显 示,在人类转录的RNA中98%为lncRNA,而lncRNA的数量与物种的复杂性成正比关系。和编码基因的转录相比,lncRNA的启动子区具有更为保守的序列[3-4]。lncRNA 主要通过表观遗传学调节基因转录,决定基因表达与否。由于RNA 具有较弱的催化活性,它们往往需要通过募集蛋白质复合物(具有酶活性)对特定区域进行修饰。lncRNA 可作为一个平台,把两种染色质修饰复合物连接在一起,协同作用于目标基因进行表观遗传学修饰。以往,除了参与氨基酸转运、RNA 拼接和蛋白质合成的RNA(如rRNA和tRNA)外,其他lncRNA的转录都被认为是基因表达的副产品,但近年的研究改变了人们对lncRNA的认识,它们在生命的多个过程中起着重要作用。lncRNA 呈现序列多样性,具有亚细胞分布特色,表现出组织和细胞特异性,并具有调节的时空特性。lncRNA 主要涉及转录和转录后调节、基因组修饰、X-染色体失活以及mRNA 降解。此外,lncRNA 还具有协助蛋白质的亚细胞定位、诱导蛋白质构象改变、以及细胞形态维持等作用。在生命过程中的不同阶段以及不同的组织器官,共有基因组的95%得到转录。因此,lncRNA的数量要远大于编码RNA的数量[5]。从碱基序列上看,lncRNA 在进化上缺乏保守,呈多样性,在功能上其三维结构的构象可能更为重要。相对于小的非编码RNA 如siRNA和microRNA,我们对lncRNA的认识远远落后。

1 长非编码RNA 参与染色质重塑

在高等生物,染色质修饰(如组蛋白的甲基化、乙酰化、磷酸化和DNA 甲基化等)在时空上对于基因表达特异性非常重要,尤其在发育的不同阶段,它们决定了一些基因在何时与何地表达与否。这些修饰决定了转录过程中蛋白质因子(如转录因子、转录激活子和转录抑制子等)能否接近目标DNA(如启动子和增强子等),从而决定了目标基因的开放与关闭。而修饰染色质的酶复合物是广泛表达的,但是如何特异地修饰特定的DNA 位点是分子生物学家所关心的,也是目前最难搞清楚的领域。

在研究X- 染色体剂量补偿效应、等位基因失活以及同源基因表达不平等时,发现lncRNA 对这些复杂现象的调节,主要通过参与对基因组的表观遗传学调节。而阻断这些lncRNA 参与的表观遗传学调节,可导致一系列发育障碍或疾病,可见lncRNA 在生命过程中的重要性。研究比较清楚的两个lncRNA Air和Kcnqlot1参与了等位基因的表达失活调节,在基因组印记(genomic imprinting)中起着重要作用。它们通过与染色质修饰复合物结合,对特定基因座位的组蛋白修饰,进而抑制母系或父系等位基因的表达。Air首先聚集于Slc22a3基因的启动子区,募集甲基化转移酶G9a,介导组蛋白H3K9的甲基化。在小鼠,Air利用位于Igf2r基因第二个内含子内部的启动子得以转录,参与对来自父系Igf2r、Slc22a2和Slc22a3基因的表达抑制。而Air的截断突变,导致G9a不能有效地聚集于Slc22a3基因的启动子区,进而导致等位基因的同时转录,丢失了对父系等位基因的特异抑制[5]。

lncRNA与染色质修饰复合物间的作用也是导致X- 染色体失活的原因。目前已知,至少有7个lncRNA 参与了这一过程,其中包括Xist。在雌性动物X 染色体的一条上,所有基因的表达都被关闭,而只有一条X 染色体的基因得以表达,这样使得雌性动物具有与雄性动物一样的X- 连锁的基因表达。Xist从将要失活的X 染色体上转录,然后与PRC2(polycomb represive complex 2)结合,使得PRC2沿X 染色体扩散,并在PRC2的H3K27三甲基酶活性的作用下最终沉默整条染色体。Xist的转录也是受到另一个lncRNA rep A的诱导,rep A与PRC2结合并导致Xist启动子区H3K27的三甲基化而激活Xist的转录。rep A 转录于Xist的5'端保守区且与Xist的转录方向一致,rep A 含有7.5个由28nt构成的串联重复序列,折叠成两个保守的柄环结构。在对基因组DNA 进行的广泛表观遗传学修饰分析中发现,组蛋白不同位点的甲基化对编码和非编码RNA的转录具有类似的作用,但是DNA 甲基化对二者的影响不同[6]。

在介导染色质重塑时,除蛋白质可结合多种lncRNA 外,一种lncRNA 也好像可与多种蛋白质结合。许多参与染色质重塑、抑制基因表达的酶并没有DNA 结合结构域,却有RNA 结合结构域,可能暗示着lncRNA 在染色质重塑中的重要性。如Kcnqlot1、Airn、Xist、HOTAIR与PRC1 或PRC2 结合,介导组蛋白2(H2)的第119位赖氨酸的单泛素化、组蛋白3(H3)的第27位赖氨酸的二甲基化或三甲基化。这些蛋白分子与不同lncRNA的结合,可能通过构象的改变决定了它们对目标基因的选择特异性,而lncRNA 可能起着变构诱导样的作用。lncRNA与DNA 形成3 股核酸链杂交,利于DNA 甲基转移酶3b对DNA的甲基化修饰[7],但这种作用方式是否为普遍现象尚有待研究。

2 长非编码RNA 参与转录调节

已发现的lncRNA 大多涉及基因的转录,它们通过对转录因子的募集与活性调节,最终实现对基因表达的精细调控。lncRNA 除了通过顺式作用直接调节目标基因的表达外,还可通过反式作用经调节转录因子的表达进而影响目标基因的表达。例如,来自HOXC的lncRNA HOTAIR 通过反式作用影响其他HOX 座位的转录因子基因表达。lncRNA 可通过与RNA 聚合酶Ⅱ结合,影响整个转录“机器”而对大多数基因的转录产生影响。如人类的Alu RNA和B2RNA,受到热休克诱导,可与RNA 聚合酶Ⅱ结合而广泛抑制基因的转录。

此外,lncRNA 本身的转录,也可引起相邻基因的转录抑制。已知SRG1的转录可干扰临近基因的转录元件与其启动子的结合,导致其他基因无法转录而受到抑制[8-9]。除了抑制基因表达外,lncRNA 也可介导激活基因的表达。Evf-2 能与Dlx-2协同特异地增强Dlx-5/6 增强子的活性,促进相关基因的转录[10]。

RNA 聚合酶Ⅱ与增强子结合并对该区域进行双向转录,可转录出一种新的lncRNA 称为eRNA,这种eRNA 在远端增强子的帮助下将沉默区段内的某个特定基因“解救”出来,增加目标基因的转录水平[11-12]。因此,eRNA 更具有特异性,更具有用于基因治疗的潜力。广泛的研究表明,被沉默的基因启动子区,有大量的lncRNA-蛋白复合物覆盖,在DNA序列上形成很大的区段。而且随着生命过程的变化,这种覆盖是处于一种动态的过程。处于关闭状态的基因可能在增强子的帮助下,重新被激活。增强子通过顺式和反式作用,激活转录,而染色质回折形成环形,使得距离较远的大跨度的DNA 靠近,方便增强子与目标区域的直接接触也是必要的。

3 长非编码RNA 其他作用方式

lncRNA 在植物中的表达更为广泛,其主要原因是应对随时的环境变化。在哺乳动物,lncRNA 广泛参与了细胞对外部刺激的应激调节。在DNA 损伤时,一个位于基因间的受p53 诱导表达的lncRNA licnRNA-p21,与核蛋白K 一起介导广泛的基因表达抑制[13]。其意义在于DNA 损伤后的修复最为重要,其他基因的表达多被暂停,如果DNA 能得以修复,那么细胞就得以生存。另一个DNA 损伤诱导表达的lncRNA gadd7可直接与TDP-43(TAR DNA 结合蛋白)结合,而阻止TDP-43与Cdk6的mRNA 结合,从而导致该mRNA的降解[14]。另外发现,一种饥饿诱导的lncRNA,Rncs-1 可抑制Dicer的活性,阻断Dicer对双链RNA的加工,抑制micro-RNA 对其他基因表达的调控[15],但其意义仍不清楚。

翻译后修饰可通过改变蛋白质的构象而影响蛋白质的活性。lncRNA 也可作为分子伴侣帮助蛋白质改变构象,而影响其活性。在DNA 损伤信号调节下转录的一种非编码RNA 可通过调节一种RNA 结合蛋白TLS(Translocated in Lipo Sarcoma),使其构象改变,从无活性变为有活性[16]。此外,另一个lncRNA,是一个激素受体的RNA 激活子(SRA)可促进核蛋白复合物SRC-1及相关核受体的激活,而调节激素相关基因的表达[17]。

另外,特定基因的反义转录形成的lncRNA,也能与正义链形成双链RNA,经Dicer加工后产生siRNA,经RNAi降解mRNA 或抑制目标基因的翻译[18-19]。小核RNA 通过与RNA 聚合酶Ⅱ起作用,或调节转录后加工对目标基因的表达水平进行调节。在转录时,一些位于被抑制座位的基因虽然没有mRNA 转录,但却可转录出小的非编码RNA,并形成柄环结构与PRC2复合物结合,参与介导目标基因的抑制[20]。

lncRNA 帮助目标蛋白的亚细胞定位。例如,一种酵母蛋白Mei2p需要与MeiRNA(一种lncRNA)结合后从胞质转运到核内[21];而5S核糖体RNA 通过遮蔽转录因子TFIIA的核定位信号而使TFIIA留在胞质[22]。有两种lncRNA,MEN epsilon和MEN beta,他们与Paraspeckle(一种核内蛋白核酸结构)中的蛋白组分结合,对维持Paraspeckle结构完整与数量十分重要。而Paraspeckle可能是核内储存RNA的一个重要场所[23-24]。lncRNA与疾病特别是肿瘤发生、发展间关系的研究已有许多报道。最近的研究显示,HOTAIR的表达水平升高与乳腺癌的生长与转移能力密切相关。在上皮癌细胞中过表达HOTAIR,导致PCR2 在基因组内广范围地重新分布、并改变组蛋白的甲基化模式,使细胞更像胚胎成纤维细胞,同时增加细胞的浸润和转移能力[25]。

4 未来展望

由于lncRNA 种类繁多、结构多样、序列缺乏保守性,因而给lncRNA的研究带来很大困难。相信随着新的技术进步,例如一些类似ChIP(染色质免疫沉淀)技术的引入,通过不同方式鉴定出更多lncRNA及其介导的生物学功能,将为我们认识生命过程中,基因表达在不同层面的调控大有帮助,随着作用机制的阐明,并将产生巨大的应用潜力。lncRNA 一级序列缺乏保守性,我们不能从lncRNA的序列同源性上预测其生物学活性,也不能从其结合的靶点上推测其生物学活性的相似性,其可能的机制是由于lncRNA的结合导致蛋白靶分子构象改变而影响了功能。未来的研究分析lncRNA 活性仍离不开蛋白质分子,尤其是一些与转录相关的转录因子、增强子、转录激活子或转录抑制子等。

在生长发育的不同阶段、不同时期以及其他条件下,确定更多的远端增强子在lncRNA 介导下的作用,对于我们认识经lncRNA 介导的复杂的表观遗传学修饰很有帮助。通过调节lncRNA的表达,或人工设计的lncRNA 调控分子可望用于肿瘤或其他疾病的基因治疗。相信随着研究的深入,一个新的领域正在对我们敞开,为分子生物学家提供了新的机遇与挑战。

[1]Mattick J S.RNA regulation:a new genetics?[J].Nat Rev Genet,2004,5(4):316-323.

[2]Taft R J,Pheasant M,Mattick J S.The relationship between non-protein-coding DNA and eukaryotic complexity[J].Bioessays,2007,29(3):288-299.

[3]Carninci P,Kasukawa T,Katayama S,et al.The transcriptional landscape of the mammalian genome[J].Science,2005,309(5740):1559-1563.

[4]Ponjavic J,Ponting C P,Lunter G.Functionality or transcriptional noise?Evidence for selection within long noncoding RNAs[J].Genome Res,2007,17(3):556-565.

[5]Birney E,Stamatoyannopoulos J A,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447(7146):799-816.

[6]Sati S,Ghosh S,Jain V,et al.Genome-wide analysis reveals distinct patterns of epigenetic features in long noncoding RNA loci[J].Nucleic Acids Res,2012,40(20):10018-10031.

[7]Schmitz K M,Mayer C,Postepska A,et al.Interaction of noncoding RNA with the rDNA promoter mediates recruitment of DNMT3band silencing of rRNA genes[J].Genes Dev,2010,24(20):2264-2269.

[8]Hirota K,Miyoshi T,Kugou K,et al.Stepwise chromatin remodelling by a cascade of transcription initiation of non-coding RNAs[J].Nature,2008,456(7218):130-134.

[9]Ponting C P,Oliver P L,Reik W.Evolution and functions of long noncoding RNAs[J].Cell,2009,136(4):629-641.

[10]Feng J,Bi C,Clark B S,et al.The Evf-2noncoding RNA is transcribed from the Dlx-5/6ultraconserved region and functions as a Dlx-2transcriptional coactivator[J].Genes Dev,2006,20(11):1470-1484.

[11]Kim T K,Hemberg M,Gray J M,et al.Widespread transcription at neuronal activity-regulated enhancers[J].Nature,2010,465(7295):182-187.

[12]Wang D,Garcia-Bassets I,Benner C,et al.Reprogramming transcription by distinct classes of enhancers functionally defined by eRNA [J]. Nature,2011,474(7351):390-394.

[13]Huarte M,Guttman M,Feldser D,et al.A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53response[J].Cell,2010,142(3):409-419.

[14]Liu X,Li D,Zhang W,et al.Long non-coding RNA gadd7 interacts with TDP-43and regulates Cdk6mRNA decay[J].EMBO J,2012,31(23):4415-4427.

[15]Hellwig S,Bass B L.A starvation-induced noncoding RNA modulates expression of Dicer-regulated genes[J].Proc Natl Acad Sci USA,2008,105(35):12897-12902.

[16]Wang X,Arai S,Song X,et al.Induced ncRNAs allosterically modify RNA binding proteins in cis to inhibit transcription[J].Nature,2008,454(7200):126-130.

[17]Lanz R B,McKenna N J,Onate S A,et al.A steroid receptor coactivator,SRA,functions as an RNA and is present in an SRC-1complex[J].Cell,1999,97(1):17-27.

[18]Watanabe T,Totoki Y,Toyoda A,et al.Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes[J].Nature,2008,453(7194):539-543.

[19]Beltran M,Puig I,Pena C,et al.A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition [J].Genes Dev,2008,22(6):756-769.

[20]Kanhere A,Viiri K,Araujo C C,et al.Short RNAs are transcribed from repressed polycomb target genes and interact with polycomb repressive complex-2[J].Mol Cell,2010,38(5):675-688.

[21]Yamashita A,Watanabe Y,Nukina N,et al.RNA-assisted nuclear transport of the meiotic regulator Mei2p in fission yeast[J].Cell,1998,95(1):115-123.

[22]Rudt F,Pieler T.Cytoplasmic retention and nuclear import of 5Sribosomal RNA containing RNPs[J].EMBO J,1996,15(6):1383-1391.

[23]Clemson C M,Hutchinson J N,Sara S A,et al.An architectural role for a nuclear noncoding RNA:NEAT1 RNA is essential for the structure of paraspeckles[J].Mol Cell,2009,33(6):717-726.

[24]Sasaki Y T,Ideue T,Sano M,et al.MEN epsilon/beta noncoding RNAs are essential for structural integrity of nuclear paraspeckles [J].Proc Natl Acad Sci USA,2009,106(8):2525-2530.

[25]Gupta R A,Shah N,Wang K C,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J].Nature,2010,464(7291):1071-1076.

猜你喜欢
增强子染色质构象
致癌超级增强子的形成与干预研究进展
染色质开放性与动物胚胎发育关系的研究进展
哺乳动物合子基因组激活过程中的染色质重塑
超级增强子调控基因表达的生物学作用及其在哺乳动物中的应用前景
乳腺癌中p53调控增强子的特征与功能分析
丝氨酸构象异构化机理的密度泛函理论研究
染色质可接近性在前列腺癌研究中的作用
“哺乳动物卵母细胞生发泡染色质构型的研究进展”一文附图
超级增强子在肿瘤研究中的进展
一种一枝黄花内酯分子结构与构象的计算研究