王国强,卫 宁,王 禹,庞卫军
(西北农林科技大学动物科技学院,陕西杨凌712100)
近年来,高通量转录组测序分析发现哺乳动物基因组中存在一系列不编码蛋白质的正义、反义、内含子和基因间的转录本[1-4],统称为非编码RNA(non-coding RNA,ncRNA),其中转录本长度大于200nt的称为长链非编码RNA(long non-coding RNA,lncRNA)。lncRNA最初被认为是RNA聚合酶II转录的副产物,不具有生物学功能。然而,近年来研究表明,lncRNA参与了X染色体沉默、染色体修饰和基因组修饰、转录激活、转录干扰、核内运输等重要的生物学过程,且具有促进细胞凋亡、病毒入侵、多能干细胞去分化、细胞命运标记和遗传印记等多种功能[5-10]。据统计,哺乳动物蛋白编码RNA仅占总RNA的1%,而长链非编码RNA占总RNA的比例可达4%~9%[11]。lncRNA还与多种疾病的发生、发展、诊断和治疗有密切关系,特别是在多种癌症的表观遗传调控方面起着重要作用。本文综述了lncRNA与DNA、mRNA、miRNA和蛋白的互作关系,旨在为进一步研究lncRNA调控网络及其在相关代谢途径中的功能提供参考。
由于lncRNA数目众多,功能各异所以对其还没有统一的定义。目前,普遍认为lncRNA是大于200nt的、没有编码蛋白功能的RNA,但以RNA形式在表观遗传调控、转录调控以及转录后调控等多种层面上调节基因的表达水平。lncRNA可由DNA的正义链(sense strand of DNA)或反义链(antisense strand of DNA)转录产生,位于细胞核内或者胞浆中。大多数lncRNA与mRNA具有相同的转录机制,即需要RNA聚合酶II的参与以及与转录起始和延伸相关的组蛋白的修饰。这些lncRNA具有5'端的甲基鸟苷帽子,相当一部分lncRNA的3'端具有多聚腺苷尾[12-14]。
对lncRNA进行科学的分类是有效地研究lncRNA的前提,目前比较公认的是根据其来源于基因组的不同位置分为五类[11]:①正义的(sense),蛋白编码基因转录产物经过剪接产生的无编码功能的转录本;②反义的(antisense,AS),由与蛋白编码基因互补的DNA链转录产生,且和该基因有一个或数个外显子的重叠;③双向的(bidirectional),基因组邻近区域互补的两条链上的基因同时表达的转录本;④内含子的(intronic),即完全来源于基因的内含子;⑤基因间的(intergenic),位于两个基因间的区域。
2.1.1 等位基因特异性 遗传印记是等位基因特异性的一个后生调控机制。多数情况下,哺乳动物来自亲本的两个等位基因表达是对等的,然而其中一小部分带有印记的基因的表达被表观遗传机制限制在母本或父本等位基因。一些lncRNA通过与染色质相互作用和招募染色质修饰结构来调节多种基因的转录沉默,如被定位于KCNQ1r印迹基因簇的Kcnq1ot1AS lncRNA与组蛋白甲基转移酶G9a和PRC2(Polycomb repressive complex2,PRC2)相互作用,有效地通过招募多梳复合物在顺式位置形成其转录位点的抑制结构域[15]。
2.1.2 甲基化与泛素化修饰 lncRNA TUG1可与抑制性复合物CoR结合作用于甲基化酶Suv39h1对多梳蛋白Pc2进行甲基化修饰,进而结合E2F1因子(能够抑制促进生长的一系列基因的表达,使细胞处于休眠状态),形成抑制性复合体,该复合体结合于DNA链上可抑制一系列基因的表达;而lncRNA NEAT2则与其作用相反,它能结合激活性复合物CoA,作用于Pc2进而使E2F1因子泛素化,从而解除抑制作用,促进一系列促生长基因(MCM3、CDC25A、PCNA、MSH2、RBL1等)的表达,如图1所示[16]。
图1 lncRNA TUG1和NEAT2的表观遗传调控功能[16]Fig.1 Epigenetic regulatory function of lncRNA TUG1and NEAT2
2.2.1 直接顺式调控转录 lncRNA可以结合转录因子,直接顺式调节基因的转录,而不是通过与DNA结合而发挥转录调控作用。如电离辐射诱导的细胞周期蛋白D1(Cyclin D1,CCND1)启动子上游转录出的lncRNA与脂肪肉瘤易位蛋白(Translocation liposarcoma protein,TLS)结合,从而产生变构效果,结合并抑制组蛋白乙酰转移酶,导致CCND1转录下调[17]。
2.2.2 与DNA形成异源多聚体 lncRNA与不同功能的几类效应分子--激活性复合体如三胸苷蛋白(Three thymidine protein,TXG)、抑制性复合物蛋白质如多梳蛋白基团(Polycomb group protein,PCG)等构成大分子复合体,然后与靶基因结合,形成蛋白质-RNA-DNA异源多聚体调节基因的转录。位于CDKN1A基因上游的lincRNA-p21,在DNA损伤的情况下被诱导转录,作为经典p53通路的转录抑制因子,通过结合和修饰核内非均一核糖核蛋白hnRNP-K,从而作用并抑制p53基因,引发细胞凋亡[18]。再如上文提到的TUG1和NEAT2,它们激活或抑制基因的表达也是通过与DNA形成异源多聚体实现的。
2.2.3 转录干扰 一些基因的mRNA的内源性互补转录本--天然反义转录本(Natural antisense transcripts,或AS lncRNA)在转录时,与正义转录本(mRNA)的重叠区较大,两个RNA聚合酶相互碰撞导致转录起始受阻,产生一条链转录而另一条链转录受抑制的转录干扰现象[19],尤其见于“尾对尾”转录的反义转录本中[20]。
lncRNA在转录后水平可通过和互补的mRNA形成双链RNA,影响mRNA加工、剪接、转运、翻译和降解等过程,从而调节基因的表达。人急性粒细胞白血病细胞HL-60细胞系中PU.1的mRNA的水平很高,而蛋白质水平不高,是由于PU.1的AS RNA与其mRNA结合导致翻译受抑制[21]。
lncRNA还可以互补结合mRNA,掩蔽其3'-UTR部位的靶miRNA结合位点,从而有助于该mRNA的稳定并促进其翻译,interferon-α1的AS RNA即通过掩蔽其mRNA的miR-1270的结合位点增强其mRNA的稳定性[22]。
与多能性相关的长链基因间的非编码RNA(long intergenetic noncoding RNA,lincRNA)最早发现于鼠胚胎干细胞。Loewer等[23]研究发现与胚胎干细胞(ESCs)相比较,在诱导多能干细胞(iPSCs)中检测到10个的表达上调lincRNAs,推测iPSCs的形成是通过这些lincRNAs与多能性因子相互作用实现的。如lincRNA-RoR(Receptor superfamily related to the retinoic acid receptors,RoR)在体细胞去分化并诱导iPSCs的过程高表达,能靶定结合关键的多能性因子Oct4、Sox2和Nanog的启动子邻近区域(PrPr区域),从而促进其表达而诱导细胞去分化和多能性的产生。因此,RoR在体外可以促进多种细胞系去分化产生iPSCs[23]。
3.1.1 肝癌 Yang等[24]证实lncRNA-HEIH(High expression in hepatocellular carcinoma,HEIH)有助于肝癌的发生,它与EZH2结合,下调p21等细胞周期调控因子的表达,促进细胞周期由G0进入S期,诱发肝细胞癌变。且lncRNA-HEIH表达的下调显著的抑制了肝癌细胞的生长,因此,lncRNA-HEIH将成为肝细胞癌治疗的潜在靶点。
lncRNA-HULC(Highly up-regulated in liver cancer,HULC)是转录自6p24.3的大约500nt的转录本。在肝癌细胞中,启动子结合蛋白CREB(cAMP-response element binding protein,CREB)可以通过与miR-372相互作用上调lncRNAHULC的表达,而HULC已经被鉴定在肝癌及肠癌转移的组织中特异性高表达[25]。
3.1.2 乳腺癌 lncRNA-GAS5(Growth arrestspecific transcript 5,GAS5)具有抑制肿瘤的作用,它起初是在小鼠胚胎成纤维细胞中发现的,通过选择性剪切可产生不同的结构,它的开放式阅读框很小且保守性很差。相对于正常乳腺细胞,lncRNAGAS5在乳腺癌组织中表达量显著降低。GAS5转录加工过程中产生的小核仁RNA具有诱导细胞生长抑制和凋亡的功能[26]。
3.1.3 前列腺癌 lncRNA-PCGEM1(Prostate cancer gene expression marker 1,PCGEM1)的过量表达导致了癌细胞的增殖和克隆形成,其转录水平的上调与美洲黑人的恶性前列腺癌的发生有关联,PCGEM1调控着前列腺癌的发生进程,是潜在的前列腺癌标记。Schilling[27-28]等通过PSA(Prostate-specific antigen,亦称Differential display code 3,DD3)表达水平和活体组织检测的5个案例,认为DD3分析可帮助决定立即治疗或留待观察,并提出DD3分析将是诊断前列腺癌的新标记。
lncRNA-PCATs(Prostate cancer-associated ncRNA transcripts,PCATs)靶定结合并抑制多梳抑制性复合物2(Polycomb Repressive Complex 2,PRC2)的转录抑制作用,显著地促进细胞增殖,因而被认定为恶性前列腺癌的标记[29]。
3.1.4 肺 癌 lncRNA-MALAT-1(Metastasis-associated lung adenocarcinoma transcript 1,MALAT-1)既是肺癌组织的生物标记也是治疗肺癌的靶点。MALAT-1可以正调控与癌症迁移相关的基因的表达。因此,抑制MALAT-1的表达可以阻止肺癌细胞的迁移和肿瘤组织的增大[30]。Tripathi等[31]通过基因过表达载体和siRNA处理,发现MALAT1可以通过调节SR蛋白(丝氨酸/精氨酸丰富蛋白家族)的磷酸化来影响许多mRNA前体的剪切。
目前lncRNA在人类肥胖及相关疾病中的作用还未见报道。转录因子PU.1是调控生命过程的关键因子,最近发现,PU.1(Spleen focus forming virus(SFFV)proviral integration oncogene,spi-1或PU.1)在脂肪代谢过程中发挥调控作用。PU.1在前体脂肪细胞中mRNA表达较高,而蛋白表达较低,在成熟脂肪细胞中则相反:过表达PU.1显著抑制脂肪细胞中脂肪的生成[32]。本研究团队推测PU.1AS lncRNA在该过程中发挥着关键作用,通过与mRNA结合进行转录后调控[33]。而且有报道,PU.1与生脂关键基因C/EBPα(CCAAT enhancer binding proteinα,C/EBPα)发挥协同作用[34]。因此,AS lncRNA很可能在肥胖以及二型糖尿病等相关疾病的治疗中发挥关键作用。
最近研究发现,β分泌酶的一段保守的反义lncRNA(noncoding AS transcript forβ-secretase-1,BACE1)能够加速阿尔茨海默病(AD)的发生[35]。分析其在人脑和AD小鼠模型中的表达和影响结果表明,在各种细胞应激的诱导下其表达上调。而以往研究表明其正义转录本的缺失会造成记忆缺失和外周神经鞘缺损等生理缺陷。因此,lncRNA也能在精细范围内发挥调节作用。
最近的研究表明lncRNA之间可以竞争结合共同的miRNAs从而影响miRNAs的靶向干扰作用[36]。这种竞争性的内源RNA(Competing endogenous RNAs,ceRNAs)调控miRNA分子在它们靶序列上的分布,发挥转录后水平调控作用。人类和小鼠成肌细胞中的一个新的长非编码RNA-linc-MD1[37],作为ceRNA调控肌肉分化时序,其被下调或者过表达分别导致肌肉分化的滞后和提前。linc-MD1吸附结合miR-133和miR-135分别解除它们对其靶基因MAML1(Mastermind-like protein1,MAML1)和MEF2C(Muscle-specific enhancing factor 2C,MEF2C)的干扰作用,激活这两种肌肉特异性因子的表达,从而促进肌细胞的生存和分化,对杜氏肌营养不良病起到缓解作用。因而lncRNA在肌肉分化过程中发挥着重要作用。
LncRNA已被公认为是基因调控大家族的新成员。目前,相对于miRNA和siRNA等小非编码RNA,研究人员对lncRNA的认识还相当有限。lncRNA数量繁多且功能复杂,而且各种功能的lncRNA仍不断地被发现,揭示其在生命过程的调控,疾病的发生、发展和遗传学方面有重要作用。因此,对lncRNA的研究将成为生命科学领域的新热点。
综上所述,lncRNA的识别、鉴定和其与microRNA、蛋白质等相互作用在系统生物学中的研究,以及其在重大疾病发生、发展中的基因调控作用将是今后相当长的一段时间内有待探索的问题。
[1] Clark M B,Johnston R L,Inostroza-Ponta M,et al.Genomewide analysis of long noncoding RNA stability[J].Genome Res,2012,22:885-898.
[2] Sun L,Goff L A,Trapnell C,et al.Long noncoding RNAs regulate adipogenesis[J].Proc Natl Acad Sci USA,2013,110(9):3 387-3 392.
[3] Chen G,Qiu C,Zhang Q,et al.Genome-wide analysis of human SNPs at long intergenic noncoding RNAs[J].Hum Mutat,2013,34(2):338-344.
[4] Yi F,Yang F,Liu X.RNA-seq identified a super-long intergenic transcript functioning in adipogenesis[J].RNA Biol,2013,10(6):990-1 001.
[5] Mattick J S.The central role of RNA in human development and cognition[J].FEBS Lett,2011,585(11):1 600-1 616.
[6] Nagano T,Fraser P.No-nonsense functions for long noncoding RNAs[J].Cell,2011,145(2):178-181.
[7] Khaitan D,Dinger M E,Mazar J,et al.The melanoma-upregulated long noncoding RNA SPRY4-IN1modulates apoptosis and invasion[J].Cancer Res,2011,71(11):3 852-3 862.
[8] Loewer S,Cabili M N,Guttman M,et al.Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells[J].Nat Genet,2010,42(12):1 113-1 117.
[9] Ginger M R,Shore A N,Contreras A,et al.A noncoding RNA is a potential marker of cell fate during mammary gland development[J].Proc Natl Acad Sci USA,2006,103(15):5 781-5 786.
[10] Sleutels F,Zwart R,Barlow D P.The non-coding Air RNA is required for silencing autosomal imprinted genes[J].Nature,2002,415(6873):810-813.
[11] Ponting C P,Oliver P L,Reik W.Evolution and functions of long noncoding RNAs[J].Cell,2009,136(6):629-641.
[12] Navikova I V,Hennelly S P,Sanbonmatsu K Y.Tackling structures of long noncoding RNAs[J].Int J Mol Sci,2013,14(12):23 672-23 684.
[13] Mitchell G,John L R.Modular regulatory principles of large non-coding RNAs[J].Nature,2012,482(7385):339-346.
[14] Birney E,Stamatoyannopoulos J A,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447(7146):799-816.
[15] Zhang H,Zeitz M J,Wang H,et al.Long noncoding RNA-mediated intrachromosomal interactions promote imprinting at the Kcnq1locus[J].J Cell Biol,2014,204(1):61-75.
[16] Yang L Q,Lin C R,Liu W,et al.ncRNA-and Pc2methylation-dependent gene relocation between nuclear structures mediates gene activation programs[J].Cell,2011,147(4):773-788.
[17] Wang X,Arai S,Song X,et al.Induced ncRNAs allosterically modify RNA-binding proteins in cis to inhibit transcription[J].Nature,2008,454(7200):126-130.
[18] Huarte M,Guttman M,Feldser D,et al.A large intergenic noncoding RNA induced by p53mediates global gene repression in the p53response[J].Cell,2010,142(3):409-419.
[19] Crampton N.Collision events between RNA polymerases in convergent transcription studied by atomic force microscopy[J].Nucleic Acids Res,2006,34(19):5 416-5 425.
[20] Michal L,Yitzhak P.Genome-wide natural antisense transcription:coupling its regulation to its different regulatory mechanisms[J].EMBO Reports,2006,7(12):1 216-1 222.
[21] Ebralidze A K,Guibal F C,Steid U,et al.PU.1expression is modulated by the balance of functional sense and antisense RNAs regulated by a shared cis-regulatory element[J].Genes Dev,2008,22(9):2 085-2 092.
[22] Kimura T,Jiang S W,Nishizawa M,et al.Stabilization of human interferon-a1mRNA by its antisense RNA[J].Cell Mol Life Sci,2013,70(8):1 451-1 467.
[23] Loewer S,Cabili M N,Guttman M,et al.Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells[J].Nat Genet,2010,42(12):1 113-1 117.
[24] Yang F,Zhang L,Huo X S,et al.Long noncoding RNA high expression in hepatocellular carcinoma facilitates tumor growth through enhancer of zeste homolog 2in humans[J].Hepatology,2011,54(5):1 679-1 689.
[25] Matouk I J,Abbasi I,Hochberg A,et al.Highly upregulated in liver cancer noncoding RNA is overexpressed in hepatic colorectal metastasis[J].Eur J Gastroen Hepat,2009,21(6):688-692.
[26] Mourtada-Maarabouni M,Pickard M R,Hedge V L,et al.GAS5,a non-protein-coding RNA,controls apoptosis and is downregulated in breast cancer[J].Oncogene,2009,28(2):195-208.
[27] Schilling D,de Reijke T,Tombal B,et al.The prostate cancer gene 3assay:indications for use in clinical practice[J].BJU Int,2010,105(4):452-455.
[28] Maciej S,Jack A S.PCA3and TMPRSS2-ERG:Promising biomarkers in prostate cancer diagnosis[J].Cancers,2010,2(3):1 432-1 440.
[29] Prensner J R,Iyer M K,Balbin O A.Transcriptome sequencing across a prostate cancer cohort identifies PCAT-1,an unannotated lincRNA implicated in disease progression[J].Nat Biotechnol,2011,29(8):742-750.
[30] Gutschner T,Hammerle M,Eissmann M,et al.The noncoding RNA MALAT1is a critical regulator of the metastasis phenotype of lung cancer cells[J].Cancer Res,2013,73(3):1 180-1 189.
[31] Tripathi V,Ellis J D,Shen Z,et al.The nuclear-retained noncoding RNA MALAT1regulates alternative splicing by modulating SR splicing factor phosphorylation[J].Mol Cell,2010,39(6):925-938.
[32] Wang F,Tong Q.Transcription factor PU.1is expressed in white adipose and inhibits adipocyte differentiation[J].Am J Physiol Cell Physiol,2008,295(1):C213-220.
[33] 庞卫军,卫宁,熊燕等.PU.1转录因子调控前体脂肪细胞生脂的分子机制研究进展[J].中国细胞生物学学报,2011,33(12):1 394-1 400.
[34] Jin F,Li Y,Ren B,et al.PU.1and C/EBPαsynergistically program distinct response to NF-kappaB activation through establishing monocyte specific enhancers[J].Proc Natl Acad Sci USA,2011,108(13):5 290-5 295.
[35] Xu B,Gerin I,Miao H Z,et al.Multiple Roles for the Non-Coding RNA SRA in Regulation of Adipogenesis and Insulin Sensitivity[J].PLoS ONE,2010,5(12):e14199.
[36] Faghihi M A,Modarresi F,Khalil A M,et al.Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of beta-secretase[J].Nat Med,2008,14(7):723-730.
[37] Salmena L,Poliseno L,Tay Y,et al.A ceRNA Hypothesis:The Rosetta Stone of a Hidden RNA Language[J].Cell,2011,146(3):353-358.
[38] Cesana M,Cacchiarelli D,Legnini I,et al.A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA[J].Cell,2011,147(2):358-369.