秦少伟 陆梦婷 周媛媛 吕建兵 王付康 温永强 赵利峰,2*
(1 塔里木大学生命科学学院,新疆 阿拉尔 843300)(2 塔里木大学塔里木盆地生物资源保护利用重点实验室, 新疆 阿拉尔 843300)
长链非编码RNA在动物和植物中的最新研究进展
秦少伟1陆梦婷1周媛媛1吕建兵1王付康1温永强1赵利峰1,2*
(1 塔里木大学生命科学学院,新疆 阿拉尔 843300)(2 塔里木大学塔里木盆地生物资源保护利用重点实验室, 新疆 阿拉尔 843300)
摘要长链非编码RNA(long non-coding RNA, lncRNA)是一类转录本长度大于200nt、不编码或很少编码蛋白质的RNA。lncRNA能在转录、转录后、表观遗传等多个水平调控基因表达,广泛参与基因组印迹、染色体重塑、转录激活、转录干扰、细胞周期等多种生命过程的调控,影响着各种生物学过程,是当前分子生物学和遗传学研究的热点。本文围绕近几年国内外关于lncRNA的最新研究成果,就其在动物和植物中参与的生物学过程进行了比较,对其分子机制、功能、研究策略及目前研究中面临的问题等作一综述,为进一步在动植物领域研究lncRNA的功能和分子机制提供依据和参考。
关键词长链非编码RNA; 功能; 分子机制; 动物; 植物; 研究进展
在经典中心法则中,RNA被认为是连接DNA和蛋白质的纽带和桥梁。2002年在小鼠cDNA文库测序中首次发现了长链非编码RNA(long non-coding RNA, lncRNA)的存在[1]。起初也认为lncRNA只是RNA聚合酶II转录的副产物,并没有生物学功能[2]。而人类DNA元件百科全书计划(encyclopedia of DNA elements, ENCODE)发现只有2%的基因能编码蛋白质,90%以上则为非编码RNA(non-coding RNA, ncRNA),其中lncRNA占总RNA的比例达4%~9%[3],这一发现让人们认识到了lncRNA的重要性。所谓lncRNA是一类转录本长度大于200 nt的RNA,其缺少完整的开放阅读框,本身不编码或很少编码蛋白质,在大部分真核生物基因组被转录。与mRNA相比,lncRNA表达丰度一般较低,且比mRNA具有更强的组织和细胞表达特异性,它们通过转录、转录后、表观遗传等多个水平调控蛋白质编码基因的表达,广泛参与X染色体沉默、基因组印迹、染色体修饰、转录激活、转录干扰和核内运输等过程的调控,从而作为功能调控元件在真核生物细胞分化、个体发育等生命过程的基因表达调控中起着极其重要的作用[2,4]。
lncRNA位于细胞核内或胞浆中,与mRNA具有类似的结构特征,具有5′帽子、3′polyA尾巴及选择性剪接位点等特点[5]。生物体内lncRNA含量丰富、种类繁多,根据其与邻近蛋白质编码基因在基因组上的位置和相对方向,将lncRNA分为5类:同义lncRNA、反义lncRNA、双向lncRNA、内含子lncRNA和基因间lncRNA[6]。目前,短链非编码小RNA(如microRNA、siRNA、piRNA等)的功能和作用机制已经比较清晰,但关于lncRNA特别是植物中lncRNA的研究仍然较少。因此,本文围绕近几年国内外对lncRNA的最新研究成果,就其在动物和植物中参与的生物学过程和功能进行比较,对其作用方式、基因表达调控的分子机制、研究策略及目前研究中面临的问题等作一综述,希望为后人研究提供参考。
1lncRNA参与的生物学过程和功能
1.1lncRNA参与动物的生物学过程和功能
目前,对动物中lncRNA的研究主要集中在人以及大鼠、小鼠和线虫等模式生物上。lncRNA广泛参与动物的发育和疾病产生等生物学过程中,它们通过转录水平(如转录激活、转录干扰等)、转录后水平(如核内运输、与microRNA相互作用等)和表观遗传水平(如X染色体沉默、基因组印迹、染色体修饰等)层次影响着细胞分化、个体发育和人类疾病发生等过程。
1.1.1lncRNA参与动物细胞增殖、分化和个体发育
在动物中,lncRNA可以作为激活子或者抑制子参与细胞的增殖和个体发育过程。研究表明,两类lncRNA能在肝再生中对肝脏细胞增殖和分化发挥重要作用,其中H19-lncRNA能通过其5′端与hnRNP蛋白结合,增强下游c-myc mRNA的稳定性并使之上调表达,形成myc自反馈环路从而促进肝细胞的增殖。而LALR1-lncRNA则通过激活Wnt/β-Catenin信号通路促进肝细胞的增殖[7]。
除了参与细胞增殖外,lncRNA还在胚胎干细胞、神经细胞、肌肉细胞、表皮细胞、成骨细胞和脂肪细胞等多种细胞的分化中起重要作用。研究人员在干细胞研究中发现lncRNA对维持干细胞的多潜能性有重要影响。在小鼠胚胎干细胞的分化过程中lncRNA呈现差异表达,一旦它们的表达被抑制,则会影响胚胎干细胞的整体基因表达谱[8]。在表皮祖细胞向角质细胞分化过程中,ANCR-lncRNA表达量逐渐降低,而把该lncRNA敲除后可以诱导皮肤特异性分化基因的表达[9]。如果抑制红系祖细胞和神经干细胞中lncRNA的表达,则能够抑制相应红细胞和神经干细胞的分化[10]。在肌原细胞向肌细胞的分化过程中,MD1-lncRNA通过与micorRNA-133和micorRNA-135序列的结合,上调这两个micorRNA的靶基因表达,从而促进肌原细胞向肌细胞的分化。同时,降低MD1-lncRNA表达量也能抑制相应细胞的分化[11]。说明lncRNA的差异表达对维持胚胎干细胞的多功能性有重要影响。此外,在lncRNA对胚胎干细胞分化的调控网络中发现,lncRNA的表达还受转录因子的调节,这些lncRNA进一步与染色质蛋白作用,再调控靶基因的表达和维持胚胎干细胞的多功能性[8]。说明lncRNA与染色质蛋白相互作用也有利于维持胚胎干细胞的多功能性。
lncRNA广泛参与器官和个体发育的调节。例如大脑中lncRNA呈高水平表达,它们一方面调控着大脑的基因表达,另一方面还调控着其他神经细胞的发育过程。脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)基因在人脑中与TUG1-lncRNA结合,形成双链RNA结构。而TUG1-lncRNA对人眼睛发育过程具有重要作用,一旦其表达被抑制,则会引起视网膜光感受器缺失或外部畸形[12]。lncRNA的表达不但具有细胞和组织特异性,也存在发育阶段特异性,仅仅在生物发育过程的特定阶段表达。原位杂交分析发现,33个mRNA-like lncRNA在黑腹果蝇胚胎发育过程中呈现高表达状态,其中16个lncRNA仅在中枢神经或外周神经系统中表达[13]。线虫发育过程中lncRNA的表达与之类似[14]。说明lncRNA在线虫和果蝇发育过程中呈现动态表达变化,具有精确的时间和空间表达模式。在胚胎发育研究中,发现一个lncRNA在中胚层向心脏发育过程中起重要的调控作用,它通过表观遗传方式调控和维持新生心肌细胞的正常状态[15]。在生殖细胞的发育中,lncRNA还可通过调控特定基因的开关在复杂的表观遗传过程中发挥关键作用[16]。
1.1.2lncRNA与人类疾病
截至目前,对动物lncRNA的研究绝大多数集中在人类疾病的相关领域。研究发现,lncRNA序列结构、表达、功能的异常与人类疾病的发生密切相关,包括多种重大疾病,如癌症、退行性神经疾病等。β-分泌酶(β-secreatase 1, BACE1)是阿尔茨默症发生过程中的一个关键酶,其反义BACE1-AS-lncRNA通过调节bace1表达水平启动阿尔茨默症的发生[17]。当与心血管疾病相关的ANRIL-lncRNA表达发生变化时,人类则容易发生冠心病、颅内动脉瘤、2型糖尿病、肿瘤等多种疾病[18]。
lncRNA广泛涉及很多肿瘤的发生,同一lncRNA又往往与多种肿瘤的发生有关,例如,在人类lncRNA 疾病数据库(http://202.38.126.151/hmdd/html/tools/lncrnadisease)中显示HOTAIR-lncRNA能够参与乳腺癌、结肠癌、肝细胞癌和胃肠间质瘤等肿瘤的发生。一些lncRNA的作用机制也较为清楚,如印迹基因H19-lncRNA具有双重功能,既有致癌作用,也有抑癌作用,该基因在很多癌症(如结肠癌、肝癌、膀胱癌、乳腺癌等)都呈现高表达。其中,结肠癌中H19-lncRNA被原癌基因c-myc激活后,能调控c-myc下游基因的表达,同时H19的第一个外显子转录出microRNA-675,又可降低肿瘤抑制基因rb1的表达,最终导致肿瘤的产生[19],但目前对lncRNA的这种双重作用的产生机制尚不清楚,可能与自身特性或环境因素有关。在对前列腺癌的研究中,发现ANRIL-lncRNA的表达水平与前列腺癌发生呈正相关[20],表明ANRIL-lncRNA可能是前列腺癌产生的一个诱导因子。与之相似,HOTAIR-lncRNA在乳腺癌组织中的表达水平是正常乳腺组织的2 000倍[21],说明该lncRNA的超高水平表达可能与乳腺癌细胞的迁移率和存活率有关。通常,MALAT1-lncRNA在人类正常组织中维持低表达水平,而在乳腺癌、前列腺癌、结肠癌、肝癌和子宫颈癌等肿瘤中均上调表达[22]。上述这些结果表明lncRNA在组织中的异常表达代表了人类疾病构架的一个新层面,将来可能会成为疾病的诊断和治疗的一个指标和手段。
1.2lncRNA参与植物的生物学过程和功能
与动物相比,植物lncRNA的研究目前仍然处于起步阶段。迄今为止,只在拟南芥、小麦、玉米、大豆和水稻等几种植物中发现了近10 000多个lncRNA,占总已发现lncRNA的1%,它们在指导生殖发育、生长发育、逆境胁迫响应、染色体修饰以及与小RNA关系中均起着重要作用。
1.2.1lncRNA参与植物的生殖发育
lncRNA可以影响植物的生殖发育,主要表现在影响植物开花、雌雄分化以及花粉发育等的过程。成花转变是植物生殖发育的关键阶段,受春化途径等多种因素的影响。在春化途径中,目前研究最清楚的是开花抑制因子(flowering locus C, FLC)- lncRNA,它是了解植物lncRNA功能的主要来源。FLC能够抑制植物开花基因的表达,春化过程诱导该基因产生两个lncRNA:COOLAIR和COLDAIR,其中,前者为flc的天然反义转录本,在春化初期表达迅速上升。后者则由flc基因的第一个内含子转录,在春化开始后的低温环境下表达水平持续升高。COOLAIR-lncRNA与其他蛋白(如CSTF77和CSTF64等)相互作用沉默flc正向转录本的转录,从而抑制flc的表达促进植物开花。COLDAIR-lncRNA的作用机制与动物中HOTAIR-lncRNA相似,能够招募甲基转移酶PRC2到flc,维持flc处于沉默状态,从而使光周期途径顺利进行并诱导快速开花[23]。上述结果说明COOLAIR和COLDAIR这两个lncRNA在植物春化过程的不同阶段对成花产生影响。同时暗示,依赖于一定条件或发育阶段的作用方式中,通过基因3′端反义转录调控相应的正义转录,可能是lncRNA一种普遍存在的作用机制。在水稻RNA-Seq数据中,前人发现2 063个lncRNA中的大多数在水稻生殖过程中均优先表达,部分lncRNA还能诱导水稻产生生殖缺陷[24]。黄瓜中CSM10-lncRNA只在雄株中具有表达优势,说明它可能在雄性分化中起作用[25]。高粱中ZM401-lncRNA主要在花药(特别是绒毡层细胞及小孢子)中表达,一旦把该基因敲除后,则能够显著影响花药发育相关基因的表达[26]。
1.2.2lncRNA参与植物的生长发育
研究表明,lncRNA与植物的发育过程密切相关,很多lncRNA在植物器官发育的特定阶段产生,具有强烈的组织和细胞特异性。GMENOD40-lncRNA被发现在豆科植物根瘤和水稻茎中特异表达,它分别参与豆科植物根瘤的形成以及水稻器官的分化和微管组织的形成[27]。CSM10-lncRNA则在黄瓜不同组织、不同发育阶段和不同光照周期都有差异表达,可能参与这些组织生长和发育过程的调控[25]。本课题组从胡杨异形叶RNA-Seq测序数据中,发现并鉴定了3 013个在胡杨披针形和宽卵圆形叶发生中差异表达的lncRNA,进一步功能分析发现这些lncRNA与调节叶片长度和宽度相关基因的表达密切相关,说明lncRNA在胡杨异形叶发生过程中起着重要的调控作用。这些结果暗示lncRNA在植物器官的生长发育过程中发挥着非常重要的调控作用。
1.2.3lncRNA与植物的胁迫响应
在植物对不良环境因素胁迫响应过程中,lncRNA发挥着重要作用,它参与生物胁迫(如病原体感染)和非生物胁迫响应。在生物胁迫响应方面,目前小麦中已经鉴定出125个参与白粉菌感染和热胁迫响应相关的lncRNA,它们与拟南芥中lncRNA作用相似,在小麦对生物和非生物胁迫中起重要作用[28]。对拟南芥进行干旱、寒冷、高盐或脱落酸等处理后, 1832个lncRNA被发现其表达量较对照组发生了显著改变,甚至比对照组上调22倍[29],说明lncRNA在植物非生物胁迫应答中起重要作用。在非生物胁迫响应方面,目前在拟南芥中发现主要有IPS1、AT4和NPC536等几个lncRNA参与非生物胁迫的应答反应。其中,当磷酸盐饥饿时能诱导IPS1-lncRNA和AT4-lncRNA的表达,它们作为诱导物可以结合ath-miR399干扰ath-miR399与其靶基因pho2的结合,从而抑制该microRNA对pho2的降解作用,并调节磷酸含量的动态平衡[30]。当受磷酸盐饥饿和盐胁迫的诱导时,根部和叶中NPC536-lncRNA的表达量都会升高,其中盐胁迫时NPC536-lncRNA的上调表达能够促进拟南芥主根系和次生根长度的生长[31]。说明这些lncRNA是植物非生物胁迫响应中重要的调节因子,使植物能够适应不良的生存环境。
2lncRNA调控基因表达的分子机制
lncRNA能够参与生物体各种生命活动过程中,其通过多种作用方式调控基因的表达,主要表现在调控网络覆盖转录水平、转录后水平、翻译水平以及表观遗传水平等方面(图1)[32]。
图1 LncRNA功能的作用机制
2.1lncRNA对转录水平的调控
2.1.1lncRNA调控邻近基因的转录
当基因组中lncRNA在与下游基因位置邻近时,依赖其与下游基因相对位置或序列特征,当lncRNA自身转录时,能够穿过下游靶基因启动子区,干扰转录因子与启动子的结合,从而以顺式作用方式调控靶基因的转录。例如,酵母中SRG1-lncRNA在转录延伸时横跨ser3的启动子序列,占据启动子与RNA聚合酶II的结合空间,从而抑制ser3的表达[33]。
2.1.2lncRNA与转录因子的相互作用
生物体内lncRNA和转录因子相互作用的方式有多种,它们能够通过激活转录因子、招募转录因子至靶基因启动子、促进转录因子寡聚成复合物或改变转录因子的亚细胞定位等方式调控靶基因的转录。例如,p21-lncRNA可以通过与p53共激活因子hnRNPK的结合,抑制其靶基因的表达[34]。活化的T细胞核因子(nuclear factor of activated T cell, NFAT)通常位于细胞质中,当钙依赖信号通过NFAT的非编码抑制因子(noncoding repressor of NFAT, NRON)-lncRNA内高度保守的茎环结构把NFAT从细胞质导入细胞核内后,NFAT能够激活靶基因的转录[31]。
2.1.3lncRNA作为增强子进行调控
在人类细胞系研究中,发现lncRNA还具有类似增强子的功能,其转录可以促进相应基因的表达,这些lncRNA被称为增强子RNA(enhancer RNA, eRNA)。如人类CCAT1-L-lncRNA位于myc基因上游515kb区域,当该lncRNA被转录时能够远程显著增强myc的转录[35]。
2.2lncRNA对转录后水平的调控
2.2.1lncRNA作为小RNA的前体
lncRNA可以通过加工剪切产生非编码小RNA(短链非编码RNA)。除snRNA外所有种类的小分子RNA都富含lncRNA的外显子,特别是snoRNA,证明lncRNA可能是功能小RNA的前体,例如H19-lncRNA是调控抑癌基因(retinoblastoma, RB)miR-675的前体[36]。
2.2.2lncRNA参与RNA的剪切加工
除作为非编码小RNA前体外,lncRNA还影响其他RNA的加工过程,如参与mRNA前体的剪切,对mRNA加工过程进行转录后调控。如MALAT1-lncRNA可以通过影响丝氨酸/精氨酸剪切因子(serine/arginine splicing factors, SR)的定位和磷酸化方式调控mRNA前体的可变剪切[37]。
2.2.3lncRNA吸附microRNA
lncRNA其中一个重要的功能是与microRNA结合,抑制后者发挥作用,从而保护相应靶mRNA免受microRNA介导的抑制或降解,这类lncRNA被称为内源性竞争RNA(endogenous competing RNA, ceRNA)。目前越来越多的lncRNA被发现能够作为ceRNA对基因表达发挥调控作用。如肝癌中高表达的lncRNA可与microRNA-372结合,抑制其靶基因cAMP依赖蛋白激酶β(protein kinase, cAMP-dependent, catalytic, beta, PRKACB)的表达,影响cAMP反应元件结合蛋白(cAMP-response element binding protein, CREB)的磷酸化[38]。IPS1-lncRNA与microRNA相互作用,可竞争性抑制microRNA对其靶基因的降解[39]。
2.2.4lncRNA影响mRNA的稳定性和降解
最近研究表明,lncRNA对mRNA的稳定性和降解起着辅助作用。细胞质中lncRNA识别并影响mRNA包括半衰期和翻译等的生命活动周期。例如,lncRNA可以和Staufen1蛋白(STAU1)相互作用促进mRNA的降解[40]。
2.3lncRNA对翻译水平的调控
人们在研究lncRNA对蛋白质翻译的影响时发现,lncRNA可以辅助mRNA翻译或辅助抑制翻译。如反义UCHL1-lncRNA的表达能提高UCHL1的蛋白含量,但不改变mRNA的表达水平。p21-lncRNA被发现能通过抑制RNA稳定蛋白Hu抗原R(Hu antigen R, HuR)的活性,从而抑制其靶基因jun b原癌基因(jun B proto-oncogene, JUNB)和钙黏着相关蛋白(cadherin-associated protein, CTNNB1)mRNA的翻译[40]。
2.4lncRNA对表观遗传水平的调控
lncRNA对表观遗传水平的调控最早是在女性X染色体随机失活现象中发现的[33]。现在研究表明,lncRNA在组蛋白修饰、DNA甲基化和染色体重塑等表观遗传修饰过程均起着重要作用,它们通过结合并募集特定表观修饰酶复合物至靶基因区域,改变靶基因染色质或DNA修饰状态从而影响靶基因的表达。
2.4.1lncRNA参与组蛋白修饰
组蛋白修饰修饰方式有多种,如组蛋白甲基化、乙酰化、磷酸化、糖基化和泛素化等,不同修饰方式对基因表达的影响不同。例如,父源染色体特异表达的AIR-lncRNA能够聚集在其上游溶质载体22家族成员3(solute carrier family 22 member 3, SLC22α3)基因的启动子区,招募H3组蛋白第9位赖氨酸(histone H3 lysine K9, H3K9)特异性甲基转移酶G9a,使H3K9甲基化,导致染色质浓缩形成异染色质,导致与RNA聚合酶II的结合能力降低,使父源染色体上的等位基因slc22α3、slc22α2和ig/2r沉默[41]。又如HOTAIR-lncRNA的5′端和3′端可以分别结合不同组蛋白修饰复合物PRC2和LSC1,前者促进组蛋白甲基化,后者则使组蛋白脱甲基化,它们分别决定着不同靶基因特异性组蛋白的修饰模式[42](图2)。
图2 HOTAIR-lncRNA调控组蛋白甲基化和去甲基化状态 HOTAIR表示HOTAIR-lncRNA。
2.4.2lncRNA与DNA甲基化
lncRNA在转录水平对表观遗传学的影响除了对染色质修饰外,还表现在通过使DNA甲基化抑制基因的表达。如核糖体DNA(rDNA)中一些拷贝具有转录活性,而另一些拷贝由于DNA的甲基化则处于沉默状态。由rRNA基因间隔区转录成的pRNA(promoter RNA)又结合到rDNA的启动子区,形成RNA/DNA/DNA三联体复合物,该复合物能够招募DNA甲基化酶3(DNA methyltransferase 3, DNMT3),作用于lncRNA使DNA发生甲基化,从而抑制基因的表达[4]。
2.4.3 lncRNA与染色体重塑
lncRNA在转录水平能够作为招募染色质修饰物的支架,与染色体修饰复合物相互作用引起染色体重塑,导致表观遗传学沉默,这也是导致X-染色体失活的主要原因。目前发现,在人类3 300个基因间lncRNA中,约20%能与染色质修饰复合物结合,调控染色质重塑、影响基因表达和参与体内其他多种生命活动过程。例如长度约17kb的XIST-lncRNA,其5′端含有高度保守的repa序列,当XIST-lncRNA表达上调时,repa序列能够招募大量的染色体重塑复合物PRC2沿X染色体扩展,最终覆盖整条染色体基因表达的关键位点,导致基因表达沉默[43]。
3lncRNA的研究策略和方法
与蛋白质和DNA相比,lncRNA的稳定性较差、易降解,且表达丰度也远低于mRNA。而与microRNA相比,lncRNA长度则更长,并存在二级结构,功能发挥方式更复杂。因此为了揭示lncRNA的分子作用机制,除了常规方法外,近年来逐渐发展和建立了lncRNA特有的实验技术和相关数据分析方法。
以目前lncRNA研究较多的动物和医学领域为例,其lncRNA的基本策略有3个步骤:(1)lncRNA鉴定和表达的高通量分析。其中,微阵列芯片和RNA-seq是使用较多的两种成熟技术,依赖现有的lncRNA数据库(如目前注释最全的NONCODE数据库),对lncRNA进行表达差异、共表达、新lncRNA预测以及lncRNA生物学功能预测等生物信息学分析;(2)高通量分析所得lncRNA表达结果的验证。利用Northern blot、实时荧光定量PCR(qRT-PCR)、RNA荧光原位杂交、RNA干扰和免疫共沉淀等常规技术对lncRNA表达进行验证;(3)目标lncRNA的生物学功能和作用机制研究,包括功能获得性研究和功能缺失性研究。相比之下,lncRNA在植物领域的研究策略和方法相对较为滞后,目前只在拟南芥、蒺藜苜蓿、水稻、玉米中进行了全基因组lncRNA的检索、鉴定和相关研究,其中利用表达谱芯片、RNA-seq和qRT-PCR等技术在拟南芥中鉴定出成6 000多个lncRNA,并对这些lncRNA在不同环境和发育阶段的表达谱进行分析,确定了特定lncRNA在特定环境和阶段的特定功能[44]。这一研究策略为在其他物种中鉴定lncRNA提供很好的借鉴。
4lncRNA目前研究中面临的问题
由于lncRNA在生物体内结构特征和作用机制的多样性和复杂性,目前对lncRNA功能和分子机制的研究仍然只是冰山一角,特别是植物lncRNA的研究还处于探索和起步阶段,面临着许多亟待解决的问题,主要表现以下几个方面:(1)lncRNA的定义仍存在争议。一般认为长度大于200nt的非编码RNA即为lncRNA,但有学者认为生物体内小于200nt的非编码RNA有很多,它们既不属于小RNA,也不属于结构RNA,对其归类仍不清楚[45];(2)对lncRNA生物学功能的阐明并非易事。由于lncRNA种类和功能的多样性,使得不同lncRNA的研究结果相互借鉴的可能性较小。另外功能性和非功能性lncRNA的区分也存在困难,而且对功能研究的思路尚不成熟;(3)lncRNA尚无统一的命名原则。对目前发现的lncRNA只是根据其功能、结构特征、作用方式等进行命名。现在lncRNA仍然没有一个国际规范的命名方法和原则;(4)lncRNA数据库不够完善。对lncRNA的研究相比其他非编码RNA研究相对较晚,目前lncRNA相关数据库内容和注释尚不健全,特别是植物lncRNA相关数据更是寥寥无几;(5)目前开发的lncRNA功能预测工具不多,特别是针对其二级结构和靶基因预测的工具极少;(6)针对lncRNA研究的新技术和独特技术较少,极大限制了目前lncRNA的研究;(7)对lncRNA的研究领域有待拓展。如前所述,目前对lncRNA的研究主要集中在动物的肿瘤和发育领域,植物的生长发育及抗逆性等领域,其中肿瘤领域更是占全部lncRNA研究的60%以上,而在其他领域的研究极少。因此,针对不同lncRNA的结构特征和作用机制,建立更多、更有效的技术体系是今后一段时间系统研究lncRNA的一个重要研究方向。
参考文献
[1]Okazaki Y, Furuno M, Kasukawa T, et al. Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs[J]. Nature, 2003, 420(6915): 563-573.
[2]Rinn J L, Chang H Y. Genome regulation by long noncoding RNA[J]. Annual Review of Biochemstry, 2012, 81: 145-166.
[3]Birney E, Stamatoyannopoulos J A, Dutta A, et al. Indentification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project [J]. Nature, 2007, 447(7146): 799-816.
[4]Batista P J, Chang H Y. Long noncoding RNA: cellular address codes in development and disease [J]. Cell, 2013, 152(6): 1298-1307.
[5]Krell J, Frampton A E, Mirnezami R, et al. Growth arrest-specific transcript 5 associated snoRNA levels are related to p53 expression and DNA damage in colorectal cancers[J]. PLoS One, 2014, 9(6): e98561.
[6]Ponting C P, Oliver P L, Reik W. Evolution and functions of long noncoding RNA [J]. Cell, 2009, 136(4): 629-641.
[7]徐丹. 肝再生过程中LncRNA调控肝细胞增殖的机制研究[D]. 上海: 第二军医大学基础部, 2013.
[8]Guttman M, Donaghey J, Carey B W, et al. lincRNA act in the circuitry controlling pluripotency and differentiation[J]. Nature, 2011, 477(7364): 295-300.
[9]Kretz M, Siprashvili Z, Chu C, et al. Control of somatic tissue differentiation by the long non-coding RNA TINCR[J]. Nature, 2013, 493(7431): 231-235.
[10]Ng S Y, Johnson R, Stanton L W. Human long non-coding RNA promote pluripotency and neuronal differentiation by association with chromation modifiers and transcription factor[J]. EMBO J, 2012, 31(3): 522-533.
[11]Cesana M, Cacchiarelli D, Legnini I, et al. A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA[J]. Cell, 2011, 147(2): 358-369.
[12]Pruunsild P, Kazantseva A, Aid T, et al. Dissecting the human BDNF locus: bidirectional transcription, complex splicing, and multiple promoters[J]. Genomics, 2007, 90(3): 397-406.
[13]Inagaki S, Numata K, Kondo T, et al. Identification and expression analysis of putative mRNA-like non-coding RNA in Drosophila[J]. Genes Cells, 2005, 10(12): 1163-1173.
[14]Deng X X, Meller V H. Non-coding RNA in fly dosage compensation[J]. Trends Biochem Sci, 2006, 31(9): 526-532.
[15]Klattenhoff C A, Scheuermann J C, Surface L E, et al. Braveheart, a long noncoding RNA required for cardiovascular lineage commitment[J]. Cell, 2013, 152(3): 570-583.
[16]Sasaki H, Matsui Y. Epigentic events in mammalian germ-cell development: reprogramming and beyond[J]. Nat Rev Genet, 2008, 9(2): 129-140.
[17]Faghihi M A, Modarresi F, Khalil A M, et al. Expression of noncoding RNA is elevated in Alzheimer’s disease and drives rapid feed-forward regulation of β-secretase[J]. Nat Med, 2008, 14(7): 723-730.
[18]Ahmed W, Ali I S, Riaz M, et al. Association of ANRIL polymorphism (rs1333049:C﹥G) with myocardial infarction and its pharmacogenomic role in hypercholesterolemia[J]. Gene, 2013, 515(2): 416-420.
[19]Gibb E A, Brown C J, Lam W L. The functional role of long non-coding RNA in human carcinomas[J]. Mol Cancer, 2011, 10(1): 38.
[20]Yap K L, Li S D, Munoz-Cabello A M, et al. Molecular interplay of the noncoding RNA ANRIL and methylated histone H3 lysine 27 by polycomb CBX7 in transcriptional silencing of INK4α[J]. Mol Cell, 2010, 38(5): 662-674.
[21]Gupta R A, Shah N, Wang K C, et al. Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J]. Nature, 2010, 464(7291): 1071-1076.
[22]Tano K, Mizuno R, Okada T, et al. MALAT-1 enhances cell motility of lung adenocarcimoma cells by influencing the expression of motility-related genes[J]. FEBS Lett, 2010, 584(22): 4575-4580.
[23]Kim D H, Sung S. Environmentally coordinated epigenetic silencing of FLC by protein and long noncoding RNA components[J]. Current Opinion in Plant Biology, 2012, 15(1): 51-56.
[24]Zhang Y C, Chen Y Q. Long noncoding RNA: new regulators in plant development[J]. Biochem Biophys Res Commun, 2013, 436(2): 111-114.
[25]Cho J, Koo D H, Nam Y W, et al. Isolation and characterization of cDNA clones expressed under male sex expression conditions in a monoecious cucumber plant (Cucumis sativus L. cv. Winter Long) [J]. Euphytica, 2005, 146(3): 271-281.
[26]Ma J, Yan B, Qu Y, et al. Zm401, a short-open reading-frame mRNA or noncoding RNA, is essential for tapetum and microspore development and can regulate the floret formation in maize[J]. J Cell Biochem, 2008, 105(1): 136-146.
[27]Heo J B, Lee Y S, Sung S. Epigenetic regulation by long noncoding RNA in plant[J]. Chromosome Research, 2013, 21(6-7): 685-693.
[28]Xin M, Wang Y, Yao Y, et al. Identification and characterization of wheat long non-protein coding RNA responsive to powdery mildew infection and heat stress by using microarray analysis and SBS sequencing[J]. BMC Plant Biol, 2011, 11: 61.
[29]Liu J, Jung C, Xu J, et al. Genome-wide analysis uncovers regulation of long intergenic noncoding RNA in Arabidopsis[J]. The Plant Cell Online, 2012, 24(11): 4333-4345.
[30]Li L, Eichten S T, Shimizu R, et al. Genome-wide discovery and characterization of maize long non-coding RNA[J]. Genome Biology, 2014, 15(2): R40.
[31]Willingham A T, Orth A P, Batalov S, et al. A strategy for probing the function of noncoding RNA finds a repressor of NFAT[J]. Science, 2005, 309(5740): 1570-1573.
[32]Ogawa Y, Sun B K, Lee, J T. Intersection of the RNA interference and X-inactivation pathways[J]. Science, 2008, 320: 1336-1341.
[33]Pruneski J A, Hainer S J, Petrov K O, et al. The Pafl complex represses SER3 transcription in Saccharomyces cerevisiae by facilitating intergenic transcription-dependent nuclesosome occupancy of the SER3 promoter[J]. Eukaryot Cell, 2011, 10(10): 1283-1294.
[34]Huarte M, Guttman M, Feldser D, et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response[J]. Cell, 2010, 142(3): 409-419.
[35]Xiang J F, Yin Q F, Chen T, et al. Human colorectal cancer-specific CCAT1-L lncRNA regulates long-range chromatin interactions at the MYC locus[J]. Cell Res, 2014, 24(5): 513-531.
[36]Tsang W P, Ng E K, Ng S S, et al. Oncofetal H19-derived miR-675 regulates tumor suppressor RB in human colorectal cancer[J]. Carcinogenesis, 2010, 31(3): 350-358.
[37]Tripathi V, Ellis J D, Shen Z, et al. The nuclear-retained noncoding RNA MALAT1 regulates alternative splicing by modulating SR splicing factor phosphorylation[J]. Mol Cell, 2010, 39(6): 925-938.
[38]Wang J, Liu X, Wu H, et al. CREB up-regulated long non-coding RNA, HULC expression through interaction with microRNA-372 in liver cancer[J]. Nucleic Acids Res, 2010, 38(16): 5366-5383.
[39]Fatica A, Bozzoni I. Long non-coding RNA: new player in cell differentiation and development[J]. Nature Reviews Genetics, 2014, 15(1): 7-21.
[40]Hadjiargyrou M, Delihas N. The intertwining of transposable elements and non-coding RNA[J]. Int J Mol Sci, 2013, 14(7): 13307-13328.
[41]Magistri M, Faghihi M A, St Laurent G 3rd, et al. Regulation of chromatin structure by long noncoding RNA: focus on natural antisense transcripts[J]. Trends Genet, 2012, 28(8): 389-396.
[42]Tsai M C, Manor O, Wan Y, et al. Long noncoding RNA as modular scaffold of histone modification complexes[J]. Science, 2010, 329(5992): 689-693.
[43]Johnsson P, Lipovich L, Grander D, et al. Evolutionary conservation of long non-coding RNA: sequence, structure, function[J]. Biochimica et Biophysica Acta(BBA) -General Subjects, 2014, 1840(3): 1063-1071.
[44]Wang H, Chung P J, Liu J, et al. Genome-wide indentification of long noncoding natural antisense transcripts and their responses to light in Arabidopsis[J]. Genome Res, 2014, 24(3): 444-453.
[45]Spizzo R, Almeida M I, Colombatti A, et al. Long non-coding RNA and cancer: a new frontier of translational research[J] Oncogene, 2012, 31(43): 4577-4587.
The Latest Research Progress of Long Non-coding RNA in Animals and Plants
Qin Shaowei1Lu Mengting1Zhou Yuanyuan1
LüJianbing1Wang Fukang1Wen Yongqiang1Zhao Lifeng1,2*(1 College of Life Sciences, Tarim University, Alar, Xinjiang 843300)(2 Key laboratory of protection and utilization of biological resources in Tarim Basin,Tarim University, Alar, Xinjiang 843300)
AbstractLong non-coding RNA (lncRNA) is an important non-coding transcript larger than 200nt in length and have extremely low protein-coding ability or without protein-coding ability. LncRNA can regulate gene expression at transcription and post-transcription, epigenetic level, and plays an important role in a wide ranges of biological processes such as genomic imprinting, chromatin remodeling, transcriptional activation, transcriptional interference and cell cycle. It become the current hot topics in the study of molecular biology and genetics. Based on the latest research progress on lncRNA in recent years, the biological processes involved in animals and plants were compared in this review. Advance are highlighted according to molecular mechanism, functions, research strategies of lncRNA and problems faced in the present study, which providing a guide for further study of functions and molecular mechanism of lncRNA in animals and plants.
Key wordslong non-coding RNA; function; molecular mechanism; animals; plants; research progress
中图分类号:Q7
文献标识码:A
DOI:10.3969/j.issn.1009-0568.2016.02.018
文章编号:①1009-0568(2016)02-0103-10
作者简介:秦少伟(1974-),男,实验师,研究方向为功能基因组学、LncRNA的生物学研究。E-mail:qinshaowei@126.com*为通讯作者E-mail:lifengz2011@126.com
基金项目:国家自然科学基金项目(31260275);塔里木大学校长基金博士项目(TDZKBS201501)。
收稿日期:①2015-10-13