马博涵,姚 丹,焦苏淇,鲁中爽,李泽远,张爱晶,何浩博,张家野
(吉林农业大学生命科学学院,吉林 长春 130118)
早在20世纪,人们就开始研究非编码RNA(non-coding RNAs,ncRNAs),但是直到基因组时代的到来,ncRNAs才逐渐受到重视。随着近年来转录组测序技术的发展,越来越多新的ncRNAs逐渐浮出水面,这些新ncRNAs的调控机制已经成为当前生命科学研究的热点之一。
ncRNAs是一类不编码蛋白且具有催化活性的RNA分子,广泛存在于各种生物体中。由于结构不同,ncRNAs可分为线性ncRNAs(linear ncRNAs)和环形 ncRNAs(circRNAs),其中linear ncRNAs包括小ncRNAs如(microRNAs miRNAs)和长链 ncRNAs(lncRNAs)。植 物miRNAs在近些年研究较多,其能够降解或者抑制靶标mRNA的翻译、抑制目的基因的表达,进而影响生物过程;lncRNAs在动物医学方面研究比较深入,而通过这两年在植物中的研究发现,lncRNAs具有顺式或者反式调节因子、调控基因的功能;circRNAs是一种新型的ncRNAs,它与miRNAs之间的海绵机制一直是人们研究的热点,XING等[1]系统分析了我国非编码RNA研究的主要现状。2000年以前,国内还未见非编码RNA相关的文章,但到了2015年,非编码RNA的文章高达600余篇,占世界此类研究文总数的1/2,表明我国非编码RNA研究的速度惊人。WANG等[2]研究表明,这些ncRNAs对植物生长发育尤其是在应激反应过程中起着重要的调控作用;YE等[3]对环形非编码RNA进行研究,发现其在植物生长发育过程中起着重要的调控作用。本研究简述了ncRNAs的分类及相关功能,总结了近年来植物中几种主要ncRNAs(miRNAs、lncRNAs、circRNAs)的研究进展,包括这些ncRNAs的特征、鉴定、功能以及相关数据库等,重点总结了在植物应激反应机制的研究现状,并展望了未来植物ncRNAs的研究方向,为进一步深入研究这些植物ncRNAs的作用机理提供理论依据。
miRNAs是由内源基因编码的一类非编码单链小RNA分子,其长度约为22个核苷酸,大多数miRNAs具有高度的保守性和组织特异性[4]。早在1993年,LEE等[5]首次在秀丽隐杆线虫中发现了第1个miRNA基因lin-4;在随后的2000年,REINHART等[6]在果蝇体内发现了第2个miRNA基因let-7。与动物相比,虽然植物miRNAs的研究相对较晚,但后期发展迅速。REINHART等[7]在模式植物拟南芥中发现miRNAs基因并鉴定出20种miRNAs;WANG等[8]从水稻中鉴定出20种miRNAs;随着对植物miRNAs研究的深入,截至2011年,已在植物中发现72种miRNAs。至今,已经在拟南芥(Arabidopsis thaliana L.)、 大 豆(Glycine max L.)、水稻(Orza sativa L.)、烟草(Nicotiana tabacum L.)、玉米(Zea mays L.)、小麦(Triticum aestivum L.)等多种植物中发现许多不同类型的miRNAs[9-13],为今后研究植物中的 miRNAs提供参考。
2012年,KHRAIWESH等[14]报道了miRNAs的生物合成途径(图1),在RNA聚合酶Ⅱ(RNA Pol Ⅱ)的作用下,首先由miRNAs转录产生初级转录物pri-miRNAs,接着Dicer-like1酶(DCL1)将植物初级转录物pri-miRNAs剪切加工形成双链 的 pre-miRNAs(precursor miRNAs),premiRNAs为成熟miRNA的前体;然后DCL1酶进行第2次切割形成由pre-miRNAs与成熟miRNAs的互补片段所组成的双链miRNAs,并借助于HST(转运蛋白Exportin-5在植物中的同源类似物)将miRNAs转运出细胞核,最终经酶切后在细胞质中形成成熟的miRNAs。成熟的miRNAs进入核糖核蛋白复合体(RNA-induced silencing complex,RISC)并在其中发挥作用。
图1 植物miRNAs的主要生物合成途径(改自文献[15])Fig.1 Major biogenesis pathways of plant miRNAs (Change from reference[15])
通过近10年的研究,一些植物miRNAs的功能已经被鉴定,这些小分子miRNAs在真核基因表达调控中有着广泛的作用,它们通过抑制靶基因的表达进而调控植物生长发育、株型变化以及器官分化等过程(表1)。
表1 植物miRNAs在信号通路中的作用Table 1 Role of plant miRNAs in signaling pathways
植物miRNAs通过抑制靶mRNA间接地调控目的基因的表达,从而影响植物的生长发育,因此,如何鉴定植物miRNAs的靶基因,成为生物学研究的难点。迄今为止,常用一些生物信息学工具对植物miRNA作用的靶基因进行预测,目前有许多miRNAs数据库,如miRBase[39]从已经鉴定的不同生物实验计算收集miRNAs;PmiRKB[40]植物miRNAs信息库是众所周知的植物特异性miRNAs的注释数据库;miRTarBase[41]是常见的miRNAs与靶标相互作用数据库;miRPlant[42]、miRanalyzer[43]、miRA[44]、miRDeep-P[45]可用于预测新的miRNAs,miRU[46]、psRNATarget[47]和 TAPIR[48]都可以用来预测植物miRNAs的靶标。但是,通过生物信息学预测靶基因以后,还需要采用如q-PCR、测序等生物学实验进一步验证植物miRNA靶基因的准确性,为后续实验做准备。
lncRNAs是一类长度大于200 nt的ncRNAs,具有启动子结构和polyA尾巴,存在组织特异性与时空特异性,在不同植物组织之间的lncRNAs表达量不同[49]。ncRNAs最初被认为是转录“噪音”,因为它们具有较低的表达水平和序列保守性,但随着近些年的研究发现,lncRNAs是细胞过程中的关键调节因子,可作为基因表达的顺式或反式调节因子在转录水平发挥作用,具有调控植物生长发育的功能。
近年来,植物lncRNAs的研究突飞猛进,目前在拟南芥[50]、小麦[51]、水稻[52]、猕猴桃[53]、玉米[54]、桃树[55]、黄瓜[56]等鉴定出了大量lncRNAs,而对lncRNAs功能的研究是目前生物学研究的热点和难点之一,探究植物lncRNAs的作用机制有助于更加深入地理解其特征及相关生物学功能。虽然lncRNAs不能编码蛋白,与已知编码蛋白的基因类似,一些植物lncRNAs可以充当ceRNAs,通过靶标靶向调控miRNAs,从而阻断miRNA与其靶标之间的相互作用,影响植物的生长发育,如BARDOU等[57]报道了拟南芥中低磷诱导的lncRNAs IPS1采取模拟靶基因的方法,解除了miR399对靶基因PHO2的抑制,因此调控磷反应过程进而达到稳定状态;WANG等[58]报道了几种lncRNAs被鉴定为响应番茄黄叶卷曲病毒(TYLCV)感染的番茄miRNA的靶标模拟物;最近一项研究报道,有13种lncRNAs被预测为96种miRNAs的前体,这些miRNAs参与了对甘蓝型油菜菌核病菌的感染过程[52];针对小麦的一项研究报道了3种lncRNAs作为miR-2004和miR-2066的前体,16种lncRNAs作为97种siRNAs响应白粉病感染的前体[59]。虽然已经有lncRNAs作用机制及功能的相关报道,但其在植物上的研究还不够深入,因此还有待于进一步研究植物中不同类型lncRNAs的特征,这对作用机制的研究具有很大帮助。
为了鉴定lncRNAs及其生物学特征,已经开发了几个数据库用于进一步的lncRNAs研究。例如,NONCODE是16种ncRNAs的完整收集和注释数据库,涵盖动物中各种类型的ncRNAs,并使用CNCI软件评估lncRNAs编码潜力[60],然而在植物中,NONCODE中仅包括拟南芥lncRNAs;lncRNAdb[61]提供了287个真核生物lncRNAs的综合注释,以及它们实验验证的生物学功能,lncRNAdb中同样只有很少的植物lncRNAs,包括7个拟南芥lncRNAs和2个水稻lncRNAs;QUEK等[62]开发了PlncDB,它提供了与lncRNAs相关的全面信息,但也仅适用于拟南芥;PNRD[63]是最大的植物lncRNAs数据库,PNRD包括主要有4种植物物种的lncRNAs序列,包括拟南芥、水稻、杨树和玉米,因此,如果鉴定植物中的lncRNAs,PNRD是首选数据库。相比较鉴定动物lncRNAs而言,鉴定植物lncRNAs较少且受物种的局限,还有待于进一步研究并建立植物lncRNAs相关数据库。
circRNAs是一类内源性非编码环状RNA,具有3’和5’末端共价结合形成的闭合环状结构,具有组织特异性。与传统的线性RNA相比,circRNAs没有5’末端帽子结构和3’末端poly(A)尾巴,不易被核酸外切酶RNaseR降解,因此circRNAs结构稳定;一些circRNAs含有miRNAs应答元件,能够miRNAs靶向结合,在细胞中与miRNAs存在海绵机制作用,消除miRNAs对靶基因的抑制,进而调控靶基因的表达。
目前发现的circRNAs主要来源于基因外显子(exon),这些circRNAs广泛存在于多种真核生物中,circRNAs的生物合成有几个途径(图2)。首先外显子环化的效率依赖于外显子附近出现的剪切位点,正常情况下反向剪切效率一般都低于相同位置的线性转录本,这是由于剪切子在反向剪切位点位置上的组装不利于5'端和3'端的连接;大多数的circRNAs包含几个外显子,其外显子序列用于反向剪切,然后同一个基因通过可变剪切能够产生多个circRNAs,在此过程中,环化的外显子侧翼内含子中可能会频繁出现顺式调控元件,如形成RNA双链结构将明显增强反向剪切,另外内含子序列中短的顺式作用元件能够识别RNA结合蛋白(PBRs)进而促进外显子环化;circRNAs结合蛋白介导的调控合成途径除了顺式作用元件过表达RBPs,也可以在侧翼内含子序列中添加RNA蛋白结合位点,同样能促进circRNAs的表达。
SANGER等[64]于20世纪70年代在植物病毒体中发现了第1个circRNAs。2014年在拟南芥根部首次发现circRNAs,随后2016年YE等[65]补充报道了水稻中有12 307个circRNAs,模式植物拟南芥中有6 012个circRNAs(表2)。2015年,LU等[66]通过高通量测序和RNA-seq数据的生物信息学计算后,在水稻中鉴定了2 354个circRNAs,其中1 356是外显子来源的circRNAs,一些差异表达的circRNAs表现出组织特异性。LIU等[67]对不同生长阶段的拟南芥叶片进行转录组测序,通过对拟南芥叶片生长与衰老过程的表达谱进行分析,鉴定了168个circRNAs,其中包括40种新型circRNAs,在拟南芥叶片中有158个是基因外显子来源的circRNAs。通过GO分析和KEGG分析,一些circRNAs被注释,从中发现circRNAs具有调控拟南芥叶片衰老的功能。
图2 circRNAs的生物合成Fig.2 Biosynthesis pathways of plant circRNAs
表2 植物circRNAs鉴定Table 2 Identification of plant circular RNAs
ZHANG等[68]在玉米和拟南芥中分别鉴定了2 174和1 354个circRNAs,并且大多数差异表达的circRNAs参与干旱反应途径。截止至目前,在玉米、大豆、水稻、小麦、大麦、拟南芥、猕猴桃(Pseudomonas syringaeL.)、番茄(Solanum lycopersicumL.)等植物中鉴定到了circRNAs (表2)。由于存在植物本身的特异性和取样组织部位的特异性,不同样品之间的测序深度不同,导致当前报道的circRNAs数量有明显差异。
近年来,ZHAO等[69]通过转录组测序和生物信息学分析在鉴定了大豆中circRNAs,对3 904个circRNAs进行了GO分析和KEGG分析,在分子功能方面,GO分析的注释包括核苷酸结合、ATP结合、蛋白质结合和mRNA加工等功能。在生物过程方面,circRNAs主要参与一些代谢过程;KEGG途径分析显示,circRNAs在柠檬酸循环途径、氨酰基-tRNA生物合成、糖酵解/糖异生、甘油磷脂代谢、丙酮酸代谢和氧化磷酸化等相关途径中显著富集。ZHAO等[74]运用转录组测序技术对大豆抗虫基因进行分析,从中鉴定出5 367个circRNAs,并预测在大豆中有5 356个circRNAs能与miRNAs靶标结合,这些miRNAs来自69个家族,包括miRNA1520、miRNA172、miRNA159、miRNA156和 miR395家 族 等,其中miRNA1514家族与circRNAs结合位点的数目最多。
目前在植物中鉴定到的circRNAs数量较少,鉴定到的miRNAs不够全面,如在miRNAs一些新的数据库中,鉴定到的玉米miRNAs有325个,但在动物中(包括人类)已达到2 000多个,这让circRNAs和miRNAs之间的靶向关系变得模糊,因此有待于进一步研究验证。
植 物 ncRNAs除 了 miRNAs、lncRNAs、circRNAs外,还有几种较重要的RNA。例如,snRNAs核内小分子RNA(small nuclear RNA),它参与mRNA前体的加工,是真核生物转录后加工过程中RNA剪接体的主要成分;snoRNAs核仁小分子RNA(small nucleolar RNAs),它在核糖体RNA 的生物合成中发挥重要作用,还能指导snRNA、tRNA 和mRNA 的转录后修饰;siRNAs是siRISC的主要成员,激发与之互补的靶标mRNA的沉默;piRNAs(Piwi-interacting RNA)目前研究较少,它是一类长度为24~32 nt的单链小RNA,具有专一性,piRNAs主要与PIWI亚家族成员Piwi蛋白或AGO3蛋白质结合而发挥作用。随着ncRNAs研究的深入,会出现越来越多新的ncRNAs。
植物ncRNAs的作用机理是当今分子生物学研究的前沿与热点之一,鉴定ncRNAs的种类及功能,阐明ncRNAs的生物合成途径是该领域的基本科学问题。近年来开发的单细胞测序和单分子测序可能会为鉴定植物中新的ncRNAs提供机会,因此,有必要开发新的生物信息学方法来鉴定更多的 ncRNAs[62]。虽然 miRNAs、circRNAs和lncRNAs在植物应激反应中取得了显著进展,但它们之间的互相作用还有待进一步研究。研究miRNAs、circRNAs、lncRNAs之间的表达模式并构建网络将会很有趣,这使我们对应激反应中基因调控网络有更深的了解。即使编码蛋白质的基因在植物中相对变化较少,随着ncRNAs的增加,植物的结构域是动态的,每年都在不断地发现新成员。
除在水稻和大豆等作物中有一些研究外,当前对植物ncRNAs的生物学功能和作用机制的研究还主要集中在拟南芥等模式植物方面。植物中circRNAs和lncRNAs的研究还处于起步阶段,尤其是与植物circRNAs相关的问题有待深入研究,包括植物circRNAs的作用机制和生物学功能;还有受生物和非生物等环境因素所调控的比较重要的分子机制等,包括现在基因编辑CRISPR/Cas9技术的通用性可能对ncRNAs功能表征有一定作用,预计这些新的技术将在ncRNAs研究中得到广泛应用。期望不久的将来会发现更多新的ncRNAs、成熟的研究技术以及利用ncRNAs的作用机制促进分子的植物育种。