张怡然 刘慧泉 唐 喆 金巧军
(西北农林科技大学植物保护学院,杨凌 712100)
RNA干扰(RNA interference,RNAi)是一种保守且普遍存在于真核生物的转录水平或转录后水平基因沉默现象。它参与调控细胞增殖、组织分化和异染色质形成等重要生物过程[1-2]。小RNA(siRNA (small interfering RNA) 和 miRNA(microRNA))是RNAi的核心组分,它们与Argonaute蛋白结合并组装成RNA诱导沉默复合物(RNA-induced silencing complex,RISC)或RNA诱导的转录起始基因沉默(RNA-induced initiation of transcriptional gene silencing,RITS)复合体,靶向与之互补的mRNA并介导其降解或介导染色质修饰和异染色质形成[3](图1)。在拟南芥和许多其他真核生物中,均存在siRNA介导的组蛋白3第9位赖氨酸(H3K9)的甲基化及DNA甲基化参与异染色质组装的情况[4-5]。
在一些物种中,由双链RNA(double-stranded RNA,dsRNA)引发的RNA干扰是免疫系统对抗RNA病毒入侵以及转座因子的保护机制[6-7]。一些植物病毒和昆虫病毒中存在负向调控RNAi的因子[8-9]。有趣的是,Kennedy等[10]在线虫中也发现了负调控RNAi的因子。他们在筛选对dsRNA敏感性增强的秀丽隐杆线虫(Caenorhabditis elegans)突变体时鉴定出了负调控RNAi的因子eri(enhanced RNAi)-1。eri-1编码一种保守的3” →5” 核酸外切酶,包含一个类ERI-1_3” hExo结构域和一个SAP结构域。前者行使外切酶功能,后者负责与双链RNA结合以稳定外切酶结构域和RNA之间的互作。
ERI-1是一个高度保守的蛋白质,它通过其核酸外切酶活性影响细胞内源性siRNA(源于生物体自身编码区或非编码区的dsRNA经Dicer切割加工生成的siRNA)、外源性siRNA(由外源dsRNA经Dicer切割加工而成的siRNA)和miRNA(由内源基因编码的短发夹结构RNA经Dicer加工生成的小RNA)的丰度、调控RNAi和异染色质的形成、参与5.8S rRNA的加工、降解组蛋白mRNA,从而影响不同的细胞过程[11-15]。ERI-1如何实现对多个重要细胞分子过程的调控?本文概述了ERI-1对上述细胞过程调控的分子基础和机制,探讨了其在真核生物中的进化、丢失及未来的研究方向。
Fig. 1 Overview of small RNA-silencing pathways图1 小RNA沉默途径
ERI-1包含N端的SAP结构域和C端的类DEDDh 3” →5” 核酸外切酶(exonuclease)结构域(图2a)。DEDD核酸酶家族包括RNaseD、寡核酸酶(oligoribonuclease)、RNaseT等,以4个保守的酸性氨基酸残基命名为DEDD家族,再根据保守的组氨酸或酪氨酸的存在分为DEDDh、DEDDy两个亚家族[16-17]。线虫ERI-1、人类细胞3” hExo和果蝇Snipper(Snp)[18-19]均属于DEDDh亚家族的3” →5” 核酸外切酶,催化DNA或RNA末端3” →5” 方向核苷酸的切除[20]。因此ERI-1的类DEDDh 3” →5” 核酸外切酶结构域为它的催化中心,而SAP结构域在DNA损伤修复[21]、双链RNA结合和凋亡染色质的降解中发挥功能[22-23]。
人类细胞的ERI-1同源蛋白3” hExo、组蛋白mRNA茎环结构(stem loop,SL)和茎环结构结合蛋白(stem loop binding protein,SLBP)三元复合体的晶体结构已确定[24]。3” hExo的SAP结构域由3个具有DNA结合蛋白典型拓扑结构的α螺旋组成(α1、α2、α3),在该晶体结构中主要通过α1与茎环结构相互作用。3” →5” 核酸外切酶结构域采用α/β球状折叠:由6股扭曲的β折叠和9个α螺旋组成。其中β2、β6与其余β折叠反向平行排列;螺旋α3、α4和α5覆盖在β折叠的凸面,而剩余的α螺旋定位于β折叠的另一侧(图2b)[16]。
秀丽隐杆线虫ERI-1主要分布在性腺和头尾部神 经 元 的 细 胞 质[10,25], 裂 殖 酵 母(Schizosaccharomyces pombe) ERI-1和 果 蝇(Drosophila melanogaster)ERI-1的同源蛋白Snp也位于细胞质[26],表明这3个物种的ERI-1可能主要在细胞质中起作用。而哺乳动物ERI-1定位于核仁和细胞质中。核仁是核糖体前体生物发生的场所,因此,哺乳动物ERI-1可能与核糖体生物发生相关[27-28]。拟南芥(Arabidopsis thaliana)ERI-1的同源蛋白ERIL1(enhanced RNA interference-1-like-1)定位于叶绿体,影响叶绿体rRNA的加工并参与叶绿体发育[29]。
Fig. 2 The structures of ERI-1图2 ERI-1的结构
进化分析显示ERI-1是一个保守蛋白质,它在裂 殖 酵 母[26]、线 虫[10]、人 类[18]、小 鼠(Mus musculus)[27]、黑腹果蝇[30]和拟南芥[29]中均保守,且在这些物种中均只存在一个拷贝。尽管它在低等真菌、担子菌和裂殖酵母纲中保守,但在丝状子囊真菌中丢失,芽殖酵母纲中只有少数酵母还保留ERI-1(图3)。秀丽隐杆线虫、小鼠和人类ERI-1通过可变剪接编码多个蛋白质。
Fig. 3 The phylogenetic tree of ERI-1图3 ERI-1的进化树
ERI-1最初是作为RNAi负调控因子发现的。它是秀丽隐杆线虫外源性RNAi(exogenous RNAi,由外源性siRNA诱发的RNAi)和内源性RNAi(endogenous RNAi,由内源性siRNA诱发的RNAi)[31]途径的调节因子,通过促进某些内源性siRNA的生物合成,同时降低外源性siRNA的丰度从而实现调控。秀丽隐杆线虫的内源性RNAi与外源性RNAi途径由于竞争共同的核心组分DCR-1而此消彼长。ERI-1和RRF-3(RNA依赖性RNA聚合酶)是内源性RNAi的特异组分,它们与外源性RNAi组分竞争性结合DCR-1,从而协调不同的RNAi途径(图4a)[11,15,32-33]。
ERI-1的缺失导致秀丽隐杆线虫大多数组织中的RNAi水平提高[25,34]。与野生型相比,外源性siRNA在△eri-1和△rrf-3中更为丰富,同时它们在许多内源性转录本的沉默和内源性siRNA的产生方面存在缺陷[15]。进一步研究发现,ERI-1通过降解外源性siRNA 3” 黏性末端(突出的未配对核苷酸),使其不能进入RISC,从而抑制RNAi(图4b)[10,35-36]。因此,ERI-1通过与外源性RNAi组分竞争DCR-1和利用其核酸外切酶活性降解外源性siRNA 3” 黏性末端的方式负调控外源性RNAi。
秀丽隐杆线虫eri-1通过可变剪接编码两条长度约1 400 nt和1 800 nt的转录本,分别为eri-1a和eri-1b,其中eri-1b的3” 端包含一个400 nt的非保守区域。二者分别编码包含类DEDDh 3” →5” 核酸外切酶结构域和SAP/SAF-box结构域的蛋白质:ERI-1a和ERI-1b。其中ERI-1b与DCR-1特异互作,但ERI-1a与DCR-1不互作[37]。因此,ERI-1b很可能通过3” 端非保守区域与DCR-1特异性互作。研究发现,ERI-1b除了通过降解外源性siRNA负调控RNAi以外,还与DCR-1、RRF-3互作形成ERIC复合 体(包 括DCR-1、ERI-1b、ERI-3、ERI-5、DRH-3、RRF3、RDE-4)参与内源性RNAi途径[31]。ERIC复合体蛋白间的相互作用激活DCR-1活性,催化产生长度为26 nt、5” 端第一个碱基为G的初级内源性siRNA——26G siRNA(图4c)[31-32,37]。26G siRNA的生成依赖ERI-1b,它调控秀丽隐杆线虫精子发生和合子发育过程中的RNAi及22G siRNA的生成[15]。
但是关于ERI-1b参与生成内源性siRNA的具体分子机制未知。根据人类3” hExo可以与组蛋白mRNA 3” 端的茎环结构结合和许多内源性siRNA前体不能形成可被DCR-1识别的稳定结构的特点[37-38],Duchaine等[37]推测ERI-1识别并结合这些内源性siRNA前体上的短茎环结构,并利用其外切酶活性切除3” 端未配对的核苷酸,生成一个发夹结构以利于RRF-3合成长的dsRNA作为DCR-1的底物,从而促进内源性siRNA的生成。至于线虫内源性siRNA是否也被ERI-1降解或如何免于被ERI-1降解尚不清楚。依赖ERI-1的内源性26G siRNA和22G siRNA的5” 第一个碱基为鸟嘌呤(G),序列富含腺苷和鸟苷[35-36]。这种序列特征可能会影响其与ERI-1的SAP结构域结合,因此我们推测依赖ERI-1的内源性siRNA大概率不能被ERI-1降解。综上所述,所观察到的eri-1突变体的RNAi增强表型可能反映的是不同RNAi途径对核心组分竞争的结果。
线虫ERI-1还存在于包含miRNA的Agronaute结合蛋白ALG 1/2复合体中[31],而且eri-1突变体中成熟的miR-238和其前体含量大大增加[15],表明线虫ERI-1负调控miRNA的丰度。尽管小鼠ERI-1-/-突变体的内源性siRNA不受ERI-1缺失的影响[12],但是其体内所有的miRNA含量增加了两倍[39],说明小鼠ERI-1负调控miRNA的生成。在表型上,ERI-1缺失小鼠的自然杀伤细胞(natural killer cell,NK细胞)的发育和成熟存在缺陷,且NK细胞和T细胞中miRNA整体丰度增加,而异位表达ERI-1可以恢复这种表型。因此,小鼠ERI-1可能是通过其核酸外切酶活性负向调控miRNA的丰度(降解miRNA),从而参与调节小鼠NK细胞和T细胞中miRNA的稳态,是正常NK细胞发育所必需的[12]。迄今为止,尚未在哺乳动物的体细胞中发现内源性siRNA,但是其卵母细胞具有内源性siRNA。过表达线虫ERI-1同源基因AtERIL1的拟南芥植株中21 nt的siRNA积累减少,表明AtERIL1可能通过其外切酶活性降解siRNA从而调控siRNA的水平[40]。因此植物和哺乳动物ERI-1通过核酸外切酶活性降解siRNA和miRNA从而负调控RNAi。现有研究表明,与通过DCR-1互作参与内源性siRNA产生和与外源性RNAi竞争核心组分的ERI-1b是线虫特异的。ERI-1参与内源性siRNA生成的功能可能为线虫特有,哺乳动物卵母细胞可能通过其他机制协调内源性和外源性RNAi途径。
过表达3” hExo可以抵消RNAi、抑制无义密码子特异性转录沉默 (nonsense-mediated transcriptional gene silencing,NMTGS)[41],因此作为ERI-1同源蛋白的3” hExo在人类中同样负向调控RNAi途径。所以,线虫、哺乳动物和植物ERI-1均通过参与RNAi来调控基因表达。
裂殖酵母ERI-1含有313个氨基酸,与秀丽隐杆线虫ERI-1具30%以上的相似性[26]。在裂殖酵母中,异染色质主要形成于着丝粒和端粒。其转录物被Dicer切割成siRNA,进入RITS复合体(包含Ago1、Chp1和Tas3),靶向与siRNA反向互补的mRNA,介导其降解[42-43]。随后RITS复合体招募组蛋白甲基转移酶Clr4促进H3K9甲基化,甲基化的H3K9与异染色质蛋白Swi6结合,促进异染色质的形成[44-45]。裂殖酵母ERI-1通过SAP结构域识别源于异染色质的双链siRNA,并通过核酸外切酶结构域特异性地将其降解,抑制细胞内siRNA的积累,从而抑制RNAi,降低H3K9甲基化水平,最终抑制异染色质的形成(图4d)。核酸外切酶结构域内活性位点突变后的表型与△eri-1一致,因此ERI-1是通过其核酸外切酶活性负向调控异染色质的形成[26,46]。
值得注意的是,在模式丝状真菌粗糙脉孢菌(Neurospora crassa)中报道的ERI-1(NCU06684)与细胞核内新生的RNA(来自一类不依赖Dicer的siRNA产生位置上的RNA)结合,并招募组蛋白甲基转移酶复合体进行染色质修饰,介导异染色质的形成[47-48]。由于ERI-1的直系同源基因在丝状子囊菌中已经丢失,粗糙脉孢菌的ERI-1很可能是不同的基因。结构域分析表明,粗糙脉孢菌的ERI-1具有1个类ERI-1_3” hExo结构域,1个类RRM_ARP结构域和2个zf-Ran结构域(图2a)。
ERI-1通过其核酸外切酶活性降解siRNA和/或miRNA负调控RNAi的功能在酵母、线虫、哺乳动物和植物中保守(表1),但是与Dicer互作参与内源性siRNA生成的功能为线虫特有。植物的RNA衰变与RNAi相关,在转录和RNA加工过程中产生的异常RNA(aberrant RNA),会被5” →3” 或3” →5” 核酸外切酶快速降解,阻止它们被Dicer识别并加工成siRNA进入转录后基因沉默(posttranscriptional gene silencing,PTGS)复合体[49]。ERI-1作为一个保守的3” →5” 核酸外切酶很有可能参与RNA衰变降解细胞内的异常RNA,降低内源性siRNA的丰度。线虫eri-1突变体中并非所有内源性siRNA含量下降间接支持了这个假设。
siRNA在疾病治疗方面具有良好的前景。外源引入靶向致癌基因mRNA的siRNA,抑制致癌基因的表达是癌症的新型疗法。但是未经修饰的siRNA在血清中不稳定,容易被多种RNA酶降解。ERI-1作为保守的siRNA降解酶,可以识别并降解siRNA的3” 突出端。因此,对siRNA 3” 端碱基进行化学修饰的方法可以保护siRNA免受降解而不损害其结合靶标mRNA的能力[50]。
Fig. 4 ERI-1 regulates RNAi图4 ERI-1调控RNAi
Table 1 Roles of ERI-1 on RNAi in different species表1 不同物种中ERI-1对RNAi的调控
除了调控RNAi,ERI-1也参与5.8S核糖体RNA的加工和成熟。ERI-1的核酸外切酶结构域催化5.8S rRNA前体3” 端的加工——切除几个未配对的核苷酸(图5a)。该功能从裂殖酵母到哺乳动物高度保守[26]。秀丽隐杆线虫ERI-1a和ERI-1b均位于细胞质,因此尽管大多数核糖体加工发生于核仁,线虫ERI-1介导的5.8S rRNA加工可能发生于细胞质[51-52]。有趣的是,线虫ERI-1a是个高度保守的蛋白质,它参与5.8S rRNA的加工和降解外源性siRNA,但不参与内源性RNAi途径。而ERI-1b是线虫特有的蛋白质,除了参与5.8S rRNA加工外还通过与DCR-1互作而参与调控内源性RNAi。
小鼠ERI-1也能与核糖体、rRNA前体和5.8S rRNA结合。而且小鼠ERI-1-/-突变体与线虫△eri-1一样,它的5.8S rRNA出现3” 端延伸的现象,并且ERI-1直接负责5.8S rRNA 3” 端加工的最后一步,因此ERI-1也是小鼠5.8S rRNA加工所必需的(图5a)。实验证明,ERI-1的核酸外切酶活性为催化5.8S rRNA 3” 端形成必需的,而SAP结构域提高了3” 端加工的效率。ERI-1在小鼠和人类细胞中定位于核仁以及ERI-1能与rRNA前体直接结合,均表明ERI-1介导的5.8S rRNA加工在空间上与rRNA前体加工、前核糖体的组装相关[27,53]。
哺乳动物ERI-1与Dis3L2(一种3” →5” 核酸外切酶)存在功能冗余。let-7 miRNA前体(“7SB”rRNA)被寡腺苷酸化后进一步加工生成6S rRNA,然后Dis3L2和/或ERI-1切除6S rRNA的最后一个核苷酸以产生成熟的5.8S rRNA[54-57]。许多3” →5” 核酸外切酶底物的基本特征是存在3” 端未配对的碱基,不受poly(A)的保护[58]。Dis3L2是核糖核酸酶(RNase)II/RNR超家族的成员,通过3个RNA结合结构域(1个S1结构域和2个cold-shock结构域)识别RNA 3” 端4~5 nt的区域[59],而ERI-1依靠SAP结构域特异性识别双链RNA,这可能是不同种类核酸外切酶发挥功能的特异性所在。
ERI-1在拟南芥中的同源蛋白ERIL1具有保守的3” →5” 核酸外切酶活性,但无SAP结构域,定位于叶绿体[29]。ERIL1通过影响叶绿体rRNA的加工与成熟从而参与叶绿体发育。在缺失ERIL1的株系中,成熟的4.5S和5S rRNA显著减少,因此,ERIL1参与叶绿体4.5S和5S rRNA的成熟[40,60]。DEDDh结构域内保守活性位点的突变严重影响了ERIL1在体外的核酸外切酶活性,推测ERIL1在体内可能是通过其外切酶活性发挥功能。综上所述,ERI-1在rRNA加工和成熟中的功能在线虫、哺乳动物和植物中保守。
组蛋白基因的表达与细胞周期的推进紧密关联[61]。组蛋白mRNA的丰度与DNA复制紧密相关,因而在细胞周期中受到严格的调控,其仅在S期细胞中大量存在,S期结束时迅速降解。组蛋白mRNA的3” -UTR有一个高度保守的茎环结构SL,紧接着是ACCCA序列。在S期,茎环结合蛋白SLBP与SL的5” 端核苷酸结合,稳定并促进组蛋白mRNA的翻译,是组蛋白mRNA代谢的主要调节因子[46,62-64]。在S期末期,SLBP被蛋白酶体降解导致组蛋白mRNA的快速降解[65]。人类细胞3” hExo是在筛选组蛋白mRNA茎环结构互作蛋白时筛选鉴定的[18]。它与SL 3” 端的ACCCA序列结合,切除两个未配对的核苷酸,从而参与组蛋白mRNA的加工[66]。3” hExo、SLBP与SL结合形成紧密的三元复合体。尽管SLBP与3” hExo之间没有物理相互作用,但其中一种蛋白质与SL结合导致的茎环结构空间变化有助于另一种蛋白质与SL的结合[24,67]。
在S期结束时,SLBP被蛋白酶体降解,由未知酶对茎环的3” 端进行寡核苷酸化。Lsm1-7复合体(环状Lsm1-2-3-6-5-7-4结构)识别组蛋白mRNA的寡核苷酸化尾巴[68],而3” hExo与Lsm1-7复合体互作,并通过与解旋酶UPF-1的互作降解组蛋白mRNA的茎环(图5)[69-70],导致组蛋白mRNA在S期结束时快速发生分步降解,推动细胞周期进入G2期。
同样,小鼠ERI-1对S末期寡核苷酸化组蛋白mRNA的快速降解非常重要。在S期结束之前,ERI-1切割成熟组蛋白mRNA 3” 端未配对的核苷酸,随后在接近双链茎环结构的位置停止[71],该功能类似于其在5.8S核糖体RNA成熟过程中的作用。
综上所述,哺乳动物ERI-1是一种能降解组蛋白mRNA的酶。作为这种核酸外切酶的前提条件之一是与核糖体结合[72],这可以解释为什么在哺乳动物成熟的核糖体中发现了ERI-1[27]。
Fig. 5 ERI-1 plays conservative roles in the 3” terminal modification of 5.8S rRNA (a) and the processing and degradation of histone mRNA (b)图5 ERI-1在5.8S rRNA的3” 端修饰和组蛋白mRNA的加工与降解中具有保守功能
出乎意料的是,尽管黑腹果蝇Snp与线虫ERI-1具有31%的序列同源性,但在组蛋白mRNA的加工中功能却相反[30]。Snp直接与组蛋白mRNA互作并影响其3” 端加工,保护组蛋白mRNA的3” 端。当Snp缺失时,组蛋白mRNA很容易被降解,因此,Snp正向调控组蛋白mRNA的丰度[30]。Snp也是一种DNA酶,相比之下3” hExo更具RNA特异性[19]。而Snp不是5.8S rRNA成熟所必需的,也不会对RNAi进行负向调控。因此Snp是ERI-1的非功能性同源蛋白。
概而言之,保守的3” →5” 核酸外切酶ERI-1通过其外切酶活性调控RNAi和异染色质的形成、5.8s rRNA的加工、组蛋白mRNA的降解。ERI-1通过与DCR-1互作正调控内源性siRNA的功能为线虫特有[11]。ERI-1参与多个重要的细胞过程,必然受到精确的调控,但何种机制调控其何时参与何条途径尚不清楚。
作为一个高度保守的蛋白质,ERI-1在多数芽殖酵母和丝状子囊真菌中丢失(图3)。ERI-1在芽殖酵母中的丢失可能与其RNAi的丢失相关[73]。芽殖酵母具有RNA酶Ngl2p,它对5.8S rRNA 3” 端加工的最后一步至关重要[74-75],芽殖酵母5.8S rRNA 3” 端加工的任务可以由该酶完成。但是为什么在具有RNAi的丝状子囊真菌中ERI-1也丢失了呢?根据ERI-1的类DEDDh 3” →5’核酸外切酶结构域进行多序列比对分析,在丝状子囊真菌中发现了NRP1基因。NRP1除了具有保守的类ERI-1_3” hExo结构域,还具有一个类RRM_ARP结构域和多个zf-RanBP结构域。研究表明类RRM_ARP和zf-RanBP结构域在RNAi和组蛋白甲基化过程中发挥功能,进而参与异染色质的形成与维持[47,76]。因此推测丝状真菌中NRP1的功能可能替代了ERI-1,从而导致ERI-1的丢失。
在一些物种中,由dsRNA引发的RNA干扰是免疫系统对抗RNA病毒入侵的保护机制[7],之前有报道称线虫能利用ERI-1抑制这种抗病毒免疫机制[77]。因此,生物体可能需要ERI-1平衡RNAi以增加对一些有益病毒的敏感性。小鼠ERI-1的缺失降低了NK细胞和T细胞对病毒的抗性[12],原因可能是ERI-1缺失导致免疫相关途径的基因表达沉默,免疫细胞需要ERI-1负调控RNAi以平衡相关基因的表达。
一些RNA病毒会利用寄主细胞的核酸外切酶为自己的增殖服务,如甲型流感病毒的核糖核蛋白PB2、PB1和NP通过与人类细胞的ERI-1互作实现病毒RNA的转录[78],沉默ERI-1大大降低了甲型流感病毒的增殖速度。因此破坏ERI-1与病毒的互作可以阻止/减缓甲型流感病毒的传播,未来研究可以侧重于鉴定ERI-1与病毒互作的特定氨基酸位点,为开发靶向ERI-1抗流感病毒新药物做准备。
今后的研究需要聚焦于ERI-1的进化丢失问题以及其自身的调控机制,从而揭示ERI-1介导的表观遗传调控机制,及靶向ERI-1抗病毒药物的开发。