朱琳 鲜凤君 张倩楠 胡骏
(武汉大学生命科学学院杂交水稻国家重点实验室,武汉 430072)
RNA编辑(RNA editing)是指在RNA水平上发生的碱基增加、删除和替换,使核苷酸序列与基因组DNA序列不同从而引起遗传信息的改变,是一种遗传物质的间接性、高特异性的修复机制,这一转录后调控过程广泛存在于生物有机体中[1]。1986年,RNA编辑一词首次被提出,用来描述锥虫(Try panosoma)线粒体中尿苷酸的添加和删除[2]。植物界首次确定的RNA编辑为1989年在月见草(Oenothera biennis L.)线粒体转录本中发现的C-to-U替换[3],1991年也在玉米(Zea mays L.)叶绿体中被确认[4],与细胞器基因的表达调控以及转录组和蛋白质组的复杂性密切相关。1993年,由载脂蛋白B mRNA编辑酶1(apolipoprotein B mRNA-editing enayme catalytic polypeptide-like1,APOBEC1) 介 导的胃肠组织中ApoB mRNA第6 666位胞苷脱氨为尿苷而产生不成熟的终止密码子的过程是哺乳动物中发现的首个C-to-U类型编辑[5],另外由腺苷酸脱氨酶(adenosine deaminase acting on RNA,ADAR)催化A-to-I的编辑[6]也在动物体内广泛存在,在组织器官发育与功能发挥中具有重要的调控作用。因此,研究RNA编辑的作用机制,有助于我们进一步了解RNA编辑的本质及其发生的生物学意义。
RNA编辑的作用机制主要有两种形式,分别为由引导RNA(guide RNA,gRNA)介导的核苷插入或删除编辑,和由脱氨酶介导的碱基特异替换编辑。在碱基插入或删除的编辑形式中,插入位点的精确定位和核苷数目的准确数目通常需要依赖gRNA的介导,gRNA分子是一种小型非编码RNA,可以与mRNA下游编辑位点结合形成10-15 bp大小的锚定双螺旋,依赖位点特异性内切酶识别并切开双螺旋序列,随后由尿嘧啶转移酶或3′尿嘧啶特异性外切酶介导完成尿嘧啶的插入或删除,最终依赖RNA连接酶将mRNA连接起来,这一系列酶促反应完成编辑过程。这种编辑形式首先在锥虫线粒体中发现[2],其细胞色素C氧化酶亚基Ⅱ(CoxⅡ)转录本与基因序列不匹配,存在4个非DNA编码的尿嘧啶,后来在变形菌(Proteusbacillus vulgaris)和副粘病毒(Paramyxoviridae)基因中也分别发现了C插入和G插入的现象[7]。
在高等植物中,RNA编辑主要为细胞器内由脱氨酶介导的碱基替换类型,存在胞嘧啶到尿嘧啶(C-to-U)、尿嘧啶到胞嘧啶(U-to-C)以及腺嘌呤到次黄嘌呤(A-to-I)3种形式的转换,而且编辑事件发生的频率相当高,其中大部分以C-to-U的编辑形式发生,脱氨酶将胞嘧啶核苷C6位氨基水解脱氨形成尿嘧啶核苷。RNA编辑事件在mRNA的编码区域较为普遍[8],通常会使密码子的第一或第二位置发生改变,如通过将ACG改变为AUG生成起始密码子,将CGA改变为UGA或将CAA改变为UAA引入翻译终止信号,这种方式为存在缺陷的细胞器转录本提供了一个可能的校对修复机制,使其产生功能完全的蛋白质[9]。有时,C-to-U编辑形式也会发生在非翻译区域和结构RNA中影响剪接和翻译效率,例如植物II型内含子V域的RNA编辑变化就是剪接过程发生的必要性因素[10]。U-to-C编辑形式也可以改变终止密码子,如将终止信号UAA转换为甘氨酸的CAA三联体编码等,这种编辑形式在除蕨类、苔藓和石松科以外的其余陆生植物中很少见,但Ruchika等[11]在拟南芥幼苗中观察到了罕见的U-to-C编辑形式发生在成熟mRNA的3′UTR区,影响核基因mRNA的稳定性。A-to-I的编辑通常发生在细胞质中的tRNA上[12]。
植物细胞器中的RNA编辑是相对复杂的过程,越来越多的研究发现植物细胞器中的RNA编辑并不仅仅是由核编码的RNA编辑因子介导,而是通过与其他不同类型的蛋白质共同组装成编辑复合体来行使编辑功能的。研究表明,拟南芥线粒体中的编辑位点多达619个[13],水稻线粒体中有491个[14],还有一些未知位点尚未报道。但是参与RNA编辑的复合体数量远远少于细胞器内编辑位点的数量,由此可见RNA编辑复合体在行使编辑功能时具有复杂、灵活、多变等特点。到目前为止发现的编辑因子有三角状五肽重复序列(pentatricopeptide repeat,PPR)蛋白、多细胞器RNA编辑因子(multiple organellar RNA editing factors,MORF)蛋白家族,也被称为RNA编辑因子互作蛋白(RNA editing factor interacting proteins,RIP)、细胞器RNA识别基序(organelle RNA recognition motif,ORRM)蛋白、细胞器锌指(organelle zinc-finger,OZ)蛋白和原卟啉原IX氧化酶1(protoporphyrinogen IX oxidase 1,PPO1)等,此外,可能还存在其他的未知因子参与RNA编辑。Planchard等[14]对RNA编辑的程度是否影响后续的翻译过程进行了研究,结果表明,经过部分编辑的RNA可以进行翻译,且植物线粒体产生的蛋白质中有不可忽视的比例可能来自部分编辑的转录本。通过在拟南芥线粒体的全基因组规模上对总mRNA及核糖体相关mRNA中所有位点的编辑水平进行检测,发现许多编辑位点都是部分编辑的,这表明线粒体mRNA的完全编辑并不是其翻译的先决条件[12]。同时,核糖体也会对RNA编辑产生一定程度的影响,Rugen等[15]的研究表明,当RNA与核糖体结合时,编辑位点会更容易接近编辑复合体或者优先翻译编辑程度更高的RNA,而且编辑因子与核糖体也存在着某种关联。
在动物体内也存在RNA编辑现象,主要存在两种形式,一种是载脂蛋白B mRNA编辑酶(APOBEC)催化的C-to-U的编辑,另一种是腺苷酸脱氨酶(ADAR)催化A-to-I的编辑[5-6]。此外,CRISPR/Cas是微生物体内抵御外源核酸物质入侵的一种防御机制[16],具有强大、精准、廉价、易于操作等特点,是基因工程领域广泛应用的关键编辑技术,尤其是靶向DNA的CRISPR/Cas9技术,然而靶向RNA 的技术虽然进步迅速但仍处于研究应用的开始阶段,目前已经证实VI型CRISPR/Cas系统和相关的Cas13效应器以及III-E型CRISPR/Cas系统和相关的Cas7-11效应器是具有潜力的RNA靶向候选工具[17-18]。与靶向DNA技术所具有的可遗传性和不可恢复性相比,干预RNA所引起的改变是暂时性的,并不会造成永久性的遗传,通过调控还能更好地满足不同的需要,因此可以作为更安全、更通用的技术方法[19]。
细胞器中RNA结合蛋白对其基因的表达调控起着举足轻重的作用[20]。大量研究表明,三角状五肽重复序列(PPR)蛋白家族是参与细胞器转录后调控的主要因子之一,可以作为位点特异性的RNA结合蛋白参与植物细胞器中RNA切割、剪接、稳定、降解、编辑和翻译等RNA加工过程[21]。
2.1.1 PPR蛋白的结构特征 PPR基序通常由35个氨基酸组成的简并序列串联重复[22],每个基序会形成两个反向平行的α螺旋A和B,它们相互作用会产生螺旋-折叠-螺旋基序,螺旋A的第3、6、7、10位和螺旋B的第19、22、23、26位的氨基酸在此过程中发挥重要作用[23],且其突变可能会导致PPR蛋白螺旋重复结构的丢失。典型的PPR蛋白一般是由2-27个数量不等的PPR基序组成[24],一系列PPR基序在整个蛋白质中形成的螺旋-折叠-螺旋基序会产生一个具有中央凹槽的超螺旋,为蛋白质提供RNA的结合位点[25]。当结合位点发生突变时,结合RNA的能力会显著受到影响,比如螺旋A中第2位和第14位的残基的取代会导致体外RNA结合能力的改变。
PPR蛋白具有3种长度不同的PPR基序:P、L和S基序。P基序即代表含有35个氨基酸的标准PPR基序,而L和S基序与PPR基序相关,分别含有35或36个氨基酸和31个氨基酸,依据这些氨基酸基序的区别,PPR蛋白可以细致区分为只包含P基序的P亚类和包含P、L、S三种基序的PLS亚类。除PPR基序外,其N端通常还包含不保守的细胞器定位序列肽段,其C端序列相对保守,可以分为E、E+及DYW三种结构域。P亚类蛋白通常缺乏C端额外的结构域,能与靶标RNA发生特异性结合进而保护其免受核酸内切酶的消化[26],还可以特异性抑制或激活某些RNA的翻译来调控其表达,在细胞器RNA稳定、切割、剪接以及翻译等细胞器基因表达的大多数方面具有功能[27]。而PLS亚类具有特定的氨基酸保守模式,主要作为编辑因子参与RNA编辑[25],但是并非所有的PPR-RNA编辑因子都是PLS亚类,P亚类PPR蛋白PPME被证实可以参与RNA编辑[28]。根据不同的C端结构域,PLS亚类可以进一步细分为3类:E类成员还包含C端延伸的E结构域,该结构域并不是催化结构,预测是招募编辑酶的蛋白质相互作用基元[29-30];E+亚类额外包含E和E+结构域;另一个PLS亚类不仅包含PPR基序和E、E+结构域,还包含DYW结构域,因其位于C端高度保守的天冬氨酸(D)、酪氨酸(Y)和色氨酸(W)三肽得名[31],后来也发现极少数的PPR蛋白末端的3个保守氨基酸为天冬氨酸(D)、苯丙氨酸(F)和色氨酸(W)。
DYW结构域中包含与介导C-to-U转化的胞苷脱氨酶活性位点相匹配的保守催化残基HxE(x)nPCxxC[32],同时其保守的脱氨酶残基还具有与胞苷脱氨酶类似的锌结合能力[33],在锌结合基序的位置具有组氨酸和半胱氨酸特征,保守的组氨酸和半胱氨酸在胞苷脱氨酶活性位点与锌原子结合,而保守的谷氨酸则是催化脱氨反应所必需的,DYW域也因此被认为是编辑结构域。Hayes等[34]的研究已经证实了DYW结构域具有脱氨酶活性,并且结构域中的PG-box部分可能对功能性DYW蛋白或酶的募集起着至关重要的作用。而且,DYW结构域的脱氨功能在体外也已经得到证实[35],来自小立碗藓(Physcomitrella patens)的PPR65和PPR56蛋白可以在体外被纯化,并对同源的外源靶标RNA进行C-to-U的编辑,在大肠杆菌(Escherichia coli)中表达分别实现了ccmFC和nad3/nad4转录本中共表达蛋白的编辑[36],其编辑活性还受锌离子的含量影响。Hayes也证实了PPR65重组蛋白在体外具有足够的C-to-U活性[37]。而缺少完整的DYW结构域的E类编辑因子和E+类编辑因子可能需要由含有DYW结构域的反式因子补充后才能行使编辑功能。比如,DYW1可以为CRR4提供缺失的C端序列;DYW2截断的C端结构域与E+类PPR蛋白缺失的C端结构域相匹配,可以填补E+亚类PPR蛋白缺失的DYW结构域。
2.1.2 PPR蛋白的识别特征 研究发现,参与RNA编辑的PPR蛋白是通过一个基序对应一个核苷酸的组合形式,序列特异性地与RNA相互作用,其PPR基序特异识别编辑位点上游的核苷酸序列并与之结合,随后进行脱氨反应完成C-to-U的编辑[38]。当编辑位点的顺式元件没有明显的保守性时,一些PPR蛋白也可以参与多个位点的编辑事件。Barkan等[39]研究发现两个相邻PPR 基序上的3个位置的氨基酸对RNA的识别起着至关重要的作用,核苷酸特异性主要依赖于每个基序中第3、第6位和下一个基序的第1位(定义为1’)的氨基酸特征,(6,1’)位点上的(Thr,Asp)和(Thr,Asn)分别与G和A结合 ;(6,1’)位点的(Asn,Asp/Asn/Ser)组合与嘧啶的识别相关,(Asn,Asp)对U的显著偏好高于C,第3位氨基酸起到辅助蛋白质-RNA结合的作用;Yagi等[40]的研究也验证了Barkan的结论,表明PPR蛋白识别可编辑C残基的上游序列,且PPR-RNA序列与可编辑C之间的距离被证明是保守的,其第1、4和“ii”位置的3个氨基酸组成PPR基序的NSRs(nucleotide-specifyingresidues),第4位氨基酸(同第6位)是识别嘌呤或嘧啶基团的关键残基,其次,识别氨基或酮基的第“ii”位残基(同第1’位)决定了对靶标RNA序列的序列特异性识别,第1位则提供了附加的限制结合核苷酸。此外,Yin等[41]观察蛋白晶体结构发现,P亚类PPR10蛋白中串联排列的19个PPR重复单元连在一起,组成两圈右手超螺旋,RNA结合残基位于其内侧表面,第2、5、35位的氨基酸特异性识别RNA碱基。第2位的疏水氨基酸残基与RNA碱基相互作用;第5位起到最关键的RNA碱基识别作用,天冬氨酸与识别靶标RNA的嘧啶碱基相关,丝氨酸或苏氨酸与嘌呤碱基识别相关;第35位稳定第5位的构象,为PPR蛋白特异识别单链RNA的分子机制提供了进一步的理论依据。
2.1.3 PPR蛋白与植物生长发育的关系 RNA编辑在植物的生长发育过程中发挥着不可或缺的作用,调控细胞器形成、植物开花、胚及胚乳的发育、植物信号转导、对特定环境条件的响应和雄性不育等一系列生物过程。如果RNA编辑事件不能正常进行,会引发一系列的植物生长缺陷,比如线粒体和叶绿体的形成受损、幼苗生长缓慢、胚及胚乳发育缓慢、开花延迟、对逆境敏感等现象。表1总结了已发表的PPR蛋白参与RNA编辑事件从而调控植物生长发育过程的相关报道,可见RNA编辑对植物正常生长发育是必要的。
表1 参与RNA编辑的PPR蛋白及其对模式植物生长发育的调控Table 1 PPR protein involved in RNA editing and its regulation on model plant growth and development
续表 Continued
植物线粒体RNA编辑是由多个编辑因子直接或间接参与的复杂生物学过程,PPR蛋白特异性地识别靶标位点附近的顺式作用元件并与其结合,并且为其他编辑体成员的附着提供了一个场所。除PPR蛋白家族外,RIP/MORF 蛋白[76]、ORRM 蛋白[77]、OZ 蛋白[78]、NUWA 蛋白[79]、CP31 蛋白[80]、PPO1蛋白[81]以及OCP3蛋白[82]等都已经被鉴定为植物RNA编辑体的组成部分。
第一类被发现的非PPR蛋白的RNA编辑因子是RIP/MORF家族蛋白,在水稻中有5个含有保守RIP/MORF基序的蛋白质,拟南芥中已发现10个,其中MORF2和MORF9定位于叶绿体中,MORF8双定位于两个细胞器[60],其余蛋白定位于线粒体。在拟南芥rip1突变体中,400多个线粒体编辑位点活性显著降低,从而造成线粒体功能性障碍[83];MORF1和MORF3的突变会对线粒体中的50多个编辑位点造成影响[84];MORF8控制70%以上位点的编辑[85]。有研究表明,RIP/MORF蛋白之间也可以形成异源二聚体,在某些位点的功能也可以被同源二聚体取代。
此外,拟南芥中已有6种ORRM蛋白被报道为RNA编辑因子[86]。ORRM1和ORRM6定位在叶绿体中,其余4个蛋白为线粒体编辑因子[87],并且由于其位点的特异性影响了大量编辑事件。ORRM2和ORRM3的瞬时沉默会分别导致35个和32个线粒体位点的编辑效率降低[88]。ORRMs也可与RIP/MORF因子相互作用,形成同源或异源二聚体[86]。
与RIP1的发现类似,OZ1也在orrm1共纯化蛋白复合物中发现[78],在拟南芥中OZ家族包括4个成员,其中OZ3定位于线粒体,另外3个定位于叶
绿体。在拟南芥中,OZ1的缺失导致30个质体位点的编辑缺陷。该家族蛋白中唯一有注释的结构域是RanBP2型锌指结构,但是否通过这种结构与锌离子结合进而在RNA编辑复合体中起作用还需要进一步研究。
Andrés-Colás等[89-90]的研究表明,P 类 PPR 蛋白NUWA的突变体中许多RNA编辑位点可以被E+亚类PPR编辑因子所靶向,增强了E+亚类PPR 蛋白SLO2与线粒体DYW2的相互作用,且NUWA蛋白在体内还与MORF蛋白相关联,与 MORF1或MORF2蛋白共沉淀,有关NUWA的研究表明其他P类PPR蛋白可能也参与形成植物细胞器中的RNA编辑复合物。另外3种蛋白质CP31、PPO1和OCP3被发现影响质体中的RNA编辑效率。CP31缺失会导致多个质体位点的编辑水平降低[80],且突变体中转录本的丰度大大降低,这表明CP31可能影响RNA的稳定性[91]。PPO1是四吡啶代谢的关键酶,突变会造成18个质体位点的编辑减弱,但不会完全失去编辑功能,可以直接与质体RIP /MORFs相互作用,但不与PPR因子相互作用[81]。OCP3编码一种阳离子过氧化物酶,突变后质体ndhB转录本中多个位点的编辑程度轻微降低,削弱NADPH脱氢酶(NDH)复合体的活性从而增强植物对真菌感染的抗性[92]。
多种RNA编辑因子协调配合,共同组成编辑复合体,灵活多变地在细胞器RNA编辑过程中发挥作用。PLS型PPR蛋白识别并特异性结合编辑位点,PPR-RNA复合物与其他一些非PPR蛋白因子组成编辑体,非PPR蛋白可能作为编辑效率的调节器或者利用额外的辅助因子招募位点特异性的PPR蛋白进入活性编辑机制[93]。
动物体内主要存在两种形式的RNA编辑现象,一种是载脂蛋白B mRNA编辑酶(APOBEC)催化的C-to-U的编辑,哺乳动物中主要存在11种APOBEC蛋 白, 其 中 APOBEC1、APOBEC3F和APOBEC3G具有催化活性[94];另一种是腺苷酸脱氨酶(ADAR)催化A-to-I的编辑,哺乳动物中主要存在3种ADAR蛋白,其中ADAR1和ADAR2具有催化活性[95]。除脱氨酶介导的编辑形式外,CRISPR/Cas编辑复合体是近年来RNA编辑领域的研究热点。
RNA靶向VI型CRISPR/Cas系统于2016年被首次发现,East-Seletsky等[96]在微生物基因组和宏基因组数据中搜索候选CRISPR/Cas位点时发现,Cas13具 有 Cas13a、Cas13b、Cas13c和 Cas13d四种亚型。Abudayye等[97]首次证实了Cas13是一种RNA靶向的新型CRISPR酶,可以进行精确的RNA碱基编辑,Jing等[98]发现VI型CRISPR-Cas系统可以介导裂殖酵母(Schizosaccharomyces pombe)的RNA敲除和单碱基RNA编辑;Cox等[99]研究发现,将失活的Cas13b融合到ADAR2腺嘌呤脱氨酶结构域可以实现A-to-I的单碱基替换,命名为REPAIR(RNA editing for programmable A to I replacement),可以特异性地识别A/C错配,实现特定位点核苷酸的高效精确编辑,随后Abudayyeh等[100]用胞苷脱氨酶替换腺嘌呤脱氨酶,实现了从C-to-U的单碱基编辑,并命名为RESCUE(RNA editing for specific C to U exchange),填补了RNA编辑工具中的关键空白。
Liu 等[101]与 Knott等[102]解析 Cas13a单蛋白、Cas13a-crRNA二元复合物、Cas13a-crRNA及靶RNA三元复合物晶体结构后,指出Cas13a是一种RNA介导的具有RNase活性的Cas效应蛋白,可自我加工pre-crRNA形成成熟crRNA,通过其2个HEPN(higher eukaryotic and prokaryotic nucleasedomains)结构域内的保守氨基酸可以有效地降解ssRNA(singlestranded RNA)。此外,Cas13a与组织特异性启动子联合可以敲除特定组织中的目标RNA,与核定位信号融合可以靶向非编码细胞核转录产物,扩大了作用范围[103],有助于进一步研究RNA结合蛋白的功能。
但是Cas13a酶本质上是一种相对较大的蛋白质,很难被包装到靶组织中,这也是临床应用的一大障碍。2018年,Konermann等[17]发现了靶向RNA的Cas13d家族,是目前发现的哺乳动物细胞中相对较小的Ⅱ类CRISPR效应因子,关键特征在于依赖一种比以前研究中物理尺寸更小的酶,且对RNA靶点的切割不依赖于PFS序列(protospacer flanking sequence),可以灵活设计sgRNA。Cas13d家族成员CasRx来自肠道黄化瘤胃球 菌(Ruminococcus flavefaciens)XPD3002[104], 是已发现的最小的效应蛋白,比Cas13a-c小20%左右,更易包装到AAV(adeno-associated virus)等容量有限的载体中实现体内运输,在编辑效率高达96%的同时没有明显脱靶效应,已经成为动物RNA编辑系统中的首选工具。Wang等[105]利用CasRx系统靶向石斑鱼神经坏死病毒以干扰其感染,为病毒免疫提供了潜在机制;Huynh等[106]依赖CasRx开发了在RNA水平操纵基因表达的工具,靶向果蝇体内的内源性转录本;Brogan等[107]利用CasRx系统构建 SENSR(sensitive enzymatic nucleic acid sequence reporter)检测SARS-CoV-2,开发了迅速适应新病原体的即时诊断工具。
脱靶效应始终是评价编辑体系可靠性的重要指标,是RNA编辑应用中尤为关键的安全性问题,与靶标RNA非常接近的片段有可能在编辑过程中被同时沉默,进而导致基因组的变异和染色体重排。Manghwar等[108]总结了当前的ZFN技术、TALEN技术和CRISPR/Cas系统等基因编辑工具产生的脱靶效应,并提出开发利用预测工具、设计高质量靶标等有效减少或避免脱靶的策略。Grünewald等[109]的研究结果表明,单碱基编辑同样面临着造成大量突变的脱靶风险,使用两个带有rAPOBEC1突变的优化编辑器(cytosine base editor,CBE)会使变异率分别减少390倍和3 800倍,可以减少RNA脱靶效应的发生。
若要从技术源头去规避脱靶效应,开发精准性更高的新基因编辑系统是首选方案[107]。与RNAi相比,Cas13a系统脱靶率显著降低[110],Konermann等[17]也证实了Cas13d介导的基因沉默在数百个shRNA脱靶的情况下没有脱靶,可见Cas13系统在精度、效率和实用性等方面有突出的优势,但Cas13并非完美的临床应用工具,由于其本身具有旁切活性,当其识别到靶标时,不仅能切割底物RNA,还会切割游离的任意单链RNA,对细胞造成一定程度的损伤。
2021年,Jonathan和Omar团队筛选出独特的III-E型CRISPR-Cas系统攻克了这一难题[18],该系统借助单一的效应蛋白Cas7-11(包含4个Cas7的亚基和一个Cas11的亚基的融合蛋白),精准靶向RNA且没有表现出伤害细胞的旁切活性,来自石本氏脱硫丝菌(Desulfonema ishimotonii)的DiCas7-11将pre-crRNA加工为成熟的crRNA,并在靶标位点精确切割RNA,保持其他RNA不受干扰,这意味着Cas7-11可以在不伤害细胞的情况下改变RNA中的特定碱基,从而校正基因突变带来的错误。此外,Cas7-11还可以稳定或破坏特定RNA分子来调节其编码蛋白质的水平。Cas7-11是一种高特异性且低细胞毒性的新型RNA编辑工具[18],丰富了CRISPR/Cas系统多样性,进一步推动了RNA编辑技术的发展。
目前,特异靶向RNA的VI型CRISPR/Cas系统已经成为动物RNA编辑系统中的热门工具,由于该系统优势突出,也在植物中开展了研究,主要在抑制植物病毒方面发挥作用。在感染植物的病毒属中,约70%是在其生命周期中不使用DNA中间产物的ssRNA病毒[111],因此特异靶向ssRNA的CRISPR/Cas系统更适合用来抑制ssRNA病毒。在拟南芥中转基因表达的LshCas13a首次证明了Cas13系统在植物中可以保持其pre-crRNA加工活性,干扰芜菁花叶病毒的复制且不会引起细胞毒性作用[112];RfxCas13d也对植物RNA病毒如芜菁花叶病毒、烟草花叶病毒和黄瓜花叶病毒表现出强大特异的抗病毒活性,为抗病毒分子育种检测提供了新的策略[113]。
随着RNA编辑研究的不断扩展,关于RNA编辑事件的数据库资源也逐渐丰富完备(表2)。RNA编辑数据库不仅全面完整地记录了编辑事件、编辑位点等信息,还会将其编辑类型、编辑因子与编辑时之间的交互作用等详细记录,如REDIdb数据库记录了486个线粒体序列和220个叶绿体序列的编辑类型,其中67%是碱基替换,碱基的插入与删除分别占比30%和3%[114];PED不仅记录了编辑类型,还包括8个模式物种中编辑因子在调控植物表型中的功能作用以及详细的研究结论[115]。数据库的建立与改进,有利于充分有效地管理和利用信息资源,为后续的科学研究提供了准确的数据支撑和强有力的理论支持。
表2 部分RNA编辑数据库Table 2 Partial RNA editing database
RNA编辑使转录产物不能准确反映DNA的一级序列,由此改变了遗传信息,拓宽了中心法则的范围,这一现象既丰富了基因表达产物的多样性,也使得依赖于DNA序列而推测蛋白质序列的传统方法具有一定的不可靠性。
目前关于植物体内RNA编辑的研究多集中在细胞器内依赖于RNA编辑复合体的C-to-U的形式。在众多的RNA编辑因子中,PPR蛋白是目前被发现的能够和靶标编辑位点所在的顺式作用元件直接结合的因子,随着研究的深入,通过PPR基序预测识别RNA序列的机制也逐渐变得清晰,但是并非所有的PPR蛋白都能按照这一预测模型完全准确地识别其靶标位点,PPR蛋白中不同结构域的功能以及发挥编辑功能的过程仍没有被完全揭示。此外,编辑复合体中已知的非PPR蛋白的具体功能以及究竟还有多少种未知的编辑因子在发挥功能不得而知,其作用机制仍然需要大量的研究去阐述。
此外,基于CRISPR/Cas系统以及相应效应器的RNA编辑技术的开发与应用是生命科学领域的一大突破性进展,作为基因编辑工具发挥了相当重要的功能,但它仍需要进一步提高性能及其安全性。例如,提高对靶标RNA的编辑能力、Cas酶活性的调控、不同类别蛋白组分间融合进化的机制以及新型蛋白如何在体内更好地递送等都需要后续的深入研究,尤其是如何正确评估、检测脱靶效应并发展更高效精准的编辑系统,是当前基因编辑器和编辑工具安全应用于临床的重要研究方向。
目前,RNA编辑技术已经在基础研究、动植物性状的定向改良、抗病毒分子育种、癌症及神经性疾病临床治疗、药物及疫苗的研发等基因工程领域中发挥了不可替代的作用,是生命科学微观领域的一大里程碑式探索,事实上,RNA编辑看似仅是一个简单的生物学过程,仍有许多未知的科学问题需要进一步探索。如RNA编辑与细胞器进化、内共生学说等存在何种联系?为什么RNA编辑在不同组织间差异如此显著?部分编辑与完全编辑这两种编辑形式在体内如何配合?对RNA编辑的本质及作用机制的进一步研究,开拓新的发展方向,可以使人们对于生命科学的认识上升到新的高度,使RNA编辑成为基因工程以及基因治疗中强有力的新型工具。