于鲲,薛佳琪,王进宽,余永涛*
1.宁夏大学农学院,银川750021;
2.固原市原州区张易镇畜牧兽医工作站,宁夏 固原756022
丝状真菌(filamentous fungi)统称为霉菌,广泛分布于自然界中,因其种类丰富、来源广泛、易于工业化等特点而在多个领域得到广泛应用。曲霉属(Aspergillus)和木霉属(Trichoderma)等丝状真菌具有良好的蛋白质合成和分泌能力,常被用于各种同源性或异源性蛋白质表达的生产,如利用黑曲霉(Aspergillus niger)通过人工生物合成来生产纤维素酶、菊粉酶[1];用米曲霉(Aspergillus oryzae)生产人乳铁蛋白、小牛凝乳素等。部分丝状真菌还可用于合成有重要生物活性作用的次级代谢产物,如青霉素、洛伐他汀等。在环境保护方面,丝状真菌可用来处理废水、生产生物燃料、降解低密度聚乙烯[2]等。同时,丝状真菌与人类的生产生活密切相关,一些丝状真菌是人或动植物的病原真菌,如镰刀菌属(Fusariumspp.)和曲霉属部分真菌可引起真菌性角膜炎[3],烟曲霉(Aspergillus fumigatus)[4]可引起人类真菌性皮肤病;稻 瘟 病 菌(Magnaporthe oryzae)[5]、灰 霉 菌(Botrytis cinerea)[6]等 可 引 起 农 作 物 的 真 菌 性病害。
通过研究丝状真菌生物合成相关基因的功能,并应用生物技术手段对其进行遗传选育或改造,可以显著提升丝状真菌合成生物活性物质的能力,从而达到利用丝状真菌进行工业化生产和应用的目的[7]。基于同源重组原理的基因敲除等技术,如Split-marker、λRed等已广泛应用于丝状真菌基因功能的研究[8]。但由于同源重组效率低、脱靶率高、需要对大量转化子进行筛选、工作量巨大等因素,近年来已逐渐被基因编辑等技术所替代[9]。近年来,科研人员陆续开发了多种用于基因编辑的特异性核酸内切酶技术,如锌指核酸酶(zinc finger nuclease,ZFN)、类转录因子样效应核酸 酶(transcription activator-like effector nuclease,TALEN)、CRISPR/Cas9等技术,与ZFN技术[10]和TALEN技术[11]相比,CRISPR/Cas9技术具有操作简单、靶向性好、安全性高等优点,已经成为丝状真菌基因编辑的首选技术。本文综述了CRISPR/Cas9技术的起源与基本原理,sgRNA的合成策略,Cas9蛋白、CRISPR/Cas9系统的递送、实现基因编辑的方式和存在的问题,以期为该技术在丝状真菌中的应用提供理论依据。
1987年日本微生物学家Ishino等[12]首次在大肠杆菌中发现了成簇而规律地间隔短回文重复序列(clustered regularly interspaced short palindromic repeats,CRISPR)。2002年Jansen等[13]发现了与CRISPR序列相邻的Cas基因,并且在细菌(>40%)以及古细菌(>90%)中都存在这一系统,同时证实这一系统与细菌免疫有关。随着研究的深入,该系统的各组成成分及功能逐渐被揭示。2013年该系统首次被应用于基因编辑,随后该系统被广泛应用于植物[14]、动物以及微生物[15]的基因编辑中。2015年Liu等[16]首次将CRISPR/Cas9技术运用于丝状真菌模式生物—里氏木霉(Trichoderma reesei)中,之后在多种丝状真菌的基因改造中得到广泛应用。
目前,被广泛应用的Ⅱ型CRISPR/Cas9系统来自于化脓性链球菌,该系统主要由两部分组成:一个组成部分是通过碱基互补配对方式对目的基因编辑区域进行定位的向导RNA(small guide RNA,sgRNA);另一组成部分是通过PAM序列(5'-NGG-3')与靶向DNA结合且具有核酸内切酶功能的Cas9蛋白。sgRNA引导Cas9蛋白与靶向序列结合后实现对DNA双链的切割[17]。DNA双链断裂后,细胞内启动非同源末端连接或同源重组修复机制来重新连接断裂双链,在此过程中实现基因的敲除或替换。
sgRNA作为CRISPR/Cas9系统的重要组成部分,其能否正确表达是基因编辑成功的关键因素,而合适的启动子才能高效驱动sgRNA的表达来实现基因编辑,因此选择合适的启动子对sgRNA的表达至关重要。gRNA在真核细胞内的表达通常分为RNA聚合酶Ⅲ启动子驱动和RNA聚合酶Ⅱ启动子驱动两种表达策略。
sgRNA转录完成后不需要在5'端和3'端分别添加帽子结构以及polyA尾巴,所以由RNA聚合酶Ⅲ启动子驱动gRNA的表达更为合适。U6 sn-RNA基因在真核生物中高度保守,而U6启动子作为广泛存在的组成型启动子在多种真核生物CRISPR/Cas9系统中被用于驱动sgRNA的表达。Arazoe等[18]成功将稻瘟病菌的内源性U6启动子应用于sgRNA的表达,通过CRISPR/Cas9技术成功实现了SDH基因的替换。之后,U6启动子还被用于嗜热毁丝菌[19]、里氏木霉[20]、米曲霉[21]、黑曲霉[22]等丝状真菌sgRNA地表达和基因编辑。此外,tRNA启动子也被成功用于sgRNA的表达。Song等[23]在黑曲霉中测试了37个tRNA启动子,发现其中36个具有良好的驱动sgRNA表达的功能。但tRNA启动子驱动的RNA表达具有自我剪切功能,在某些情况下并不能正确地表达sgRNA,基于tRNA启动子的基因编辑效率一直存在争议。研究表明,5S rRNA作为细胞的基本成分,具有高度保守且含量丰富的特点,Zheng等[24]根据这一特点构建了基于5S rRNA基因内部启动子的新型sgRNA表达策略,并在5S rRNA序列和sgRNA序列之间插入一个88 bp的丁型肝炎病毒(hepatitis dvirus,HDV)核酶来避免5S rRNA对sgRNA结构和功能的影响。在黑曲霉中,基于5S rRNA启动子的基因编辑效率(96%)明显高于基于U6启动子的基因编辑效率(15%~23%)。Shi等[25]在藤仓镰孢菌(Fusarium fujikuroi)中的研究结果也表明,基于内源性5S rRNA启动子的基因编辑效率明显高于其他启动子。Wang等[26]在草酸青霉(Penicillium oxalicum)和里氏木霉的基因编辑实验中发现,来自黑曲霉的5S rRNA启动子可以高效地驱动草酸青霉中的基因编辑,但几乎不能驱动里氏木霉中的基因编辑,而天然的5S rRNA启动子更适合在里氏木霉基因编辑中驱动sgRNA表达。以上研究表明,RNA聚合酶Ⅲ启动子对于sgRNA序列的驱动具有独特优势,且越来越多的RNA聚合酶Ⅲ启动子被用于丝状真菌的CRISPR/Cas9系统,这使得丝状真菌基因编辑系统的建立逐渐变得容易。但不同的RNA聚合酶Ⅲ启动子在不同丝状真菌中的驱动效果具有极大差异,因此选择合适的内源启动子尤为重要。
尽管目前已有多种由RNA聚合酶Ⅲ启动子驱动gRNA表达的策略,但由于RNA聚合酶Ⅲ类启动子本身存在一些局限性,如表达看家基因、开发尚不完善等[27],无法适应所有CRISPR/Cas9系统,因此人们开始关注RNA聚合酶Ⅱ启动子。RNA聚合酶Ⅱ启动子主要参与mRNA的转录,其会在转录产物的5'端和3'端分别添加帽子结构和Poly A尾。所以在使用RNA聚合酶Ⅱ启动子驱动sgRNA的表达时,需要在sgRNA序列的两侧分别添加锤头状核酶(hammerhead,HH)和HDV核酶,对转录产物进行自体剪切,从而产生结构和功能正常的sgRNA[28]。Nødvig等[29]根据这一特点,应用构巢曲霉RNA聚合酶Ⅱ启动子gpdA和trpC终止子建立了由RNA聚合酶Ⅱ启动子驱动锤头状核酶和丁型肝炎病毒核酶介导的sgRNA表达策略,并成功应用于多种丝状真菌。此外,RNA聚合酶Ⅱ启动子tef1也被用于sgRNA的表达中[30]。RNA聚 合 酶Ⅱ启 动 子 的 应 用 丰 富 了sgRNA序列表达驱动的可选择性。
除以上两种表达策略外,在有些真菌的基因编辑中部分研究者还会采用体外转录sgRNA的策略,通常先合成一段由T7启动子调控的sgRNA表达序列,然后使用体外转录试剂盒生成sgRNA[31]。获得的sgRNA可以与体外表达并纯化后的Cas9蛋白共同构成核糖核蛋白(ribonucleoprotein,RNP)后再进行宿主转化,该方法在宿主的基因编辑过程中没有出现质粒,所以也被称为无质粒CRISPR/Cas9系统[32]。与质粒转化系统相比,体外合成sgRNA可以进行切割效率验证,方便选择高效的sgRNA进行研究,同时也会降低将外源基因转化到基因组的可能性。目前RNP介导的无质粒CRISPR/Cas9系统已被应用于尖孢镰刀菌(Fusarium oxysporum)[33]、烟曲霉[32]、卷枝毛霉(Mucor circinelloides)[34]等多种丝状真菌的基因编辑中。RNA的体外表达在进行基因编辑时可以引入选择标记,这降低了外源基因引入的风险,但也会增大转化子筛选的难度,且gRNA在转化时存在被降解的风险。以上结果表明,不同的丝状真菌因其菌体结构、代谢机制和生理生化等方面的差异,应选用不同的sgRNA表达策略进行研究。
具有核酸内切酶功能的Cas9蛋白是CRISPR/Cas9系统的重要组成部分,目前被广泛应用的CRISPR/Cas9系统来自于原核生物化脓链球菌。不同的物种在编码蛋白质时具有密码子偏好性,当CRISPR/Cas9系统被用于不同物种的基因编辑时,需要对编码Cas9蛋白的基因序列进行密码子优化,因此应根据不同物种需求,在丝状真菌基因编辑的研究过程中对氨基酸密码子优化[29]。CRISPR/Cas9系统分离自细菌中,天然Cas9蛋白不具备核定位信号,所以CRISPR/Cas9系统被应用于真核生物时,需要在Cas9蛋白两端添加核定位信号(nuclear localization signal,NLS)用来引导Cas9蛋白进入细胞核。来自于猿猴空泡病毒(Simian vacuolating virus40,SV40)的核定位序列(PKKKRKV)被证明可以广泛应用于不同物种[29]。但SV40 NLS并不适用于所有的丝状真菌,Feng等[35]和Wang等[33]的研究表明,经典的核定位序列无法在大豆疫霉(Phytophthora megasperma)和尖孢镰刀菌中完成入核引导,最终他们将内源性核定位序列融合到Cas9蛋白的N端用以引导sgRNA进入细胞核。Shi等[25]在藤仓镰孢菌的研究中同样证明经典核定位序列不能被应用,而选择了VELNLS和HTBNLS完成基因编辑。以上研究表明,添加适当的核定位序列是Cas9蛋白顺利进入细胞核行使功能的关键因素,在经典核定位序列不能完成入核引导时应尽量寻找该物种的内源性核定位序列或同属亲缘关系较近的物种中已知的核定位序列。
与sgRNA相似,Cas9蛋白是否能表达与启动子的类型密切相关,启动子调控能力的强弱直接影响外源性Cas9蛋白的表达。生物体中的RNA聚合酶Ⅱ启动子主要分为组成型启动子和诱导型启动子。在大多数研究中会选择组成型启动子来驱动Cas9蛋白在丝状真菌中的表达,原因为组成型启动子驱动基因表达不受空间和时间因素的影响,在组织细胞中可以稳定持续表达。丝状真菌CRISPR/Cas9系统常用的组成型启动子主要是gpdA启动子[21,30,36]、tef1启动子、trpC启动子。通常,诱导型启动子在受到特定条件刺激后才会驱动基因的表达,所以Cas9在诱导型启动子的驱动下表达使CRISPR/Cas9系统成为丝状真菌基因组编辑的时空控制器。此外有研究中使用了由淀粉诱导的amyB启动子[37]、温度诱导的hsp70启动子[38]等。Liu等[39]将cbh1启动子应用于Cas9的表达。以上研究表明,在实际研究中,对驱动Cas9蛋白表达启动子的选择需要根据实际情况进行,以保证CRISPR/Cas9系统能够在目标菌株中高效合理的发挥作用。
用于真菌基因组编辑的CRISPR/Cas9系统需要合适的方法转染至细胞内。聚乙二醇-氯化钙介导的原生质体转化法作为一种周期短、成本低的真菌遗传转化方法,可对质粒、线性化DNA、RNA、蛋白质等多种大分子物质进行转化,已被广泛应用于烟曲霉[40]、嗜热毁丝菌[19]、里氏木霉[26]、黑曲霉[41]等丝状真菌中。在易产生多核孢子和多核原生质体的丝状真菌中,从RNP瞬时转化中分离纯合转化子较困难,所以Zou等[42]在原生质体制备前的菌丝培养过程中加入了肌醇或苯菌灵来控制有丝分裂周期,明显提高了纯合转化体的获得效率。
虽然目前原生质体转化已被大量运用于丝状真菌CRISPR/Cas9系统的转化中,但原生质体的活力取决于用于生产原生质体的菌丝生长状态以及所用酶的批次质量,这严重影响了原生质体的转化效率。相对而言,在农杆菌转化方法中起始材料选择范围较为广泛,这使得CRISPR/Cas9系统的转化变得更加方便快捷。Wei等[43]使用根癌农杆菌LBA4404对丝状真菌(Glarea lozoyensis)的菌丝体完成了CRISPR质粒转化。Zou等[31]使用根癌农杆菌LBA1100与里氏木霉的分生孢子共同培养完成了Cas9表达载体的转化。目前通过原生质体法和电击法未实现嗜热丝状真菌(Thermoascus aurantiacus)的转化,Gabriel等[44]使用根癌农杆菌EHA105与嗜热丝状真菌的子囊孢子共培养的方法进行了实验,并完成了基因编辑。在农杆菌介导的转化方法中选择合适的农杆菌菌株以及转化起始材料尤为重要,这对转化效率的影响较大。除以上两种常见的遗传转化方法外,基因枪转化法[30]、电穿孔转化法[45]等也被应用到丝状真菌CRISPR/Cas9系统的遗传转化中。以上研究表明,不同的丝状真菌生长状况及其生理特性不尽相同,所以在遗传转化方法的选择中需要综合考虑多方面因素,合适的转化方法可以极大地提高阳性转化子的获得率。
当Cas9蛋白成功作用于靶位点后,会导致DSB,当DSB产生后,细胞为了保持DNA双链的完整性,会通过非同源性末端链接(nonhomologous end joining,NHEJ)和同源重组(homologydirected repair,HDR)两种途径对断裂的双链进行连接修复从而实现基因编辑。
NHEJ机制具有高效、迅速等特性,几乎可在细胞复制的所有周期进行DSB修复[46]。NHEJ修复通路过程中Ku70蛋白和Ku80蛋白起到了重要作用[47]。通常由NHEJ通路完成的DSB修复保真性较差,在断端修复过程中会引起碱基的插入或缺失造成移码突变,导致基因开放阅读框的提前终止,从而实现目标基因的敲除。
HDR机制具有高保真特性,在正常修复过程中需以未受损的同源序列为模板进行修复[48]。在基因工程中,通过人为引入具有同源片段的DNA分子作为模板来实现基因的定向编辑[49],如基因的定向敲除[43]、构建特殊表型[50]、外源基因或报告基因的敲入[39,51]等。Liu等[39]在研究中发现,当供体DNA中具有≥200 bp的同源区域,则可以刺激里氏木霉中的同源重组,添加≥600 bp的同源臂时,同源重组的频率几乎为100%。Wang等[26]在草酸青霉(Penicillium oxalicum)中使用不带标记的40 bp上下游同源臂直接融合产物,编辑效率极低(6%),而使用带有40 bp上下游同源片段以及潮霉素标记的供体DNA,则可以进行同源重组。Kuivanen等[52]在黑曲霉中以40 bp的侧翼序列作为供体DNA的一部分,同样实现了同源重组。由于HDR的修复条件较为苛刻,通常由迅速反应的NHEJ抢先修复,而由HDR介导的基因敲入效率往往较低,所以近期研究中,人们致力于如何提高HDR介导基因定向编辑的效率问题,如有研究表明,在丝状真菌的NHEJ缺陷株中HDR的效率会得到一定的提高[7,53],Gandía等[54]研究表明,破坏参与非同源末端连接的Ku70蛋白会促进同源重组的发生。
编辑效率是指实现目标基因成功编辑的菌株所占的比率,相较于传统基因编辑系统,CRISPR/Cas9基因编辑系统具有编辑效率高的特性,但也不能保证所有的研究都能高效进行,如Katayama等[37]在研究中应用CRISPR/Cas9基因编辑系统分别对米曲霉wA、pyrG和yA基因进行编辑,编辑效率分别为10%~20%、10%和100%,这表明同一菌株中不同的基因在进行CRISPR/Cas9基因编辑时,编辑效率具有较大差异。Gabriel等[44]在嗜热丝状真菌(Thermoascus aurantiacus)的研究中针对同一基因的不同靶位点设计了3个sgRNA(sgRNA1、sgRNA2、sgRNA3),最终只有sgRNA1和sgRNA3实现了基因编辑,成功率分别为10%和35%。van Rhijn等[40]的研究表明,使用选择性培养基再生的菌株的编辑效率明显高于非选择性培养基上再生的菌株。Li等[21]构建了nDsRed报告基因,将原间区序列和PAM区共同插入到DsRed起始密码子下游并构建失活的荧光蛋白的表达质粒,当CRISPR系统成功表达并作用于原间区序列后有一定概率再次造成移码突变,使得红的荧光蛋白恢复活性,从而为挑选阳性突变株提供便利。以上研究表明,通过各种方法提高编辑效率,有助于快速获得所需的基因编辑目标菌株,从而大大降低试验工作量和试验成本。
脱靶效应是指sgRNA没有作用于靶点序列而产生的非特异性切割,从而产生非预期基因突变的情况。产生脱靶的原因主要有sgRNA与靶点序列等长但存在错配碱基,sgRNA存在一个或多个碱基“凸起”,靶点DNA存在一个或多个“凸起”[55-56]。在CRISPR/Cas9基因编辑系统得到广泛应用后,脱靶效应问题日益突出,并严重影响编辑效率的提高。研究表明,每个sgRNA的脱靶位点不会超过5个[57]。针对脱靶效应问题,不同的研究采用了不同的策略,Leynaud-Kieffer等[36]在黑曲霉的研究中引入“跳跃系统”,使脱靶菌株在含有5-FOA的培养基上死亡,从而降低脱靶菌株率。sgRNA和Cas9蛋白的浓度过高以及持续表达也会引起脱靶效应,故质粒的CRISPR/Cas9基因编辑系统[33-34,42]被开发应用于丝状真菌基因编辑。Huck等[38]在毛霉病菌的CRISPR/Cas9表达质粒构建时去除了介导自我复制的元件,使得其不能自我复制而只能做瞬时表达,从而降低脱靶效应。基于第二代测序的GUIDE-seq[58]、Digenomeseq[59]等分子生物学技术也可用于脱靶位点的检测,从而减少脱靶产物的产生。以上研究表明,脱靶效应是不可避免的,但通过不同的实验设计以及检测方法,可以减少脱靶产物的产生。
丝状真菌与人类生活有着极为密切的联系,利用丝状真菌生产具有重要价值的生物酶和次级代谢产物已成为工业界和学术界关注的焦点。野生型菌株并不能实现所需产物工业化水平的生产,为了解决这一问题,科研人员开发了许多基因技术来增加所需目标产物的产量。鉴于丝状真菌的复杂性,包括多细胞形态、细胞分化、厚几丁质细胞壁以及缺乏合适的质粒,CRISPR/Cas9技术在工业菌株的改造中极大地提高了基因改造能力。
作为生物酶工业化生产中最常用的真菌,里氏木霉具有强大的异源蛋白合成及分泌能力[60]。Fonseca等[61]使用CRISPR/Cas9系统在里氏木霉RUT-C30引入6种基因修饰,包括纤维素酶主调节因子XYR1的突变等位基因的组成型表达、两种异源酶的表达,即来自埃默森篮状菌(Talaromyces emersonii)的β-葡萄糖苷酶CEL3A和来自黑曲霉的转化酶SUC1,以及编码纤维素酶阻遏物ACE1和细胞外蛋白酶SLP1和PEP1的基因缺失。最终所得基因编辑菌株的纤维素混合酶分解纤维素的能力明显高于RUT-C30。Liu等[62]同样将里氏木霉RUT-C30作为试验菌株,利用CRISPR/Cas9系统敲除SxlR基因来调节木聚糖酶和纤维素酶的比例,获得了更高的木质纤维素水解效率。里氏木霉的纤维素酶共表达特性对于纤维素分解酶混合物具有重要意义,但在异源蛋白表达时这种特性通常是不被看好的。Rantasalo等[63]利用CRISPR/Cas9系统及通用功能合成基因表达系统作用于里氏木霉,成功获得了高纯度脂肪酶B(来自于南极假丝酵母)。Rojas-Sanchez等[64]在使用黑曲霉生产人类促红细胞生成素时,使用CRISPR/Cas9系统对vps、prtT、algC和och1基因进行敲除,获得了一种不含蛋白酶的菌株,其重组人红细胞生长素(recombinant human erythropoietin,rHuEPO)生产水平提高了41.1倍。Yang等[65]在生产柠檬酸的黑曲霉ATCC 1015菌株中进行了连续的基因操作,替换高效的C4-二羧酸转运蛋白并过表达可溶性NADH依赖性延胡索酸还原酶,显著提高了工程菌株中琥珀酸的产量,这说明通过基因敲除策略可以显著提高黑曲霉的异源蛋白表达效率。以上研究表明,CRISPR/Cas9系统已逐渐应用于工业真菌,而使用CRISPR/Cas9基因组编辑系统可以进一步增强这些工业真菌的适用性。
除了对以上工业真菌的改造,CRISPR/Cas9基因组编辑技术还可用于其他丝状真菌,如Seekles等[50]在 丝 状 真 菌Paecilomyces variotii和Penicillium roqueforti的研究中,使用CRISPR/Cas9系统对参与非同源末端修复的kusA基因进行敲除,创建了非同源末端连接机制受到破坏的菌株;Vieira等[30]使用CRISPR/Cas9系统生成具有pyr4营养缺陷型标记的哈茨木霉,对农业生物防治剂具有重要生态学价值。以上对菌株本身的改造为后期菌株的基因编辑提供了有力的基础。
相对于传统的ZFN和TALEN基因编辑系统,CRISPR/Cas9基因编辑系统具有独特的优势。CRISPR/Cas9基因编辑系统组成成分简单,仅由sgRNA和Cas9蛋白两部分组成,它们可根据具体需要构建于不同载体或同一载体上,也可直接体外合成后构建稳定复合物,并转入细胞。该系统要求条件较少,仅需要一个特定的PAM序列(NGG),而PAM序列广泛存在于生物体的基因组中,即CRISPR/Cas9系统几乎适用于所有基因的编辑。此外,CRISPR/Cas9系统可使用较少的选择性标记同时对多个基因进行编辑[39]。
CRISPR/Cas9系统因其独特的优势,目前在丝状真菌模式生物其他真菌都被大力开发应用。在工程菌株的改造方面取得了巨大成果,越来越多的丝状真菌工程菌株被开发利用。尽管CRISPR/Cas9系统已被广泛应用于丝状真菌的基因编辑,但仍存在编辑效率低、脱靶效应等问题。根据DNA双链断裂和染色体易位原理,Yin等[66]基于高通量测序方法开发了一种引物延伸介导测序(primer extension-mediated sequencing,PEM-seq)的新方法。PEM-seq可以灵敏识别Cas9的脱靶位点,还可以准确量化CRISPR/Cas9对靶点的切割效率位点,从而找到更有效的Cas9切割位点。虽然目前该方法还未在丝状真菌中建立,但随着研究的深入PEM-seq将会在真菌基因编辑中发挥巨大作用。在非模式丝状真菌中存在编辑难度较高、编辑效率波动较大等问题,这可能与人们不了解宿主真菌的代谢、防御等机制,无法解除宿主内CRISPR系统的限制因素相关。随着研究的深入,未来将会有更多的丝状真菌的基因组被破译,以帮助研究人员设计更加适合丝状真菌的CRISPR系统。