格日乐其木格, 牛振峰, 董丹, 张涛涛, 峥嵘
1.内蒙古师范大学生命科学与技术学院,呼和浩特 010022;2.北京市农林科学院植物保护环境保护研究所,北京 100097
微生物种类繁多,与我们的生活密切相关,很多抗生素、免疫抑制剂、除草剂等医疗和农业相关的次级代谢产物都来源于微生物。同时,自然界还存在着一些有害微生物,如致病真菌、细菌、病毒等。CRISPR-Cas系统(clustered regularly interspaced short palindromic repeats-crispr associated proteins)的发展,促进了微生物的基因功能和次级代谢产物的挖掘等方面的研究工作。除此之外,CRISPR-Cas系统也展现出核酸检测应用的潜力。本文主要从CRISPR-Cas系统的作用机理、分类、微生物基因编辑和核酸检测中的应用等方面进行综述,旨在为相关研究提供借鉴。
CRISPR-Cas系统就是细菌漫长生活史中进化出的一种具有免疫记忆的获得性免疫防御系统,用于抵制外源核酸及噬菌体的入侵[1]。该系统于1987年由日本科学家在大肠埃希菌(Escherichiacoli)中发现[2]。CRISPR基因座通常由许多间隔的重复序列与非重复的间隔序列(这些序列主要对应于捕获的病毒和质粒序列片段)组成,并且通常与Cas基因(CRISPR相关)相邻(图1)。Cas基因编码一个大型的异质蛋白质家族,该家族携带典型的核酸酶、解旋酶、聚合酶和多核苷酸结合蛋白的功能域[3]。
图1 CRISPR-Cas系统结构
CRISPR-Cas的免疫应答主要包括三个阶段:适应、表达和干扰。在适应阶段,一种Cas蛋白复合物在识别出特定的前间隔序列邻近基序(PAM)后结合到目标DNA上,并分裂出目标DNA的一部分,即前间隔序列。再将其整合到自身CRISPR序列中,使其成为新的间隔序列。人们还发现Cas1和Cas2这两种高度保守的蛋白在这一阶段中起着关键作用[2, 4];在表达阶段,CRISPR阵列通常被转录为一个单一的pre-CRISPR RNA(pre-crRNA),随后被Cas内切酶(如Cas6)或非Cas蛋白(如RNaseⅢ)加工成更小、更成熟的CRISPR RNA(crRNA)[5];在干扰阶段,由成熟的crRNA与单个或多个Cas蛋白形成的复合物识别并裂解侵入核酸[6]。
2011年Makarova等[7]通过对Cas蛋白序列和结构的比较分析,将CRISPR-Cas系统分为三种类型(Ⅰ,Ⅱ和Ⅲ)以及未分类的系统(U型)。所有这些系统都包含两个通用基因:Cas1和Cas2。Cas1编码一种没有序列特异性的金属依赖性DNA酶DNAse,可将外源DNA(间隔序列)整合到CRISPR序列中。Cas2编码一种金属依赖性核糖核酸内切酶,可能还参与间隔序列获取阶段。三种类型的CRISPR-Cas系统的组成基因组各不相同,并且每种都有其独特的特征基因来表征[8]。Ⅰ型CRISPR-Cas系统的特征基因为Cas3,其包含HD磷酸水解酶结构域和DExH解旋酶结构域[6],该系统还可分为6种亚型(IA-IF)。Ⅱ型CRISPR-Cas系统可分为2种亚型,其特征基因是Cas9,该基因编码一种含有HNH 核酸酶结构域和 RuvC 核酸酶结构域蛋白。Ⅰ型系统进行防御时需要几种蛋白质来完成,而Ⅱ型系统仅需要Cas9核酸酶进行防御[9]。最后一种Ⅲ型CRISPR-Cas系统,其特征基因为Cas10(编码一种结构域与核酸聚合酶和核苷酸环化酶结构域同源的蛋白),Ⅲ型系统也分为2种亚型(ⅢA,ⅢB),而且两个亚型靶向不同的核酸[6, 8]。
随着新类型的CRISPR-Cas系统不断被发现,在2015年Makarova等再一次对CRISPR-Cas系统进行了分类。根据Cas蛋白在干扰阶段的体系结构,将CRISPR-Cas系统分为两大类:1类(多蛋白效应复合体)和2类(单蛋白效应复合体)系统[10-11]。1类系统(包括类型Ⅰ,Ⅲ和Ⅳ)存在于细菌和古细菌,2类系统(包括类型Ⅱ,Ⅴ和Ⅵ)几乎完全限于细菌[5, 12]。其中Ⅳ、Ⅴ型和Ⅵ型系统的特征基因分别为Csf1、Cas12和Cas13[4, 10, 13]。目前,CRISPR-Cas系统可分为2大类,6个类型,33个亚型(图2)。由于2类系统结构简单,操作方便,是目前应用最广泛的CRISPR-Cas系统。
图2 CRISPR-Cas系统分类
目前CRISPR-Cas9基因编辑技术已应用于多种真菌基因的功能研究中。早在2013年,DiCarlo等[14]首次利用CRISPR-Cas9基因编辑系统成功在酿酒酵母(Saccharomycescerevisiae)中敲除了细胞膜精氨酸透性酶CAN1基因,使单链及双链靶基因断裂效率分别提高至5和130倍,同源重组率接近100%。2017年刘倩等[15]利用CRISPR/Cas9系统成功地在嗜热真菌(Myceliophthorathermophila)和嗜热毁丝霉(Myceliophthoraheterothallica)中进行基因编辑,并对纤维素酶生产途径中的4个基因(CRE-1、RES-1、GH1-1和ALP-1)同时进行多位点的编辑。利用该系统产生了多个表现出明显超纤维素酶生产的突变菌株,其分泌的蛋白质和木质纤维素酶活性显著增加(分别达到野生型菌株的5和13倍)。但仍存在需要复杂的独立表达盒来靶向多重基因组位点,以及有限数量的可用选择性标记基因等局限性。2019年,他们利用前期构建的CRISPR-Cas9基因组编辑技术,建立了一种基于V型AsCas12a核酸酶的新型基因组编辑系统对丝状真菌进行基因编辑[16-17]。Cas12a核酸酶只需要一个Pol Ⅲ启动子驱动几个小的crRNAs[18]。基于这个特性CRISPR-Cas12a系统可以同时删除或插入多个基因。他们还研发了一种标记回收方法,并将其称为CRISPR-Cas-assisted marker recycling technology(Camr technology),通过CRISPR-Cas12a/Cas9系统去除标记基因,实现筛选标记的回收和循环使用。再通过 Camr technology 系统对嗜热毁丝霉基因组进行了三轮转化。最终共编辑了纤维素酶分泌途径的9个关键靶基因和两个选择性标记基因neo和bar,得到了蛋白质产量和木质纤维素酶活性分别比野生型高9和18.5倍的M9突变体[16-17]。成功解决了丝状真菌中无法进行多轮编辑的难题,也让丝状真菌中的多基因编辑变得更加简单高效。2020年刘倩等[19]再一次以嗜热真菌为宿主,结合2A肽策略和CRISPR-Cas9技术异源表达MhglaA和egfp两个基因,获得了与野生菌株相比蛋白质产量和淀粉酶活性分别提高约12.0和8.2倍的工程菌。实现了丝状真菌中多个基因的异源共表达。上述几种技术提高了嗜热真菌的工业价值,也为丝状真菌的基因编辑提供了新思路。
2.2.1放线菌中的应用放线菌是革兰氏阳性细菌,占土壤微生物群的13%~30%,是临床药物(如甲酸霉素、法沙霉素、2-烷基-4-羟基喹啉、红霉素等[20-22])和工业天然产物的主要来源之一[23]。CRISPR-Cas9基因编辑技术的诞生给放线菌新的次生代谢产物挖掘工作带来了助力工具。与传统方法相比,CRISPR-Cas9系统在放线菌中的应用具有效率高、操作方便等优点。早在2015年研究人员在链霉菌中成功构建了CRISPR-Cas9基因编辑系统并在变铅青链霉菌(Streptomyceslividans)、天蓝色链霉菌(Streptomycescoelicolor)等多种链霉菌中进行了基因编辑[24-26]。2018年Tong等[27]开发了一个用于放线菌基因组编辑的高效CRISPR-Cas9工具包。该工具包包括sgRNA识别软件、基因簇敲除系统、基因功能丧失研究系统、生成随机大小删除库的系统和一个用于基因敲除的系统。该团队成功在StreptomycescoelicolorA3(2)和StreptomycescollinusTu 365中进行基因编辑,证明了该工具包的实用性。虽然CRISPR-Cas9系统已经成功用于放线菌遗传操作,但由于DNA双链断裂(DSBs)而引起的基因组不稳定和Cas9的(过)表达导致大量不必要的非靶效应等问题仍然存在。
为了解决这些问题,他们又开发了单核苷酸分辨率基因组编辑系统(CRISPR-base editing system,CRISPR-BEST),CRISPR-BEST与CRISPR-Cas9的区别在于不需要产生DSBs。针对sgRNA识别的目标序列,CRISPR-cBEST(使用胞苷脱氨)可以有效地将C:G碱基对转换为T:A碱基对;CRISPR-aBEST(使用腺苷脱胺)可以将A:T碱基对转换为G:C碱基对(图3)。此外,该系统通过提供基于Csy4(还称为I-F型CRISPR相关内切核糖核酸酶Cas6;GenBank登录号:PHP80843.1)的sgRNA处理系统来支持单个质粒的多重编辑[28-29]。目前CRISPR-BEST已应用于多种链霉菌中。然而,正确编辑突变体的筛选和质粒消除的过程仍然是耗时费力的。为了解决这个问题,Wang等[30]开发了一个基于两个显色报告系统(GusA和IdgS)的放线菌CRISPR-Cas9基因组编辑系统。该系统促进了阳性克隆筛选和质粒消除两个过程,并在放线菌StreptomycescoelicolorM145和Verrucosisporasp.MS100137中完成了不同片段大小的基因敲除,证明这个系统是更快和更有效的基因编辑系统。
图3 CRISPR-BEST系统的作用机制[29]
2.2.2其他细菌中的应用CRISPR-Cas系统主要以两种形式在细菌中进行基因编辑:引入外源CRISPR-Cas系统和利用自身的CRISPR-Cas系统进行基因编辑[31]。Walker等[9]分别用原生Ⅰ-B型系统和异源Ⅱ型GeoCas9系统对嗜热纤维梭菌(Clostridiumthermocellum)进行了基因编辑。并通过将两种基因编辑系统与同源重组酶(Exo/Beta,来自Acidithiobacilluscaldus)结合起来,提升同源重组效率,从而提高编辑效率。Ⅰ-B型系统的编辑效率由原来的40%增加到71%,Ⅱ型GeoCas9系统的编辑效率由12.5%增加到94%。Suzuki等[32]构建了一个适用于变形菌门(Proteobacteria)的CRISPR-Cas9基因编辑系统。将来自化脓性链球菌(Streptococcuspyogenes)的Cas9基因引入到宿主范围广泛的质粒pBBR1MCS-2中,构建质粒pBBR1-Cas9,应用该系统对沙雷菌(Shewanellaoneidensis)MR-1的crp基因进行了编辑。
假单胞菌(Pseudomonas)是一类具有重要生物医学、生态和工业意义的革兰氏阴性菌。Chen等[33]报道了利用CRISPR-Cas9和噬菌体λ-Red重组系统构建的基因组编辑系统pCasPA/pACRISPR,该系统可以对铜绿假单胞菌进行有效的遗传操作。他们还进一步开发了一个碱基编辑系统pnCasPA-BEC,能够高效地对多种假单胞菌进行基因失活和点突变,如铜绿假单胞菌(Pseudomonasaeruginosa)、恶臭假单胞菌(Pseudomonasputida)、荧光假单胞菌(Pseudomonasfluorescens)和丁香假单胞菌(Pseudomonassyringae)等。
病原体是人类的一大威胁,它们在全球范围内自由传播。因此,迫切需要提高检测系统的检测效率,以便及早发现。其中分子诊断发挥了关键作用,核酸检测是主要的分子诊断方法之一[34]。2019年末新冠疫情的爆发也提醒着人们,核酸检测技术在疫情防控中起着重要作用。一个高效、便捷的核酸检测技术可以为疫情防控争取更多的时间。
因此,迫切需要一种具有高灵敏度和高特异性的核酸检测方法。此前,张锋研究团队和Jennifer Doudna研究团队分别利用Cas12a和Cas13在目标序列的激活下非特异性切割ssDNA和RNA的特性开发了SHERLOCK[35](specific high-sensitivity enzymatic reporter unlocking)、DETECTR[36](DNA endonuclease targeted CRISPR trans reporter)两种核酸检测技术。这两种核酸检测技术可以用来检测HPV(human papillomavirus,人乳头瘤病毒)、Zika virus(寨卡病毒)、Dengue virus(登革热病毒)等病毒[36-37]。同样也可以检测COVID-19 virus(新型冠状病毒),在疫情爆发之后,张锋等根据新冠病毒全基因组序列研发了检测COVID-19 virus的技术。他们针对COVID-19 virus设计了识别S基因和Orf1ab基因的两个向导RNA(sgRNA)。这样,一旦检测样本中含有COVID-19 virus,sgRNA就会引导Cas13核酸酶切割这两个病毒基因,从而激活Cas13核酸酶非特异性切割报告基团并可以在基因试纸上形成视觉可见的条带[38-40](图4)。将经过处理的样品滴在试纸上5 min之内就可以看到结果,在试纸上出现两个条带说明结果为阳性[39]。该方法结合重组聚合酶扩增技术(recombinase polymerase amplification, RPA),能够对样本中痕量的核酸在恒温条件下进行大量扩增,因此具有高灵敏度(10~100拷贝·μL-1即可检测出),从处理样品到出结果全程不超过1 h且操作简便,如果该技术实现产品化并推向市场有望弥补现有技术的不足[40]。
图4 不同输入浓度横向流量读出的示例图像[39]
CRISPR-Cas基因编辑系统的发展给微生物基因功能研究带来了助力工具。近几年CRISPR-Cas基因编辑技术也在不断更新,从最初的CRISPR-Cas9编辑技术到可以对丝状真菌同时进行多基因编辑的CRISPR-Cas12a,再到可以对链霉菌进行碱基编辑避免了DNA双链断裂引起的基因组不稳定性和Cas9蛋白过表达导致的非靶效应等问题的CRISPR-BEST。CRISPR碱基编辑的诞生也更加丰富了微生物的遗传操作“工具箱”。
基于CRISPR-Cas系统的核酸检测技术因灵敏度高、检测速度快、操作简单、成本低为医学诊断和检测目标带来了很大的便利,SHERLOCK已被用于细菌和病毒传染病病原体的检测和基因分型,包括区分单核苷酸变异和寻找抗生素耐药基因[37]。我们可以利用SHERLOCK区分新冠病毒的变异毒株,早发现早隔离,防止新冠疫情大规模爆发。并且CRISPR-Cas核酸检测技术还在不断优化,Melika等[41]认为CRISPR-Cas13不仅可以用来检测COVID-19 virus,还有治疗COVID-19 virus引起的疾病的潜力。新冠疫情为科研人员敲响了警钟,要不断地探索发现才能在危难时刻迅速找到应对之法。相信在不久的将来CRISPR-Cas系统还会应用到更多的领域,给人类带来更多的惊喜。