王立燕,刘永生
(中国农业科学院兰州兽医研究所 家畜疫病病原生物学国家重点实验室/农业部草食动物疫病重点开放实验室,甘肃 兰州 730046)
近年来,在许多细菌和古细菌中发现一种新的基因干扰途径—规律成簇间隔短回文序列(Clustered regularly interspaced short palindromic repeats,CRISPR),该序列是许多细菌和古细菌用来保护自己免受噬菌体、接合质粒和其他转座因子(Mobile genetic elements,MGEs)干扰的一段DNA 序列[1-2],其转录的RNA 序列与相关蛋白结合在一起可使入侵的特异性核酸发生降解。目前CRISPR 已被开发为一种基因编辑工具,能够对基因组进行特异性的定点改造。它与锌指核酸内切酶(Zine finger endonuclease,ZFN)以及类转录激活因子效应物核酸酶(Transcription activator-like effector nuclease,TALEN)相比[3],具有制作简单、成本低、作用率高的特点。
1987 年,Ishino 等在对大肠杆菌中编码碱性磷酸酶同工酶转化的iap 基因进行克隆和测序时,发现在其下游存在一组29 个核苷酸的非重复序列,它由一系列不相关、非重复、相似的短序列隔开,这是第一次对CRISPR 进行报道[1]。
2002 年,Jansen 等将其称为CRISPR 以反映这类基因座的特殊结构。这类特殊结构为:一般在重复基因簇之前有一段富含A、T 的前导序列,与CRISPR 相关的一组保守的蛋白编码基因Cas(CRISPR-associated)通常位于CRISPR的一侧,通过对数个CRISPR 的间隔序列(Spacer)的分析发现它们均来自外源的转座因子,如噬菌体、质粒。早期的研究还指出了与特定噬菌体相匹配的间隔序列与噬菌体敏感性之间的关系,这暗示CRISPR 具有免疫功能[1]。
2007 年,Barrangou 等的开创性的研究表明,CRISPR通过适应性免疫应答的途径来保护嗜热链球菌免受噬菌体的感染。间隔序列与其在噬菌体中所匹配序列的一致性是CRISPR 发挥免疫作用所必需的,Cas 对于CRISPR 免疫作用的发挥也是必要的,这个实验首次证实了这些结论[1,4]。
目前对于CRISPR 还在进一步的研究中,人类对其为许多细菌和古细菌提供适应性免疫的功能的认识与了解也越来越透彻。
CRISPR由位于5' 端的前导序列、短重复序列和位于两个重复序列之间的大小与其类似的间隔序列组成,并且大多数的间隔序列与外源噬菌体或质粒的遗传因子具有序列相似性。一般重复序列的长度在23~50 bp,平均长度为31 bp。间隔序列的长度在17~84 bp,平均长度为36 bp[1]。在一个CRISPR 序列中可含有重复序列2~588个,平均是49 个,在特定CRISPR 基因座中重复序列的顺序和长度一般是保守的,但不同的CRISPR 系统之间相差却是比较大的[5];而间隔序列在同一个CRISPR 序列中是高度可变的,但其长度却基本相似,而在不同的株系中,间隔序列则存在明显差异的[6]。编码Cas 蛋白的基因簇通常位于CRISPR 基因座的附近,因此将他们的复合物定义为CRISPR/Cas 模块[7]。到2013 年5 月7 日为止,已在48 %的细菌和85 %甚至更多的古细菌基因组中发现CRISPR/Cas 系统[5]。
根据Cas 蛋白的类型及顺序、CRISPR 中的重复序列和RNA 的结构等特点可将CRISPR/Cas 模块分成3 个主要的类型,即Type I、TypeⅡ和Type Ⅲ。它们在细菌中具有不同的分布,Type I 系统均存在细菌和古细菌中,TypeⅡ系统只存在于细菌中,而Type Ⅲ系统存在于大多数的古细菌中,而在少量的细菌中存在。在每个类型中均有自己保守的特征蛋白,如Type I 中的Cas3 蛋白、TypeⅡ中的Cas9 蛋白和Type Ⅲ中的Cas10 蛋白,只有Cas1 和Cas2 蛋白在大多数的CRISPR/Cas 系统中普遍存在[5]。
每一个类型的系统又可分为不同的亚型,代表crRNA(CRISPR RNA)的生物起源和定位入侵核苷酸的不同机制[8]。Type I 系统根据cas 基因的数量和排列的不同分为A、B、C、D、E、F 6 个亚型,如在硫矿硫化叶菌(S.Solfataricus)、沃氏嗜盐富饶菌(H.volcanii)、嗜碱芽孢杆菌(B.halodurans)和铜绿假单胞菌(P.Aeruginosa)中分别存在Type I-A、I-B、I-C 和I-F 系统,大肠杆菌(E.coli)和嗜热链球菌(S.thermophilus)中存在Type I-E 系统。TypeⅡ也可进一步分为Ⅱ-A、Ⅱ-B 和Ⅱ-C 3 个亚型,酿脓链球菌(S.pyogenes)和S.thermophilus 中存在TypeⅡ-A 系统。Type Ⅲ系统可分为Ⅲ-A 和Ⅲ-B 两个亚型,他们定位不同的核苷酸,表皮葡萄球菌(S.epidermidis)中存在Type Ⅲ-A 系统,强烈炽热球菌(P.furiosus)和S.solfataricus 中存在Type Ⅲ-B系统[5]。一种有机体中可能存在一种甚至一种以上的系统,如S.thermophilus 中既存在Type I-E 系统又存在TypeⅡ-A 系统。
在Type I 系统中,Cas6 与其他Cas 蛋白形成CRISPR相关抗病毒防御复合物(CRISPR-associated complex for antiviral defense,Cascade)[9],crRNA 前体(包含所有重复序列与间隔序列的CRISPR 转录物)被Cascade 加工成小的crRNAs,在crRNA 的指导下,Cascade 指导Cas3 核酸酶裂解入侵的DNA[7]。
在Type Ⅱ系统中,主要通过crRNA、Cas9 蛋白、tracrRNA(trans-activating crRNA,tracrRNA)和宿主的核糖核酸酶Ⅲ(RNase Ⅲ)来完成整个裂解外源DNA 的过程。tracrRNA 是一段小的反义重复RNA 序列,RNase Ⅲ的作用是剪切tracrRNA,Cas9 蛋白通过crRNA 和tracrRNA 的引导作用在特定的位点剪切双链DNA。由于TypeⅡ系统只含有一种Cas9 蛋白,相对其它两种类型比较简单,因此目前对它的研究比较多[7]。
Type Ⅲ系统与Type I 系统相似,利用Cas6 将precrRNA 剪切成多个小的crRNA,然而不同的是不同亚型作用于不同底物。在Type Ⅲ-A 亚型中,虽然核酸酶和蛋白质执行CRISPR 免疫功能的机制尚不清楚,但已知它是作用于DNA。体外试验证明Type Ⅲ-B 亚型中Cmr 蛋白复合物切割与crRNA 互补的RNA 序列[10]。
为阐述CRISPR/Cas9 的作用机制,这里以目前研究最多的TypeⅡ系统为例进行叙述。CRISPR/Cas9 的抵御机制主要有3 步:首先是间隔序列的获取并成为CPISPR 序列的一部分,然后是CRISPR 序列被转录并加工成一些短的crRNA 序列,最后由crRNA-Cas 核糖核蛋白复合物定位入侵的核苷酸并将其降解[11]。在此作用过程中,不同的蛋白参与以CRISPR 为基础的免疫过程的不同阶段[7]。
3.1 CRISPR间隔序列的获取 CRISPR/Cas9 的防御作用在获取间隔序列这一阶段是最弱的。这一过程中,Cas 蛋白识别外来DNA(噬菌体和质粒DNA),并将这个作为间隔序列的短片段与成倍的重复序列加入到最邻近前导序列的CRISPR 序列的末端,可以说是细菌通过水平转移获得的一个新的特性[5,12]。Cas1 和Cas2 蛋白对于新间隔序列的获得是必须的[13],但具体是怎么发挥作用的目前尚不清楚,主要是通过识别质粒或噬菌体中前体间隔序列来正确定位其插入位置[14]。另外在插入CRISPR 的前体间隔序列中包含着几个碱基的保守间隔相邻基序(Proto-spacer adjacent motifs,PAM),它最终会是重复序列5' 末端的碱基,它在定位入侵的核苷酸中发挥着重要的作用。从免疫学的角度来看,该过程类似于细菌对入侵核苷酸的免疫以及对入侵者产生记忆[5]。
3.2 CRISPR基因座的表达与加工 在获得间隔序列之后,CRISPR 序列将被转录成一条长的pre-crRNA[15],然后在tracrRNA 和宿主的RNase Ⅲ的参与下被加工成一系列小的约为42 nt 的crRNA,它由一个保守的重复序列和一个与入侵核苷酸互补的可变的间隔序列组成。一般情况下,CRISPR 的表达水平是很低的,但当相应的质粒或噬菌体入侵细菌的时候,其表达水平便会被提高[1,16]。
3.3 CRISPR/Cas9对外源DNA的剪切 加工成熟的cr-RNA 在这一阶段会和tracrRNA 一起与Cas9 蛋白组成核糖核蛋白复合物[17],crRNA 中的间隔序列与入侵的质粒或噬菌体中的双链DNA 或单链RNA 发生碱基互补配对,Cas9蛋白在crRNA 和tracrRNA 的引导下在靶序列的特定位点发挥切割作用并将其降解[18],从而防止外来遗传因子的扩散与传播。从免疫学的角度来看表达和剪切过程的话,它类似于接种疫苗的宿主抵抗入侵的核苷酸的免疫应答过程。因此,相比其他抗噬菌体机制,CRISPR/Cas 系统是一个抵抗噬菌体和质粒等的具有识别入侵者特异性、可获得性和遗传性的细菌免疫系统[5]。
目前,对于CRISPR 的研究还处于初级阶段,但科学家们根据CRISPR/Cas9 的特性成功地合成出sgRNA 及Cas9 蛋白[19],它已被作为人工核酸内切酶实现了对某一特定基因的敲除与沉默[17],特别是已有研究表明CRISPR/Cas9 系统能够在真核细胞中发挥作用[17],使真核基因组中的特异性位点发生双链断裂,如斑马鱼的体内试验证实该系统有能力操纵真核基因组的改造[20]。该系统现已被用于人类造血干细胞、小鼠细胞等的基因组改造,如对化脓性链球菌中的CRISPR/Cas9 进行改造后可以在人类的细胞核中被活化,便可以对人类的特异序列进行改造。而且CRISPR/Cas9 对细胞几乎没有毒副作用[21],并且该系统具有可遗传性[5],这为治疗人类的一些基因性疾病带来了希望。通过抑制细菌或古细菌中CRISPR 系统的活性来破坏其获得性免疫系统,这可能加速相关疫苗的研发。另外,许多微生物学家也在通过CRISPR 系统实现对细菌的改造,从而达到抑制其耐药基因的进一步扩散的目的。因此,CRISPR/Cas 系统无疑是兽医领域乃至人医领域的又一大福音。
尽管对CRISPR 的研究正处于迅速发展的阶段,但还有许多问题需要解决。例如,为什么许多原核细胞可以携带多种CRISPR/Cas 类型以及它们是如何协调它们的活性的,对间隔序列是如何获取的了解的也太少,对于许多亚型特异蛋白的功能与结构及在CRISPR/Cas 作用机制中的位置仍然不知道,如何解决脱靶效应,如何提高基因组改造的效率与特异性,如何使其在多种物种中得到应用,如该系统仍未在主要的基因模型果蝇中得到适用等等。这些均需要我们对其深入的研究并透彻的掌握,它将作为新一代的人工核酸内切酶为科研事业做出巨大的贡献,造福于人类。
[1]Marraff ini L A,Sontheimer E J.CRISPR interference:RNAdirected adaptive immunity in bacteria and archaea[J].Nat Rev Genet,2010,11(3):181-190.
[2]Fineran P C,Dy R L.Gene regulation by engineered CRISPRCas systems[J].Curr Opin Microbiol,2014,18:83-89.
[3]Richter H,Randau L,Plagens A.Exploiting CRISPR/Cas:interference mechanisms and applications[J].Int J Mol Sci,2013,14(7):14518-14531.
[4]Bikard D,Marraffini L A.Control of gene expression by CRISPR-Cas systems[J].F1000Prime Rep,2013,5:47.
[5]Gasiunas G,Sinkunas T,Siksnys V.Molecular mechanisms of CRISPR-mediated microbial immunity[J].Cell Mol Life Sci,2014,71(3):449-465.
[6]Rezzonico F,Smits T H,Duffy B.Diversity,evolution,and functionality of clustered regularly interspaced short palindromic repeat(CRISPR)regions in the fire blight pathogen Erwinia amylovora[J].Appl Environ Microbiol,2011,77(11):3819-3829.
[7]Juranek S,Eban T,Altuvia Y,et al.A genome-wide view of the expression and processing patterns of Thermus thermophilus HB8 CRISPR RNAs[J].RNA,2012,18(4):783-794.
[8]Makarova K S,Haft D H,Barrangou R,et al.Evolution and classification of the CRISPR-Cas systems[J].Nat Rev Microbiol,2011,9(6):467-477.
[9]Kuno S,Yoshida T,Kaneko T,et al.Intricate interactions between the bloom-forming cyanobacterium Microcystis aeruginosa and foreign genetic elements,revealed by diversified clustered regularly interspaced short palindromic repeat(CRISPR)signatures[J].Appl Environ Microbiol,2012,78(15):5353-5360.
[10]Vercoe R B,Chang J T,Dy R L,et al.Cytotoxic chromosomal targeting by CRISPR/Cas systems can reshape bacterial genomes and expel or remodel pathogenicity islands[J].PLoS Genet,2013,9(4):e1003454.
[11]Richter C,Chang J T,Fineran P C.Function and regulation of clustered regularly interspaced short palindromic repeats(CRISPR)/CRISPR associated(Cas)systems[J].Viruses,2012,4(10):2291-2311.
[12]Touchon M,Rocha E P.The small,slow and specialized CRISPR and anti-CRISPR of Escherichia and Salmonella[J].PLoS One,2010,5(6):e11126.
[13]Koonin E V,Makarova K S.CRISPR-Cas:an adaptive immunity system in prokaryotes[J].F1000 Biol Rep,2009,1:95-102.
[14]McGhee G C,Sundin G W.Erwinia amylovora CRISPR elements provide new tools for evaluating strain diversity and for microbial source tracking[J].PLoS One,2012,7(7):e41706.
[15]Djordjevic M,Severinov K.CRISPR transcript processing:a mechanism for generating a large number of small interfering RNAs[J].Biol Direct,2012,7:24-29.
[16]Nozawa T,Furukawa N,Aikawa C,et al.CRISPR inhibition of prophage acquisition in Streptococcus pyogenes[J].PLoS One,2011,6(5):e19543.
[17]Cho S W,Kim S,Kim J M,et al.Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease[J].Nat Biotechnol,2013,31(3):230-232.
[18]Karginov F V,Hannon G J.The CRISPR system:small RNAguided defense in bacteria and Archaea[J].Mol Cell,2010,37(1):7-19.
[19]李浩,邱少富,宋宏彬.成簇的规律间隔的短回文重复序列(CRISPR)基因组编辑技术研究进展[J].微生物学通报,2013,53(10):1025-1030.
[20]Gratz S J,Cummings A M,Nguyen J N,et al.Genome engineering of Drosophila with the CRISPR RNA-guided Cas9 nuclease[J].Genetics,2013,194(4):1029-1035.
[21]Mali P,Yang L,Esvelt K M,et al.RNA-guided human genome engineering via Cas9[J].Science,2013,339(6121):823-826.