谢晓蕾,李求春(扬州大学生物科学与技术学院,江苏扬州225009)
在生物进化历史中,细菌一直受到诸多外源因素的侵扰,噬菌体是其中具有极大威胁的一种,因而细菌在生存压力下进化出了多种抵抗噬菌体干扰的机制,如DNA注入抑制、吸附抑制、无效感染等[1]。在细菌体内,基因干扰途径可以通过基因序列保证自身基因的正常表达,同时维持基因组的完整性。该途径的重要性表现在真核生物中即为RNA干扰,另外在很多细菌和古生菌中也存在类似的干扰途径[2]。短回文重复序列CRISPR及其相关Cas(CRISPR associated)基因为大多数细菌以及古细菌提供了一套新的免疫防御系统,以抵御外界遗传物质的入侵,从而维持自身遗传信息的完整性。任何免疫系统的基本要求之一就是能够产生免疫记忆,从而能有效地应对再次感染。CRISPR-Cas免疫系统的特征在于它能记录入侵的外源DNA序列,并以间隔序列的形式将其整合到自身的DNA序列中,从而产生免疫记忆。间隔序列经转录后形成一段短的反义RNA,可与再次入侵的外源DNA序列互补配对,并在Cas蛋白的作用下,使其降解[3],从而抑制外源DNA的转录和翻译,使噬菌体无法在细菌体内生存和繁殖。
1987年,日本大阪大学课题组在研究E.coli K12的碱性磷酸酶时,在该酶的编码基因附近观察到一段串联间隔重复序列,随后研究中发现这种间隔重复序列广泛存在于细菌和古生菌的基因组中[1,4]。MOJICA 等[5]于 2000年提出把CRISPR作为重复序列家族的一类成员,并将其命名为Short Regularly Spaced Repeats(SRSRs)。直到2002年,JANSEN等[6]才将其正式命名为 clustered regularly interspaced short palindromic repects(CRISPR),以更准确的描述这一重复序列的独特结构特征。随着CRISPR的发现,CRISPR的功能逐渐被揭示。2005年,3个研究小组均发现CRISPR的间隔序列与宿主菌染色体外的遗传物质高度同源,推测其可能作为细菌的免疫系统以抵抗外源遗传物质的入侵[7-11]。BARRANGOU等[12]首次在嗜热链球菌(Streptococcus thermophilus)中发现并通过试验证实,细菌能通过CRISPR系统抵抗噬菌体的入侵。随后MARRAFFINI等[13]也发现在葡萄球菌中CRISPR系统能够阻止外源基因的水平转移,同时防止耐药性的产生,从此揭开了CRISPR系统作用机制研究的序幕。2013年,CRISPR介导的基因定位编辑技术出现,研究人员利用这一系统对人类细胞、小鼠、大鼠、斑马鱼、细菌、果蝇、农作物等多种生物的基因进行定向缺失、插入、激活或抑制等遗传改造操作,从而证明了CRISPR技术的广泛应用价值。
最近更新的CRISPR数据库显示,在已完成全基因组测序的90%古生菌和约40%细菌中均可鉴定出至少一个CRISPR位点。不同菌株中的CRISPR位点数量不同,一个原核细胞基因组中通常存在1至几个CRISPR位点[7]。其中詹氏甲烷球菌(Methanocaldococcus jannaschii)的染色体上存在18个CRISPR位点,在目前已研究的原核生物中排第一位[14]。CRISPR位点大多定位在染色体上,只有个别出现在质粒中[15]。
根据Cas基因核心原件序列的不同,CRISPR/Cas免疫系统可分为3种类型,每一种类型具有很多亚型。目前应用最广泛的是II型,也是3种类型中最为简单的一类。I型系统最为复杂,需要6个Cas蛋白参与,其中Cas3蛋白对CRISPR功能的发挥至关重要,该蛋白具有解旋酶活性及DNA酶活性,是干扰阶段的主要作用酶[16]。Ⅱ型系统的组成相对较简单,以Cas9蛋白为核心。干扰阶段,RNAseⅢ在Cas9蛋白存在的情况下发挥作用,Cas9蛋白协助crRNA(CRISPR RNA)的成熟,并参与外源DNA的剪切[17]。在Ⅲ型系统中,Cas6主要参与crRNA的成熟,加工过后的crRNA被运送至特殊的Cas剪切复合体中发挥导向作用[18]。
CRISPR主体为CRISPR基因座(CRISPR locus),基因座上游含有一段前导序列(leader sequence,LS)以及与CRISPR功能相关的基因(CRISPR-associated genes,Cas genes),三者共同构成了CRISPR系统。
3.1 CRISPR基因座 CRISPR基因座由简短稳定的同向重复序列(direct repect,DR)和长度相近的非重复的间隔序列(spacer)间隔排列而成,称为R-S结构。其中重复序列的片段长度在21~48 bp[19],且含有5~7 bp的回文序列,通常能形成稳定的茎环结构,间隔序列的长度在26~72 bp,可能来源于噬菌体、质粒等外源DNA序列。
3.2 cas基因 cas基因是存在于CRISPR位点附近的一系列基因,cas基因簇通常由4~10个保守基因组成[20],它表达出的cas蛋白对CRISPR防御机制的实现不可或缺。cas基因根据其保守程度可分为核心cas基因、亚型特异性cas基因和重复序列相关未知蛋白(repeat-associatedmysteriousproteins,RAMP)组件基因[21]。cas1~6基因广泛存在于各种CRISPR亚型中,故被称为核心cas基因,其编码蛋白的功能现已初步得到证实,例如,Cas1和Cas2蛋白在所有CRISPR类型中均存在,主要在获取新的重复序列过程中发挥作用[22],Cas3则具有核酸酶和解旋酶的功能,主要作用是剪切目标基因[23]。
3.3 Leader序列 前导序列由300~500 bp碱基组成,位于CRISPR的5'端,与第一个重复序列直接相连,是一段在物种内相对保守的AT富集的区域[24]。研究发现,新的R-S总是插入前导序列和第一个重复序列之间,表明前导序列是新插入序列的识别位点,也有研究指出,它能够作为启动子,启动CRISPR基因座的转录[7]。
CRISPR/Cas是一种防御系统,用以保护细菌和古细菌不受外来物质的侵害。这些生物基因组中的CRISPR位点能表达出与入侵病毒基因组序列匹配的crRNA,当微生物再次感染这种病毒时,crRNA能通过互补配对与病毒基因组结合,并表达出相关的Cas酶,这些酶能够切割病毒DNA,从而阻止病毒的基因表达。研究证明,CRISPR作用机制可大致分为3个阶段:适应阶段、表达阶段和干扰阶段[25]。
适应阶段:在外源物质入侵宿主菌后,外来噬菌体或质粒上的一小段DNA序列(前间区序列,protospacers)会以非同源重组的方式被整合到宿主菌的基因组中,整合的位置位于前导序列与第一个重复序列之间[12],且每插入一段外源序列都会伴随着一次重复序列的复制,从而形成新的R-S结构。这一过程使得宿主CRISPR含有外源序列信息,为干扰阶段发挥作用提供基础。宿主对外源DNA序列的选择也并非随机的,研究发现,在前间区序列附近含有一些特定序列称为前间区序列邻近序列(protospacer adjacent motifs,PAMs),如嗜热链球菌的 NNAGAAW 序列[26],不同 CRISPR亚型对于PAM的识别具有特异性。目前,对于CRISPR摄取外源基因的作用机制尚不清楚,有待进一步研究。
表达阶段:CRISPR基因座首先被转录成一段长链的RNA,称为CRISPR RNA前体(Pre-crRNA),同时,Cas蛋白将形成一个具有内切酶功能的复合物,特异性地将crRNA切割加工成小的成熟crRNA。成熟的crRNA会与Cas蛋白复合物结合形成具有特殊功能的Cas/crRNA作用复合体,在干扰阶段发挥作用。
干扰阶段:当宿主再次接触到外界噬菌体或质粒时,crRNA便会与其同源的外源核酸特异性结合,而后通过Cas/crRNA作用复合体将外源核酸切割成碎片,使其无法行使功能,从而达到保护宿主基因组的目的。
5.1 基因定点改造 近年来,RNA干扰(RNAi)、锌指核酸酶(ZFNs)、转录激活因子样效应因子核酸酶(TALENs)已应用于多种类型的细胞和生物模型的基因改造,而CRISPR/Cas作为一种全新的基因定点改造技术引起了国内外学者的广泛关注。
RNAi是一种相对快速、廉价、高通量的基于全基因组的基因定向敲除技术。然而,该技术的敲除效果仍不够理想,不同批次试验以及不同实验室的试验结果都会有所差异,同时也存在不可预知的脱靶情况,所以该方法目前仅用于需要暂时抑制基因发挥功能的试验中,因此局限性大,实用性不强。
ZFNs,又名锌指蛋白核酸酶,是一种人工改造的核酸内切酶,由一个DNA识别域和一个非特异性核酸内切酶构成。该技术能够对靶基因进行定点切割和基因敲除,可显著提高同源重组率,是一种高效成熟的基因改造技术。然而ZNFs虽然具有较高的特异性和精确性,但也会发生极低概率的脱靶事件[27]。
TALENs是一种崭新的分子生物学工具。研究发现,来自植物细菌黄单孢杆菌(Xanthomonas sp.)TAL蛋白的核酸结合域的氨基酸序列与其靶位点的核酸序列有恒定的对应关系,因而利用TAL的序列模块,即可组装成特异的蛋白结构域以结合任意DNA序列,从而达到定向改造内源基因的目的。目前,TALEN的研究尚处于起步阶段,其优点很明显,但在识别的特异性方面和免疫性方面也存在一定的局限性。
ZFNs和TALENs都是利用蛋白质来定位靶序列,这些蛋白质通常很难生成而且成本昂贵。而CRISPRs利用的是RNA,使得设计它们变得较为容易,因而具有很好的应用前景。
2013年1月份美国2家实验室在《Science》杂志发表了基于CRISPR-Cas技术在细胞系中进行基因敲除的新方法,该技术与以往的技术不同,是利用位点特异性的crRNA将Cas9核酸酶带到基因组上的具体靶位点,从而对特定基因位点进行切割。该技术又迅速被运用到基因敲除小鼠和大鼠动物模型的构建中,这意味着一种全新的基因定点改造系统(CRISPR/Cas9)已经出现,其特点是制作简单,成本低,作用高效。
5.2 分子分型 对于同一个物种,CRISPR位点的重复序列绝大多数非常保守[28-29];而间隔序列则具有很强的多态性,即使在同一物种的不同菌株间,间隔序列也往往不同,该性质使得CRISPR位点可以作为细菌分子分型的一个高分辨率的标准[8-9]。SCHOULS 等[30]采用 CRISPR 分型方法对184株空肠弯曲菌进行了分型,分型结果与AFLP、MLST一致性较高。此外,法国研究者对来源于130个血清型的783株沙门菌的CRISPR进行了研究,结果表明,CRISPR序列的多态性与血清型和多位点序列型有着密切的联系,说明CRISPR对于沙门菌具有较高的分辨率,可用于分型研究。同时还建立了间隔序列数据库,为沙门菌分型和基因分型提供数据支持,也为菌株溯源追踪提供信息[31]。CRISPR分型方法与传统的分型方法相比,操作简便,对于基因多态性较低的细菌分辨率较高,而对于基因多态性较高的细菌可将CRISPR与其他分型方法相结合。Liu等将MLST与CRISPR 2种方法相结合建立了一种新的CRISPR-MVLST分型方法,通过对沙门菌的2个毒力基因SseL、FimH和CRISPR序列的研究,对来源于9个血清型的171株沙门菌进行了分型,CRISPR序列的加入显著提高了个别疾病爆发菌株的区分能力,另外,该分型方法对肠炎沙门菌的区分能力要高于PFGE[32]。这表明CRISPR可以作为一种新的分型方法,并具有广阔的运用前景,另外CRISPR中的间隔序列提供了细菌所处的外界环境信息,也可以为细菌的溯源追踪提供信息。
CRISPR/Cas系统作为原核细胞的适应性免疫系统,不仅具有特异性和记忆性,还具有可遗传性。CRISPR的间隔序列高度可变、迅速进化[32-33],新间隔序列的获得需要很多因素的作用及相关蛋白的辅助。间隔序列的获得使得细菌能够很快适应外界环境,也有研究指出,在宿主CRISPR位点中重复序列与间隔序列构成的结构有时也会被删除[9,20,26,33],被删除的部分大多是位于 CRISPR 3'端较为保守的间隔序列。这些间隔序列的删除可能是因为CRISPR的重复序列间发生了同源重组所导致的[34],对CRISPR位点的大小和转录长度的控制具有重要的作用。CRISPR在参与原核细胞的获得性免疫的同时,在细菌和噬菌体两者的共同进化过程中发挥着重要作用。事实上,在前间区序列中或前间区序列邻近序列中,单一核苷酸的改变能使噬菌体逃避CRISPR免疫机制[33]。尽管目前对CRISPR作用机制具有大致的了解,但现阶段还存在许多问题有待更深入的研究和探索。
[1]STURINO J M,K LAENHAMMER T R.Engineered bacteriophage-defence systems in bioprocessing[J].Nat Rev Microbiol,2006,4(5):395 -404.
[2]LIU L,FAN X D.CRISPR-Cas system:a powerful tool for genome engineering[J].Plant Mol Biol,2014,85:209 -218.
[3]HELER R,LUCIANO A,MARRAFFINI LA,et al.Adapting to new threats:the generation of memory by CRISPR-Cas immune systems[J].Molecular Microbiology,2014,93(1):1 -9.
[4]ISHINO Y,SHINAGAWA H,MAKINO K,et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J].Bacteriol,1987,169(12):5429 -5433.
[5]MOJICA FJ,DIEZ-VILLASENOR C,SORIA E,et al.Biological significance of a family of regularly spaced repeats in the genomes of Archaea,Bacteria and mitochondria[J].Mol Microbiol,2000,36(1):244 -246.
[6]JANSEN R,EMBDEN J D,GAASTRA W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43(6):1565-1575.
[7]LILLEST-L R,REDDER P,GARRETT RA,et al.A putative viral defence mechanism in archaeal cells[J].Archaea,2006,2(1):59 -72.
[8]MOJICA F J,DIEZ-VILLASENOR C,GARCIA-MARTINEZ J,et al.Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J].J Mol Evol,2005,60(2):174 -182.
[9] POURCEL C,SALVIGNOL G,VERGNAUD G.CRISPR elements in Yersinia pestisacquire new repeats by preferential uptake of bacteriophage DNA,and provide additional tools for evolutionary studies[J].Microbiology,2005,151(Pt 3):653 -663.
[10]BOLOTIN A,QUINQUIS B,SOROKIN A,et al.Clustered regularly interspaced short palindrome repeats(CRISPRs)have spacers of extrachromosomal origin[J].Microbiology,2005,151(Pt 8):2551 -2561.
[11]PRANGISHVILI D,FORTERRE P,GARRETT R A.Viruses of the Archaea:a unifying view[J].Nat Rev Microbiol,2006,4(11):837 -848.
[12]BARRANGOU R,FREMAUX C,DEVEAU H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315(5819):1709-1712.
[13]MARRAFFINI L A,SONTHEIMER E J.CRISPR Interference Limits Horizontal Gene Transfer in Staphylococci by Targeting DNA[J].Science,2008,322(5909):1843 -1845.
[14]BULT C J,WHITE O,OLSEN G J,et al.Complete genome sequence of the methanogenic archaeon,Methanococcus jannaschii[J].Science,1996,273(5278):1058 -1073.
[15]SOREK R,KUNIN V,HUGENHOLTZ P.CRISPR-a widespread system that provides acquired resistance against phages in bacteria and archaea[J].Nat Rev Microbiol,2008,6(3):181 -186.
[16]SINKUNAS G,GASIUNAS G,FREMAUX C,et al.Cas 3 is a single-stranded DNA nucleaseand ATP-dependent helicaseinthe CRISPR/Cas immunesystem[J].EMBOJ,2011,30(7):1335 -1342.
[17]DELTCHEVA E,CHYLINSKI K,SHARMA C M,et al.CRISPR RNA maturation by trans-encoded small RNA and host factor RNase[J].Nature,2011,471(7340):602 -607.
[18]WANG R,PREAMPLUME G,TERNS M P,et al.Interactionof the Cas6 riboendonuclease with CRISPR RNAs:recognition and cleavage[J].Structure,2011,19(2):257 -264.
[19]GRISSA I,VERGNAUD G,POURCEL C.The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8:172.
[20]GRISSA I,VERGNAUD G ,POURCEL C,et al.The CRISPR database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8:172.
[21]HAFT D H,SELENGUT J,MONGODIN E F,et al.A guild of 45 CRISPR-associated(Cas)protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes[J].PLoS Comput Biol,2005,1(6):60.
[22]WIEDENHEFT B,ZHOU K,JINEK M,et al.Structural basisfor DNase activityof a conserved protein implicated in CRISPR-mediated genomedefense[J].Structure,2009,17(6):904 -912.
[23]HAN D,KRAUSS G.Characterization of the endonuclease SSO2001 from Sulfolobus solfataricus P2[J].FEBS Lett,2009,583(4):771 -776.
[24]JANSEN R,VAN EMBDEN J D,GAASTRA W,et al.Identificationof a novel family of sequence repeats among prokaryotes[J].OMICS,2002,6(1):23-33.
[25]MARRAFFINI LA,SONTHEIMER EJ.CRISPR interference:RNA-directed adaptive immunity in bacteria and archaea[J].Nat Rev Genet,2010,11(3):181-190.
[26]DEVEAU H,BARRANGOU R,GARNEAU J E,et al.Phage response to CRISPR-encoded resistance in Streptococcus thermophilus[J].Bacteriology,2008,190(4):1390 -1400.
[27]DAVIS D,STOKOE D.Zinc finger nucleases as tools to understand and treat human diseases[J].BMC Med,2010,8:42.
[28]JANSEN R,EMBDEN J D,GAASTRA W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43(6):1565 -1575.
[29]KUNIN V,SOREK R,HUGENHOLTZ P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J].Genome Biol,2007,8(4):61.
[30]SCHOULS LM,REULEN S,DUIM B,et al.Comparative genotyping of Campylobacter jejuni by amplified fragment length poly-morphism,multilocus sequence typing,and short repeat sequencing:strain diversity,host range,and recombination[J].J Clin Microbiol,2003,41(1):15 -26.
[31]FABRE L,ZHANG J,GUIGON G,et al.CRISPR typing and subtyping for improved laboratory surveillance of Salmonella infections[J].PloS One,2012,7(5):36995.
[32]HEIDELBERG J F,NELSON W C,SCHOENFELD T,et al.Germ warfare in a microbial mat community:CRISPRs provide insights into the co-evolution of host and viral genomes[J].PLoS One,2009,4(1):4169.
[33]HORVATH P,ROMERO D A,COUTE-MONVOISIN A,et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus[J].Bacteriology,2008,190(4):1401 -412.
[34]WILMES P,SIMMONS S L,DENEF V J,et al.The dynamic genetic repertoire of microbial communities[J].FEMS Microbiol Rev,2009,33(1):109-132.