姜晓洁 姜晓
CRISPR/Cas9的发展及在基因组编辑中的应用
姜晓洁①姜晓②*
(①山东省海阳市动物疫病预防与控制中心 265100 ②山东省海阳市留格庄镇畜牧兽医站)
CRISPR/Cas9系统为研究基因的功能和疾病的发生提供了一种简单有效的基因操作工具。CRISPR/Cas9由一个非特异性的Cas9核酸酶和一组可编辑的序列特异性CRISPR-RNA(crRNA)组成,而crRNA能够指导Cas9蛋白在靶位点使DNA产生双键断裂从而线性化DNA。随后胞内的DNA修复过程导致了靶向位点DNA的插入,删除和替代。CRISPR/Cas9介导的DNA线性化的特异性受到crRNA序列配对和靶向位点上游PAM区的影响。本文将介绍CRISPR/Cas9在基因组编辑中的机制及未来在基因编辑和临床治疗中的应用。
DNA的重组和操作技术在过去的60年有了重大的发展。这个发展开始于DNA双螺旋的发现,随后DNA的化学合成及检测技术为研究基因功能建立了基础。酶切和PCR技术的发展为基因的扩增及其在体外,细胞和模式动物的突变提供了一种可行的方法。随后,基因组测序技术及产生的不同物种的整个的基因组数据在过去20年有了长足的发展。近几年,起源于细菌的获得性免疫系统的CRISPR/Cas9技术为转化生物学提供了稳定的基因组编辑技术。
自从DNA的双链结构发现之后,研究者便致力于研究细胞和微生物中基因碱基位点的特异性突变[1]。许多基因组编辑技术的早期方法主要依赖于基因组序列位点特异性的识别方法。细菌和酵母的天然的DNA修复和重组途径揭示了细胞中DNA双键断裂后自我修复的分子机制。因此,细胞中DNA的断裂为基因组的打靶提供了一种可行的方案[2-5]。早期的DNA靶向线性化的方法主要依赖于寡聚核苷酸和小分子对DNA碱基对的修复识别。随后,基因组编辑中内含子的自我剪切为位点特异性的DNA线性化和整合提供了一种新的思路[6, 7]。大约在同一时间,ZFNs(Znic-Finger Nulcease,锌指核酸酶)介导了模式化的DNA识别蛋白产生,当这个蛋白与限制性内切酶Fok I识别的特异性结构域结合时,在特异性的位点能够造成DNA序列的有效断裂,而ZFNs技术在果蝇和哺乳动物细胞染色体中的识别被证明是有效的[8-9]。尽管ZFNs技术对某些实验中的基因编辑技术是完全有效的,但其在任意位点设计和证明的难度决定了其不能广泛地应用于物种的基因组编辑中。随后,与ZFNs原理类似的TALENs (Transcri-ption activator–like effectors)技术的应用能够耦合Fok I内切酶从而造成DNA特异性位点的断裂[10-12]。相对于ZFNs技术,TALENs在基因组编辑中更灵活和有效,但是蛋白设计合成的难度仍然是制约其发展的一个重要原因。
(1)CRISPRs系统首先在大肠杆菌基因组中被发现,随后在多数的细菌和古生菌中被发现并预言了其在DNA修复和调控中的可能机制[13-14]。在2005年一个重要的发现证明CRISPRs的基因间隔序列都从病毒的质粒分化而来,同时明确了编码核酸酶和解旋酶相关的Cas基因蛋白[15]。2007年,噬菌体感染乳酸嗜热链球菌的实验证明了CRISPR/Cas系统介导的获得性免疫,这个发现也证明了CRISPR/Cas存在于牛奶生产工艺中的细菌中,而这些细菌的存在能够有效地控制噬菌体带来的污染[16]。2008年,成熟的CRISPR RNAs能够作为Cas蛋白的向导干扰影响大肠杆菌的病毒的分化。同时,在表皮葡萄球菌中发现了CRISPR/ Cas系统介导的DNA靶向剪切活性[17-18]。(2)功能性的CRISPR是由CRISPR阵列重复,DNA靶向序列间隔以及编码crRNA组分和Cas蛋白操纵子的组分构成[19]。自然环境下,病毒能够通过CRISPR间隔序列与细菌发生匹配,而病毒能够在CRISPR介导的毒力减弱过程中不断发生变化。获得性免疫的发生由三个阶段组成[20]:第一个阶段是病毒的DNA短序列作为CRISPR系统的基因间隔序列插入;第二个阶段是crRNA前体的产生和成熟并最终产生个体识别的crRNAs;而第三个阶段则是Cas蛋白和tracrRNA或crRNA介导的外源核酸序列的线性化。在整个的过程中,三种CRISPR/Cas系统均能够使外源DNA的产生线性化[21-22]。在这三种CRISPRs系统中,I型的和III型的都利用一个大的Cas蛋白对crRNA进行靶向的剪切,而II型的CRISPR系统则仅仅利用一个单独的Cas蛋白进行RNA介导的DNA识别和线性化[23, 24],这对于基因组的编辑应用具有重要的意义。
(1)Cas9的生物信息学分析表明其拥有两个潜在的酶切结构域,分别是HNH结构域和RuvC结构域[25],前期的研究表明嗜热链球菌的Cas9对于抵御病毒的入侵有重要的作用,其作用的机理可能是介导了入侵的质粒和噬菌体基因组的双键断裂(DSBs)[26]。而在此过程中,HNH结构域和RuvC结构域能够影响外源质粒的降解效率。(2)而与序列特异性相关的成熟的crRNA则受到II型的CRISPR/Cas9蛋白上游tracrRNA(转录激活crRNA)调控。成熟的crRNA对于RNA介导的靶向位点DNA的内切有重要的作用。Cas9蛋白的HNH结构域能够与crRNA中的20个核苷酸互补从而使序列线性化。而RuvC结构域则能够线性化DNA的另一条互补链[23]。HNH结构域和RuvC结构域的单独突变会造成单链DNA单链的断裂活性,然而HNH结构域和RuvC结构域的同时突变会形成RNA介导的DNA连接蛋白。外源DNA的识别需要靶序列上游与crRNA的配对的短序列和毗邻靶序列的PAM同时存在[23, 24]图1)。(3)实际应用中,crRNA被编辑成具有先导作用的sgRNA。而sgRNA保留了两个重要的特征,其5’端的20bp核苷酸序列决定了DNA的识别位点,而与其互补的3’序列能够与Cas9结合。sgRNA的这个简单的双分系统能够利用CRISPR/Cas系统编辑任何毗邻PAM的序列[23]。与ZNFs系统和TALENs系统不同,CRISPR/Cas系统对DNA的编辑仅仅是需要sgRNA的改变。基于此原因,CRISPR系统被广泛应用于基因组的打靶、编辑和修饰过程中。
图1:CRISPR/Cas9 II型系统的结构和生物学功能
A.CRISPR/Cas9系统的结构和操纵单元 B.CRISPR/Cas系统介导的主动防御及外源DNA的断裂和降解 C:TracrRNA和crRNA介导的DNA线性化过程[1]
(1)分子结构观察表明Cas9通过先导RNA与靶向DNA结合时,其分子构象会发生重排变化。这种变化会使Cas9蛋白完全包裹RNA-DNA的结合位点。而Cas9蛋白的两翼则被富含精氨酸的α螺旋所桥接,而这种结构对于RNA介导的DNA突变位点的识别有重要的意义[27, 28]。因此,Cas9分子构象的改变可能是RNA靶向定位DNA分子的一个重要原因。而PAM的存在对于DNA的识别同样有重要的意义,缺少了PAM结构域,即使先导RNA序列能够和靶序列完全匹配,Cas9蛋白也不能识别。Cas9蛋白与先导链RNA和靶点DNA形成的晶体结构证明PAM位于碱基配对的DNA结构内[29]。Cas9蛋白C末端的精氨酸模体结构域与非互补链的PAM结构域均位于Cas9两个基团形成的大沟内。而靶向DNA的磷酸二酯与位于小沟内的PAM相互作用导致位于PAM上游的靶向DNA链的形成解链结构(R-loop)[30]。单分子的实验证明R-loop的结合速度主要受PAM的影响,而其稳定性则主要由PAM上游的间隔序列决定。综上,靶向DNA的解链开始于PAM的识别,最终导致R-loop结构的形成,伴随着RNA的侵入最终形成RNA-DNA的杂交结构(图2)。(2)为评估CRISPR /Cas9在细胞中与靶位点的结合能力,研究者用高通量测序和免疫共沉积技术确定了Cas9在基因组中连接位点的数量和类型。结果表明在人和小鼠的细胞中,Cas9能够与基因组上与sgRNA配对的许多非激活位点结合[31, 32]。而Cas9与这些脱靶位点的结合主要受到PAM结构域和配对的先导链RNA序列的影响。激活的Cas9不能线性化脱靶位点的DNA序列表明了其活性与靶位点DNA的结合能力,序列配对有重要的联系。另外,相对于紧缩的染色体结构,Cas9蛋白与开放的染色体的结合能力更强(图2)。
图2 Cas9蛋白的结构和功能[37]。tracrRNA和sgRNA介导的Cas9蛋白对DNA靶位点的识别
Cas9酶能够通过RuvC和HNH的酶切结构域将靶向DNA切成平末端的双键断裂(DSB)的DNA。Cas9蛋白能够通过RuvC和HNH酶切结构域的点突变使DNA产生单链的断裂(SSB)。而单链DNA的非同源末端修复(NHEJ)相对于基因重组修复(HR)有更高的忠诚性。为了提高DSB修复的忠诚性,一种类似于ZNFs和TALENs高忠诚性修复的方法被发现[33, 34],应用成对的sgRNAs和Cas9 (HNH+/RuvC-结构域)突变体(D10A)能够有效的提高DNA双链中的插入缺失效率,这种方法能够产生具有粘性末端的双键断裂,当外源同源臂和目的基因存在时,基因的同源重组修复能够使目的基因有效的插入到突变点。而这种DNA双键断裂的方案在sgRNA过短或者存在错配过多,其脱靶性显著的增加[35]。而sgRNA的合适设计和Cas9的合理使用会显著的提高其忠实性。
(1)从CRISPR系统被证明能够有效的编辑人类细胞开始,经过人工改造的Cas9蛋白和人类设计的sgRNAs以及tracrRNA被证明能在人的胚胎干细胞,小鼠的细胞中共表达。在靶向的位点产生了靶向的DNA双键断裂(DSBs),从而激活了RNA介导的DNA非同源末端的基因修复和基因的替换。同时多重的基因打靶也被证明具有可行性。这项技术与TALENs和ZNFs技术相比,其基因编辑的效率能达到80%[36-38]。(2)迄今为止,Cas9蛋白已经广泛的有效的应用于多个物种和细胞系的基因编辑中,这些物种包括人类的细胞系,细菌,酵母,斑马鱼,小鼠,猪和猴子[39, 40]。同时,Cas9也能引起同一物种的不同基因的突变。Cas9能够与crRNA和tracr RNA,sgRNAs配对到靶位点,而影响Cas9活性的主要因素则是位于靶位点下游的PAM区。与早期的Cas9系统的应用所不同的是,sgRNA上游增加48bp长度的tracrRNA会形成更高水平的NHEJ(非同源末端连接)。增加的tracrRNA对于sgRNA的稳定性以及Cas9-sgRNA-DNA的末端复合物的形成具有重要作用。这种设计表明sgRNA的结构对于Cas9的活性起重要的作用[41-43]。(3)CRISPR/Cas系统的共性是通过改变不同的pre-crRNA,其能同时线性化许多共同的靶位点,利用其这个特点能够有效的同时干扰多个基因的表达。事实上,Cas9基因和多重的sgRNA的共表达能够在哺乳动物细胞中形成有效的基因编辑。
(1)Cas9蛋白现在已经广泛应用于不同物种的靶向基因编辑中,而Cas9的靶向定位能够大规模实现基因组的干扰从而有利于检测基因的功能或者阐明基因的可变剪切。另外,野生型的Cas9能够通过抑制催化结构域的激活从而转变成RNA介导的生物学工具。而Cas9与调控元件模块的融合则能够提高Cas9在基因编辑中的效率[37]。(2)Cas9介导的加速了转基因细胞和动物模型的建立。通过患病体细胞的基因突变,CRISPR/ Cas9能够快速的建立疾病的细胞模型,同时能够利用ES和IPS细胞疾病模型实现转基因动物模型的建立[37]。(3)在细胞模型的建立中,可以通过转染携带有sgRNA质粒和Cas9蛋白实现的基因打靶模型的建立。此外,Cas9的多重功能能够为人类的普通疾病提供可行的解决方案。大规模的基因组分析能够评估疾病带来的风险,然而,疾病是由哪种可变剪切引起无法预料,利用Cas9蛋白则能够探测出可变剪切对基因功能的影响[38]。(4)在动物模型的建立中,编辑好的sgRNA和Cas9 可以通过原核注射的方法注入到受精卵中实现遗传基因的修饰。这种方法减少了利用体细胞核移植技术制造转基因动物的时间和成本。而猕猴模型的多基因的打靶动物的出生表明了人类疾病可以通过灵长类动物建立模型。另外,Cas9在体细胞中的直接应用避免了胚胎的操作同时为生物治疗的建立提供原材料。然而在利用CRISPR/Cas9系统和原核注射技术建立转基因嵌合体动物模型的过程中仍然存在效率较低的问题。因为在受精卵早期,胚胎中基因的表达和活性直到第一次有丝分裂开始才被激活。而NHEJ介导的基因修复能够引入随机长度DNA的插入突变,这种转录的延迟可能在CRISPR修饰的嵌合体小鼠生产过程中降低其效率[37, 38, 43]。
CRISPR/Cas9系统的发现为基因的编辑技术提供了一种可行的方案,同时这项技术也为研究基因的功能和基因缺陷性疾病提供了简单有效的工具。而未来的研究对于提高CRISPR/Cas9的忠实性,降低其脱靶效率有重要的意义。而最新的基因组测序技术将有助于提高sgRNA的靶位点的特异性。
[1] Doudna J A, Charpentier E. The new frontier of genome engineering with Crispr/Cas9[J]. Science, 2014, 346(6213): 1258096.
[2] Rong Y S, Golic K G. Gene targeting by homologous recombination in Drosophila[J]. science, 2000, 288(5473): 2013-2018.
[3] Plessis A, Perrin A, Haber J E, et al. Site-specific recombination determined by I-SceI, a mitochondrial group I intron-encoded endonuclease expressed in the yeast nucleus[J]. Genetics, 1992, 130(3): 451-460.
[4] Rouet P, Smih F, Jasin M. Introduction of double-strand breaks into the genome of mouse cells by expression of a rare-cutting endonuclease[J]. Molecular and cellular biology, 1994, 14(12): 8096-8106.
[5] Choulik A, Perrin A, Dujon B, et al. Induction of homologous recombination in mammalian chromosomes by using the I-SceI system of Saccharomyces cerevisiae[J]. Molecular and cellular biology, 1995, 15(4): 1968-1973.
[6] Strobel S A, Dooucette-stamml A, Ribe L, et al. Site-specific cleavage of human chromosome 4 mediated by triple-helix formation[J]. Science, 1991, 254(5038): 1639-1642.a
[7] Faruoi A F, Egholm M, Glazer P M. Peptide nucleic acid-targeted mutagenesis of a chromosomal gene in mouse cells[J]. Proceedings of the National Academy of Sciences, 1998, 95(4): 1398-1403.
[8] Bibilova M, Beumer K, Trautman J K, et al. Enhancing gene targeting with designed zinc finger nucleases[J]. Science, 2003, 300(5620): 764-764.
[9] Bibilova M, Golic M, Golic K G, et al. Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases[J]. Genetics, 2002, 161(3): 1169-1175.
[10] Baoch J, Scholze H, Schornack S, et al. Breaking the code of DNA binding specificity of TAL-type III effectors[J]. Science, 2009, 326(5959): 1509-1512.
[11] Moscou M J, Bogdanove A J. A simple cipher governs DNA recognition by TAL effectors[J]. Science, 2009, 326(5959): 1501-1501.
[12] Christian M, Cermak T, Doyle E L, et al. Targeting DNA double-strand breaks with TAL effector nucleases[J]. Genetics, 2010, 186(2): 757-761.
[13] Makarova K S, Aravind L, Grishin N V, et al. A DNA repair system specific for thermophilic Archaea and bacteria predicted by genomic context analysis[J]. Nucleic acids research, 2002, 30(2): 482-496.
[14] Guy C P, Majernik A I, Chong J P J, et al. A novel nuclease-ATPase (Nar71) from archaea is part of a proposed thermophilic DNA repair system[J]. Nucleic acids research, 2004, 32(21): 6176-6186.
[15] Haft D H, Selengut J, Mongodin E F, et al. A guild of 45 Crispr-associated (Cas) protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes[J]. PLoS Comput Biol, 2005, 1(6): e60.
[16] Barrangou R, Horvath P. Crispr: new horizons in phage resistance and strain identification[J]. Annual review of food science and technology, 2012, 3: 143-162.
[17] Brouns S J J, Jore M M, Lundgren M, et al. Small Crispr RNAs guide antiviral defense in prokaryotes[J]. Science, 2008, 321(5891): 960-964.
[18] Marraffini L A, Sontheimer E J. Crispr interference limits horizontal gene transfer in staphylococci by targeting DNA[J]. science, 2008, 322(5909): 1843-1845.
[19] Sun C L, Barrangou R, Thomas B C, et al. Phage mutations in response to Crispr diversification in a bacterial population[J]. Environmental microbiology, 2013, 15(2): 463-470.
[20] Barrangou R, Marraffini L A. Crispr/Cas systems: prokaryotes upgrade to adaptive immunity[J]. Molecular cell, 2014, 54(2): 234-244.
[21] Baondy-denomy J, Davidson A R. To acquire or resist: the complex biological effects of CRISPR–Cas systems[J]. Trends in microbiology, 2014, 22(4): 218-225.
[22] Makarova K S, Aravind L, Wolf Y I, et al. Unification of Cas protein families and a simple scenario for the origin and evolution of Crispr/Cas systems[J]. Biol Direct, 2011, 6(1): 38.
[23] Jinek M, Chylinski K, Fonfara I, et al. A programmable dual-RNA–guided DNA endonuclease in adaptive bacterial immunity[J]. Science, 2012, 337(6096): 816-821.
[24] Gasiunas G, Barrangou R, Horvath P, et al. Cas9–crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria[J]. Proceedings of the National Academy of Sciences, 2012, 109(39): E2579-E2586.
[25] Makarovs K S, Grishin N V, Shabalina S A, et al. A putative RNA-interference-based immune system in prokaryotes: computational analysis of the predicted enzymatic machinery, functional analogies with eukaryotic RNAi, and hypothetical mechanisms of action[J]. Biology direct, 2006, 1(1): 7.
[26] Deltcheva E, Chylinski K, Sharma C M, et al. Crispr RNA maturation by trans-encoded small RNA and host factor RNase III[J]. Nature, 2011, 471(7340): 602-607.
[27] Jinek M, Jiang F, Taylor D W, et al. Structures of Cas9 endonucleases reveal RNA-mediated conformational activation[J]. Science, 2014, 343(6176): 1247997.
[28] Nishimasu H, Ran F A, Hsu P D, et al. Crystal structure of Cas9 in complex with guide RNA and target DNA[J]. Cell, 2014, 156(5): 935-949.
[29] Anders C, N aiewoehner O, Duerst A, et al. Structural basis of PAM-dependent target DNA recognition by the Cas9 endonuclease[J]. Nature, 2014, 513(7519): 569-573.
[30] Szczelkun M D, Tikhomirovs M S, Sinkunas T, et al. Direct observation of R-loop formation by single RNA-guided Cas9 and Cascade effector complexes[J]. Proceedings of the National Academy of Sciences, 2014, 111(27): 9798-9803.
[31] Kuscu C, Arslan S, Singe R, et al. Genome-wide analysis reveals characteristics of off-target sites bound by the Cas9 endonuclease[J]. Nature biotechnology, 2014, 32(7): 677-683.
[32]Wux, Scott D A, Kriz A J, et al. Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells[J]. Nature biotechnology, 2014, 32(7): 670-676.
[33] Mali P, Aach J, Stranges P B, et al. CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering[J]. Nature biotechnology, 2013, 31(9): 833-838.
[34] Ran F A, Hsu P D, Lin C Y, et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity[J]. Cell, 2013, 154(6): 1380-1389.
[35] Fu Y, Sander J D, Reyon D, et al. Improving Crispr/Cas nuclease specificity using truncated guide RNAs[J]. Nature biotechnology, 2014, 32(3): 279-284.
[36] Mail P, Esvelt K M, Church G M. Cas9 as a versatile tool for engineering biology[J]. Nature methods, 2013, 10(10): 957-963.
[37] Hsu P D, Lander E S, Zhang F. Development and applications of CRISPR/Cas9 for genome engineering[J]. Cell, 2014, 157(6): 1262-1278.
[38] Sander J D, Joung J K. Crispr/Cas systems for editing, regulating and targeting genomes[J]. Nature biotechnology, 2014, 32(4): 347-355.
[39] Gratz S J, Cummings A M, Nguyen J N, et al. Genome engineering of Drosophila with the CRISPR RNA-guided Cas9 nuclease[J]. Genetics, 2013, 194(4): 1029-1035.
[40] Chang N, Sun C, Gao L, et al. Genome editing with RNA-guided Cas9 nuclease in zebrafish embryos[J]. Cell research, 2013, 23(4): 465-472.
[41] Wang H, Yang H, Shivalila C S, et al. One-step generation of mice carrying mutations in multiple genes by CRISPR/Cas-mediated genome engineering[J]. Cell, 2013, 153(4): 910-918.
[42] Cheng A W, Wang H, Yang H, et al. Multiplexed activation of endogenous genes by CRISPR-on, an RNA-guided transcriptional activator system[J]. Cell research, 2013, 23(10): 1163-1171.
[43] Niu Y, Shen B, Cui Y, et al. Generation of gene-modified cynomolgus monkey via Cas9/RNA-mediated gene targeting in one-cell embryos[J]. Cell, 2014, 156(4): 836-843.
(2019–09–30)
S818.9
A
1007-1733(2019)10-0077-04