徐华山等
摘 要:基因组编辑技术是进行农作物基因功能研究和遗传改良的重要辅助工具,目前已经成熟应用的基因组编辑技术包括ZFNs、TALENs以及近几年兴起的CRISPR/Cas系统。该文介绍了ZFNs、TALENs及CRISPR/Cas系统的研究进展、各自的优缺点以及在植物中的应用,并对基因组编辑技术的应用前景进行了展望。
关键词:基因组编辑;ZFNs;TALENs;CRISPR/Cas;植物
中图分类号 Q78 文献标识码 A 文章编号 1007-7731(2015)18-15-05
随着现代分子生物学的飞速发展,越来越多的物种基因组测序完成,研究基因功能成为了科学家下一步的工作重心。基因组编辑技术被《Science》评为2012年十大重要科学进展之一,利用基因组编辑技术对植物基因进行改造是进行农作物遗传改良的重要辅助手段。目前应用最多的基因组编辑技术主要包括锌指核酸酶(zinc-finger nucleases,ZFNs)[1-2],类转录激活因子效应物核酸酶(transcription activator-like nucleases,TALENs)[3-4]以及CRISPR/Cas9系统[5]。ZFNs是第一种由人工改造应用的核酸内切酶,由含有锌指结构域的转录因子和非特异性的核酸内切酶Fok I 的切割结构域融合而成。尽管ZFNs成功应用于多种生物的基因组编辑,但是设计困难、组装昂贵、耗时长、失败概率高等缺点限制了该技术的发展与应用。TALENs是利用类转录激活因子效应物DNA结合结构域和非特异性的核酸内切酶Fok I 的切割结构域融合而成的核酸内切酶。TALENs实现了单个蛋白质与单个核苷酸的对应,与ZFNs相比更易组装设计,打靶效率也更高[6-8]。2013年初,基于细菌获得性免疫系统改造的由RNA介导的全新人工核酸酶CRISPR/Cas9系统出现了,与ZFNs和TALENs相比,该系统只需设计和目标核苷酸对应的RNA序列即可,操作手段更简单,效率更高,成本更低,适合普通分子生物学实验室操作,为基因组编辑提供了新的平台。本文就3种基因组编辑技术的作用原理、结构特征及使用特点等方面进行介绍,并对基因组编辑技术在植物基因编辑中的应用进行了展望。
1 ZFNs、TALENs和CRISPR/Cas系统的原理及特点
1.1 ZFNs技术 锌指核酸酶(ZFNs)是应用较早的一类基因组编辑技术。该酶的N端是锌指蛋白DNA结合域,可以识别并结合含特定碱基序列的DNA,C端是非特异性核酸酶Fok I的切割结构域。锌指蛋白根据保守结构域的不同可以分为C2H2型、C4型和C6型,研究应用比较多的是C2H2型。这种锌指蛋白由30个氨基酸构成并围绕锌离子折叠成ββα结构,α螺旋插入DNA双螺旋中可以特异识别DNA序列上的3个连续碱基并与之结合[9-10]。
人工合成的锌指核酸酶由可以特异性识别DNA序列的锌指蛋白和非特异性的核酸内切酶FokI组成。锌指蛋白结构域通常含有3~4个锌指结构,每个锌指结构可以特异性识别DNA上的3个连续碱基,因此每个锌指核酸酶通常可以特异性识别9~12bp的DNA序列。锌指核酸酶与靶DNA结合后,FokI便在结合位点进行剪切造成DNA断裂。如果切割时存在同源序列,则会发生DNA同源重组修复(HR),不存在同源序列时则以非同源末端连接(NHEJ)的方式进行DNA修复,造成基因缺失、突变或碱基插入[11-12]。目前锌指蛋白的设计和筛选方法主要有以下几种:一是利用Sangamo Biosciences公司的专利设计锌指核酸酶,该方法效率高,特异性强,可以商业化订制,但是价格比较昂贵。二是利用开放平台Oligomerized Pool Engineering(OPEN)设计锌指核酸酶,该方法免费向公众开放,但是构建过程需2~3个月,费时费力。后来Joung等又开发了上下文依赖组装(context-dependent assembly,CoDA)方法,可以在网站(http://www.zincfingers.org/)上直接设计构建,但是报道显示该方法的成功率并不太高[13]。
1.2 TALENs技术 随着重复可变双残基(repeat variable di-residues,RVDs)与核苷酸对应关系的破解,类转录激活因子效应物核酸酶(transcription activator-like nucleases,TALENs)的研究与应用进入快速发展阶段,成为新的主流基因组编辑工具[6]。
与ZFNs类似,TALENs也由特异性蛋白与非特异性核酸酶FokI2个部分组成,特异性蛋白负责识别目标DNA序列并引导FokI对DNA进行切割,造成DNA断裂,断裂的DNA通过HR或NHEJ机制进行修复。TALE蛋白来源于黄单胞杆菌Xanthomonas,这是一种对农业生产有较大危害的植物病原菌。TALE蛋白的N端含有III型分泌信号肽,C端包含核定位信号(Nuclear localization signal,NLS)以及转录激活结构域(Activation domain,AD),中间是决定特异性的DNA识别结合结构域[14]。DNA识别结合结构域由多个重复氨基酸单元串联组成,每个单元含有34个氨基酸。每个重复单元的氨基酸序列几乎一致,仅第12和13位可变,这2个可变氨基酸残基称为重复可变双残基(repeat variable di-residues,RVDs),每个重复单元可识别结合1个核苷酸,特异性就由RVDs决定。研究发现共有4种RVDs,每种RVDs特异识别结合1种核苷酸,其中NI(天冬酰胺和亮氨酸)识别碱基A,NN(2个天冬酰胺)识别碱基G或A,NG(天冬酰胺和甘氨酸)识别碱基T,HD(组氨酸和天冬氨酸)识别碱基C。因此RVDs的类型、数目及顺序决定了TALENs识别DNA序列的特异性[15-16]。由于RVDs与核苷酸对应关系比较简单,每个RVDs特异识别结合1种核苷酸,因此与ZFNs相比,TALENs的可作用靶位点十分广泛。每个TALENs大约包含20个左右的重复单元,组装过程比较复杂,目前其组装方法主要有以下3种:标准的限制性酶切和连接组装法、Golden Gate组装法及固相组装法[17]。Golden Gate组装法花费少、构建周期短、工作量小,是目前应用最为广泛的组装方法,该方法利用IIS型核酸酶创造多粘性末端,一次反应即可轻松连接多达10个重复单元。目前TALENs技术已经在多种植物如烟草、水稻、短柄草及拟南芥中得到广泛应用。
1.3 CRISPR/Cas系统 继ZFNs和TALENs之后,针对CRISPR/Cas系统的研究与应用逐渐增多。与ZFNs和TALENs相比,作为后起之秀的CRISPR/Cas系统在基因组编辑方面载体构建简单,花费更少,技术难度也更低。CRISPR(clustered regularly interspaced short palindromic repeat sequences)是指成簇的规律间隔短回文重复序列,Cas(CRISPR associated)是指与CRISPR 相关的蛋白。CRISPR/Cas系统由CRISPR序列和Cas蛋白组成,其中CRISPR序列由一些高度保守的重复序列和间隔序列相间排列组成,Cas蛋白是CRISPR序列附近相关基因编码的蛋白酶,具有核酸酶活性,可对DNA序列进行切割,造成DNA双链断裂[18]。
CRISPR/Cas系统是细菌自身的一套免疫系统。当噬菌体或其他病毒入侵后,宿主CRISPR系统识别外源DNA中特定的前间隔序列(protospacer)和前间隔序列邻近序列(protospacer adjacent motifs,PAMs)。宿主将这一新的间隔序列整合进入CRISPR 系统,插入在前导序列和原先第一个重复序列之间。当同一噬菌体或病毒再次侵染时,CRISPR 序列在前导序列引导下转录出前crRNA,前crRNA 接着被加工成小crRNA。这些crRNA 与反式激活crRNA(trans-activating crRNA,tracrRNA)形成一种复合RNA结构。复合RNA结构识别外源DNA中的spacer序列引导Cas蛋白复合体对外源DNA 序列进行切割,从而保护宿主免受侵害。RISPR/Cas系统共分3个类型,I型和III型均需多个Cas蛋白参与形成复合体,II型仅需Cas9蛋白即可,使用更方便,因此目前研究应用比较多的是II型CRISPR/Cas系统[19-21]。
2012年,Jinek等[19]对II型CRISPR/Cas系统进行了优化,发现将crRNA和tracrRNA整合成一条单一引导RNA(single-guide RNA,sg RNA)仍能高效引导Cas9蛋白对DNA进行切割。2013年,Cong等[20]利用CRISPR/Cas系统对人和小鼠细胞进行了内源基因的定点敲除。ZFNs和TALENs需构建不同的融合蛋白来识别不同的DNA序列,操作过程比较繁琐,花费较大,CRISPR/Cas系统针对不同DNA序列只需设计不同的引导RNA即可,无需构建蛋白。目前CRISPR/Cas系统已经在烟草、拟南芥、高粱、水稻和小麦等多种植物基因编辑中得到广泛应用。
1.4 小结 ZFNs、TALENs和CRISPR/Cas系统是目前应用最广泛的基因组编辑工具,3种工具各具特点,研究者可根据具体情况选择。ZFNs、TALENs和CRISPR/Cas系统作用原理见图1,特点比较见表1。
2 ZFNs、TALENs和CRISPR/Cas系统在植物基因编辑中的应用
2.1 ZFNs在植物基因编辑中的应用 ZFNs最初主要通过转化或胚胎注射的方式导入到酵母或动物胚胎细胞中,在细胞中表达进行基因编辑。在植物方面,Wright等[22]在2005年构建了融合GUS:NPT II基因(缺失600个碱基)的烟草原生质体,然后利用电穿孔法将能识别GUS:NPT II基因序列的ZFNs及供体DNA(600个碱基)共同导入原生质体中,结果10%以上的原生质体发生了同源重组,其中20%的GUS:NPT II基因经同源重组得到修复。该研究证明了ZFNs在植物基因编辑中应用的可能性。ZFNs在植物应用中的真正突破是2008年Maeder等[13]利用ZFNs技术将烟草中乙酰乳合酶基因SuRA敲除。2009年,Shukla等[23]利用ZFNs技术将抗除草剂基因插入到玉米内源基因IPK中,在获得的600个抗除草剂愈伤组织中检测到了预期的变异。2013年,Curtin等[24]利用根毛转化系统研究ZFNs技术对大豆基因组9个基因的诱变作用,发现7个基因发生变异。作为多倍体物种,大豆的基因组高度重复,该研究表明ZFNs技术也可以用于高度重复基因组的基因编辑工作。
2.2 TALENs在植物基因编辑中的应用 与ZFNs相比,TALENs在模块构建与成本花费方面都有优势,在植物中的应用也更广泛。Cermak等[25]于2011年用Golden Gate组装法构建TALENs模块,在拟南芥原生质体中敲除ADH1基因,该研究表明TALENs在植物细胞内具有定点突变的功能。Li等[26]于2012年利用TALENs技术破坏了水稻感病基因Os11N3的启动子序列,提高了水稻的抗病能力。2013年,Zhang等[27]利用TALENs技术编辑烟草SurA和SurB基因,他们将TALENs载体和供体DNA导入烟草原生质体,在4%的愈伤组织中检测到了供体DNA 的标记。Shan等[3]2013年利用TALENs技术对水稻和短柄草中的12个位点进行定点突变,突变频率为3.8%~100%。2015年,Shan等[28]利用TALENs技术编辑水稻OsBADH2、OsCKX2以及OsDEP1基因,突变率分别为9.7%、25.6%和9.2%,其中同时包含3个基因突变的植株为1.9%。以上研究表明TALENs技术在植物单基因突变和多基因突变方面都有较高的编辑效率。
2.3 CRISPR/Cas系统在植物基因编辑中的应用 与ZFNs和TALENs技术相比,CRISPR/Cas系统载体构建更为简单,Cas9基因是相同的,针对不同的靶基因只需设计sgRNA而不需要设计组装核酸酶,因此近几年针对CRISPR/Cas系统的研究与应用迅速增多。2013年,Shan等[29]利用CRISPR/Cas系统定点突变了小麦的1个基因和水稻的4个基因,并且在T0代获得了水稻PDS基因功能缺失的纯和突变体,该突变体呈现预期的白化和矮小。Li等[30]2013年利用CRISPR/Cas系统在拟南芥和本生烟中实现了基因定点突变并通过同源重组修复方式在烟草PDS基因的特定位点插入一个6bp的限制性酶切位点。Feng等[31]于2013年利用CRISPR/Cas系统分别对拟南芥和水稻进行了基因组定点突变,利用不同启动子表达在拟南芥和水稻中表达Cas9基因和gRNA,结果表明,CRISPR/Cas系统可以精确产生DNA双链断裂及较高的突变效率(5%~84%),并且在T1代获得了纯和突变体。Miao等[32]于2013年采用玉米Ubi启动子在水稻中表达Cas9蛋白,成功地对水稻叶绿素合成基因CAO1和分蘖夹角控制基因LAZY进行了靶向修饰,突变频率分别为83.3%和91.6%。2014年,Feng等[33]利用CRISPR/Cas系统对拟南芥7个基因的12个靶位点进行修饰,T1代突变效率为30%~92%,T2代中单突变植株的后代有约22%为纯合体,所有纯合体均能稳定遗传至下一代。同年,Zhang等[34]对2个水稻亚种11个靶基因的研究显示CRISPR/Cas系统在水稻中的编辑效率也是比较高的,约50%的基因编辑在胚性细胞第一次分裂前就已完成,后代检测发现突变位点可以稳定遗传且符合经典孟德尔遗传规律。2015年,Xu等[35]利用CRISPR/Cas系统定点突变了水稻AOX1家族的3个基因(AOX1a,AOX1b,AOX1c),靶基因突变可在后代稳定遗传,而且通过精心选择作用位点可显著降低脱靶率。
3 展望
ZFNs、TALENs以及CRISPR/Cas系统的出现,使基因组编辑工作取得了飞速进展。ZFNs和TALENs出现早,使用时间长,但在具体的使用过程中技术难度较大、构建组装时间较长,需要针对不同靶位点精心设计组装蛋白分子,花费昂贵,难以大规模推广应用。CRISPR/Cas系统的优点是可以对任何NGG(PAM)前面的20bp序列进行编辑,能同时作用于多个靶位点,载体构建比较简单[19]。
所有基因组编辑工具都有一个无法避免的问题,即对基因组非特异性位点切割造成的脱靶效应。理论上CRISPR/Cas系统的脱靶率会高一些,而且CRISPR/Cas系统在不同物种中的脱靶率存在较大差异。目前利用各种方法降低CRISPR/Cas系统的脱靶率,包括重新设计sgRNA以增强对靶DNA的亲和力,根据不同的植物种类来优化Cas蛋白的密码子以增强其切割效率,寻找合适的靶位点增强CRISPR/Cas系统和靶DNA的转一性。基因组编辑工具的脱靶效应对人类基因组编辑来说是不能容忍的,但是对植物基因组编辑来说并不是太大的问题,只是脱靶率高会增加后代鉴定筛选的工作量。新型基因组编辑工具在植物中的广泛应用必将给植物育种带来深远的影响,通过基因组编辑工具产生的植物是否和传统的转基因植物同等对待,是对监管部门的考验。新技术还带来了一些专利、伦理及法律方面的问题,将引发人们持续的思考与讨论。
致谢:本研究由“973”计划项目(“水稻优良品种的分子设计研究”分子设计和多基因组装研究,2013CBA1405)、“863”计划项目(“水稻抗褐飞虱分子设计与高产、优质抗褐飞虱水稻新品种培育”子课题,2012AA101101)和农业部农业科研杰出人才及其创新团队项目“水稻分子与细胞工程育种”共同资助。
参考文献
[1]Bibikova M,Golic M,Golic KG,et al.Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases[J].Genetics,2002,161(3):1169-1175.
[2]Dreier B,Fuller RP,Segal DJ,et al.Development of zinc finger domains for recognition of the 5′-CNN-3′ family DNA sequences and their use in the construction of artificial transcription factors[J].J Biol Chem,2005,280(42):35588-35597.
[3]Shan QW,Wang YP,Chen KL,et al.Rapid and efficient gene modification in rice and Brachypodium using TALENs[J].Mol Plant,2013,6(4):1365-1368.
[4]Hockemeyer D,Wang HY,Kiani S,et al.Genetic engineering of human pluripotent cells using TALE nucleases[J].Nat Biotechnol,2011,29(8):731-734.
[5]Karginov FV,Hannon GJ.The CRISPR system:small RNA-guided defense in bacteria and archaea[J].Mol Cell,2010,37(1):7-19.
[6]Mahfouz MM,Li LX,Shamimuzzaman M,et al.De novo-engineered transcription activator-like effector(TALE)hybrid nuclease with novel DNA binding specificity creates double-strand breaks[J].Proc Natl Acad Sci USA,2011,108(6):2623-2628.
[7]Klug A.The discovery of zinc fingers and their applications in gene regulation and genome manipulation[J].Annu Rev Biochem,2010,79:213-231.
[8]Boch J,Scholze H,Schornack S,et al.Breaking the code of DNA binding specificity of TAL-typeⅢeffectors[J].Science,2009,326(5959):1509-1512.
[9]Pabo CO,Peisach E,Grant RA.Design and selection of novel Cys2His2 zinc finger proteins[J].Annu Rev Biochem,2001,70:313-340.
[10]Durai S,Mani M,Kandavelou K,et al.Chandrasegaran S.Zinc finger nucleases:custom-designed molecular scissors for genome engineering of plant and mammalian cells[J].Nucleic Acids Res,2005,33:5978-5990.
[11]Bae K-H,Do Kwon Y,Shin H-C,et al.Human zinc fingers as building blocks in the construction of artificial transcription factors[J].Nat Biotechnol,2003,21:275-280.
[12]Wright DA,Thibodeau-Beganny S,Sander JD,et al.Standardized reagents and protocols for engineering zinc finger nucleases by modular assembly[J].Nat Protocols,2006,1:1637-1652.
[13]Maeder ML,Thibodeau-Beganny S,Osiak A,et al.Rapid ‘‘open-source engineering of customized zincfinger nucleases for highly efficient gene modification[J].Mol Cell,2008,31:294-301.
[14]Christian M,Cermak T,Doyle EL,et al.Targeting DNA double-strand breaks with TAL effector nucleases[J].Genetics,2010,186:757-761.
[15]Boch J,Scholze H,Schornack S,et al.Breaking the code of DNA binding specificity of TAL-type III effectors[J].Science,2009,326:1509-1512.
[16]Moscou MJ,Bogdanove AJ.A simple cipher governs DNA recognition by TAL effectors[J].Science,2009,326:1501.
[17]Reyon D,Tsai SQ,Khayter C,et al.FLASH assembly of TALENs for high-throughput genome editing[J].Nat Biotechnol,2012,30:460-465.
[18]Arrangou R.CRISPR-Cas systems and RNA-guided interference[J].Wiley interdiscip Rev RNA,2013,4:267-278.
[19]Jinek M,Chylinski K,Fonfara I,et al.A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J].Science,2012,337:816-821.
[20]Cong L,Ran FA,Cox D,et al.Multiplex genome engineering using CRISPR/Cas systems[J].Science,2013,339:819-823.
[21]Mali P,Yang L,Esvelt KM,et al.RNA-guided human genome engineering via Cas9[J].Science,2013,339:823-826.
[22]Wright D A,Townsend J A,Winfrey R J Jr,et al.High-frequency homologous recombination in plants mediated by zinc-finger nucleases[J].Plant,2005,44:693-705.
[23]Shukla V K,Doyon Y,Miller J C,et al.Precise genome modification in the crop species Zea mays using zinc-finger nucleases[J].Nature,2009,459:437-441.
[24]Curtin J S,Zhang F,Sander J D,et al.Targeted mutagenesis of duplicated genes in soybean with zinc-finger nucleases[J].Plant Physiology,2011,156:466-473.
[25]Cermak T,Doyle EL,Christian M,et al.Efficient design and assembly of custom TALEN and other TAL effectorbased constructs for DNA targeting[J].Nucleic Acids Res,2011,39:e82.
[26]Li T,Liu B,Spalding MH,et al.High-efficiency TALEN-based gene editing produces disease-resistant rice[J].Nat Biotechnol,2012,30:390-392.
[27]Zhang Y,Zhang F,Li X,et al.Bogdanove AJ,Voytas DF Transcription activator-like effector nucleases enable efficient plant genome engineering[J].Plant Physiol,2013,161:20-27.
[28]Shan Q,Zhang Y,Chen K,et al.Creation of fragrant rice by targeted knockout of the OsBADH2 gene using TALEN technology[J].Plant Biotechnol,2015,1-10.
[29]Shan Q,Wang Y,Li J,et al.Targeted genome modification of crop plants using a CRISPR-Cas system[J].Nat Biotechnol,2013,31:686-688.
[30]Li JF,Norville JE,Aach J,et al.Multiplex and homologous recombination mediated genome editing in Arabidopsis and Nicotiana benthamiana using guide RNA and Cas9[J].Nat Biotechnol,2013,31:688-691.
[31]Feng Z,Zhang B,Ding W,et al.Efficient genome editing in plants using a CRISPR/Cas system[J].Cell Res,2013,3:1229-1232.
[32]Miao J,Guo D,Zhang J,et al.Targeted mutagenesis in rice using CRISPR-Cas system[J].Cell Res,doi:10.1038/cr.2013.
[33]Feng Z Y,Mao Y F,Xu N F,et al.Multi-generation analysis reveals the inheritance,specificity and patterns of CRISPR/Cas induced gene modifictions in Arabidopsis[J].Proc Natl Acad Sci USA,2014,111:4632-4637.
[34]Zhang H,Zhang J S,Wei P L,et al.The CRISPR/Cas9 system produces specific and homozygous targeted gene editing in rice in generation[J].Plant Biotechnol,2014,12:797-807.
[35]Xu R F,Li H,Qin R Y,et al.Generation of inheritable and “transgene clean” targeted genome-modified rice in later generations using the CRISPR/Cas9 system[J].Scientific Reports,doi:10.1038/srep11491.2015. (责编:张宏民)