暴会会,尹竹君,王少坤,马瑞红,谢俊俊,张 杰,杨正安*
(1.云南农业大学 园林园艺学院,云南 昆明 650201;2.玉溪市澄江县经济作物工作站,云南 玉溪 652599)
基因定点编辑是研究基因功能的重要手段之一。锌指核酸酶(zinc-finger nucleases,ZFNs)和类转录激活因子效应物核酸酶(transcription activator-like effector nucleases,TALENs)都能使DNA靶位点产生DNA双链断裂(DSB)进而实现基因组定点编辑[1-2]。ZFN和TALEN通过蛋白质和DNA识别发挥作用,CRISPR-Cas 9通过一小段RNA序列来识别DNA,具有设计简便、高效、可实现高通量操作的特点[3]。比较而言,ZFN制备复杂、成本昂贵,而TALENs对每一个基因位点的编辑都需要重新设计、合成和组装2个核酸酶,载体构建复杂,技术难度大,制约了其应用。2013年,CRISPR/Cas9技术逐渐成熟,只需合成一个sgRNA即可对基因特异性修饰、操作简单、作用高效[4]。目前,CRISPR-Cas9系统在基因编辑方面发展迅速,已成功应用于几种蔬菜作物,如番茄、马铃薯、油菜和甘蓝等。本文主要对CRISPR-Cas9技术和以番茄为主的蔬菜作物应用研究及未来发展方向进行了综述。
1987年,日本微生物学家石野良纯(Yoshizumi Ishino)等在大肠杆菌的基因组研究中发现一段特殊串联间隔重复序列[5],至2013年,Li等在《Nature》首次公布了利用CRISPR/Cas9系统在植物体内共表达经密码子最优化的Cas9和sgRNA,诱导拟南芥(Arabidopsis)和本生烟草(Nicotianabenthamiana)发生特定基因突变,该研究成果第一次证明了sgRNA/pcoCas9系统可以在植物基因组中发挥作用[6]。
细菌和古细菌在长期进化中形成了复杂的CRISPR适应性免疫系统,其根据Cas蛋白及其序列的不同分为Ⅰ、Ⅱ、Ⅲ类[7-8]:Ⅰ型中Cas蛋白具有核酸酶、解旋酶活性[9],特征蛋白是Cas3,主要分布在细菌及古细菌中;Ⅱ型中Cas蛋白N端具有RuvC核酸酶活性结构域,中部具有HNH核酸酶结构域,特征蛋白是Cas9,主要分布于细菌中;Ⅲ型中Cas蛋白主要参与crRNA的成熟和剪切外源DNA[10]。本文主要介绍在化脓链球菌(Streptococcuspyogenes)中发现的Ⅱ型CRISPR-Cas9系统,其他CRISPR系统虽只需一种crRNA但需多种Cas9蛋白共同参与,Ⅱ型系统需2种RNA(crRNA和tracrRNA),虽增加RNA数量,却只需要一种Cas9蛋白完成[11],相对而言更易操作且不需依赖复杂的蛋白复合物,目前已广泛应用于蔬菜作物基因组编辑。
CRISPR-Cas9系统介导的细菌适应性免疫反应分为3个阶段:(1)噬菌体首次入侵宿主时,Cas基因编码的蛋白复合物将入侵外源短DNA片段作为间隔序列整合到CRISPR位点的5′端[12];(2)噬菌体再次侵染该宿主时,CRISPR序列转录出CRISPR前体RNA(precursor crRNA,pre-crRNA),经剪接形成成熟的crRNA,包含多个串联重复序列和间隔序列,间隔序列具有特异性,可识别外源靶DNA并与之形成碱基互补配对[13-14];成熟的crRNA与反式激活crRNA(trans-activating crRNA,tracrRNA)形成二元复合体,与dsDNA中一条链以20 nt特异位点互补配对形成短DNA-RNA复合物[15-18]。另一条DNA链形成R环结构[19]。(3)R环形成后,具有2种核酸酶活性Cas9蛋白在与crRNA间隔序列互补的位点切割DNA,在特定位点引入DNA双链断裂(DSB)[20-22]。在crRNA与DNA靶位点特异性结合时,DNA链上必须存在一段PAM序列才能使得结合过程顺利进行[23-28]。
真核生物中,靶向DNA双链断裂后即在体内启动2种DNA修复机制,即同源重组修复(homologous recombination,HR)和非同源末端连接修复(non homologous end joining,NHEJ)[29],其分别导致基因置换或基因敲除。DSB最常被非同源末端连接修复,它可以在破坏基因功能的断裂位点产生插入/缺失突变,也可以通过同源依赖性修复修复DSB,HR仅在存在同源序列时发生,其修复来自“供体”DNA模板的信息。HR通常在体细胞中发生频率更低,因为它需将供体DNA分子和序列特异性核酸酶(SSN)表达盒引入植物细胞中[30]。一般通过HR不会改变目标基因编码序列,但当供体质粒提供同源位点时可插入外源基因片段,HR可以对Cas9蛋白切割的目标DNA序列进行精确编辑。所以,利用DNA修复损伤机制,可实现DNA的插入、缺失,为研究基因功能提供了有效方法。目前,许多科学家成功运用CRISPR/Cas9系统实现植物目的基因敲除。然而,利用该系统成功插入或替换目标片段却极少报道。研究表明,CRISPR/Cas9系统可以通过HR方式编辑目标片段。尽管HR的效率远低于NHEJ,但HR能更准确地在目标位点引入新片段。
2014年,Schiml等[31]第一次通过CRISPR/Cas9系统利用HR介导的修复机制成功在拟南芥的ADHI基因位点导入了具有卡那抗性的片段。Cermak等[32]为扩大模板供体序列设计双生病毒系统,成功在番茄中导入卡那抗性片段,促进HR修复途径精确编辑。Endo等[33]研究发现DNA连接酶V参与NHEJ修复途径,可通过抑制DNA连接酶V促进CRISPR/Cas9系统插入或替换目标片段。近来有文献报道,发现当质粒和自由双链DNA形态都存在的情况下,提供HR供体能够提高植物同源重组修复效率。相反,单链寡核苷酸则不能通过提供HR供体而发挥功能[34]。研究表明,通过同源定向修复(HR)的CRISPR/Cas9诱导的基因置换为产生具有延长贮藏寿命的番茄品系提供了有价值的方法[35]。
CRISPR/Cas9系统是植物基因组编辑的一种新兴技术。CRISPR-Cas9有效基因组编辑一般包含4个步骤:(1)设计和构建基因特异性sgRNA;(2)sgRNA的活性在原生质体中验证;(3)通过土壤农杆菌将CRISPR-Cas9系统递送到植物细胞;(4)基因分型鉴定[36]。
CRISPR/Cas9系统允许多个sgRNA同时表达,实现植物多重基因编辑[37]。有研究结果表明,如果使用单个gRNA,则大多数是NHEJ修复不会导致突变。因此,用2种及以上gRNA是实现定向诱变更有效方法[30]。研究者通过连续循环克隆将含有不同目的片段sgRNA插入二元载体中或利用多重限制性内切酶以产生不同粘性末端将sgRNA插入不同位点[38-39]。Zhang等构建了含有Cas9和6个gRNA表达基因序列的载体,证明CRISPR/Cas9系统能够同时编辑6个目标基因位点[40]。2015年,Wang等利用同尾酶和限制酶技术实现了水稻中3个基因的同时编辑[41]。Ma等利用Golden Gate克隆水稻CRISPR/Cas9系统二元结构,经单一循环克隆实现了8个位点插入、7个类似FT的基因同时突变[42-43]。
目前已经开发了几种同时表达多种gRNA的系统,通常涉及组装多个单独的gRNA表达盒,由单独的RNA聚合酶Ⅲ(Pol Ⅲ)启动子转录[44-45]。通过RNA切割酶将这种多顺反子mRNA在转录后加工成单个gRNA。这些酶包括来自铜绿假单胞菌的CRISPR相关RNA内切核糖核酸酶Csy4[46],天然存在于宿主细胞中的tRNA加工酶和核酶[47]。无论位置效应如何,证实Csy4是多重基因编辑的最有效系统,而且能够同时使多达12个gRNA在植物中创建多重靶向基因缺失[30]。
CRISPR/Cas9是一种功能强大的基因组编辑系统,但不受控制的Cas9核酸酶表达会触发脱靶效应甚至体内免疫反应。Cas9蛋白结构、特异位点碱基数、GC碱基含量、温度等方面都会影响编辑效率,增加CRISPR-Cas9系统的特异性是一项重大挑战。目前已有以下几种策略可以解决这个问题:(1)Slaymaker等对Cas9蛋白结构进行了优化,利用部分中性氨基酸替代原有正电荷氨基酸[48]。(2)Mikami[49]和Fauser[50]等发现,增加Cas9的切口酶活性能减少脱靶效应。配对的切口酶已被证明在植物中具有最小的脱靶效应[51]。(3)Hu等通过使用噬菌体辅助连续进化(PACE)快速获得具有最广泛PAM兼容性的进化的SpCas9变体xCas9。与野生型Spcas9相比,xCas9-3.7和xCas9-3.6大大降低了脱靶率[52]。(4)Shen等[53]设计了一种合成开关(结合Cas9/gRNA靶向并抑制cas9基因转录,以及L7Ae∶K-turn系统抑制Cas9 mRNA翻译),用于在转录和翻译步骤中严格控制Cas9表达,以最小化脱靶效应而不牺牲靶上诱变频率。可见,CRISPR-Cas9系统的特异性、有效性将是该技术发展和应用的关键点。相信随着科学技术的发展,基因编辑技术将更加精确、效率更高,在我国蔬菜育种发展进程中做出重要贡献。
科学家应用CRISPR/Cas9系统实现目标基因编辑,改进番茄重要农艺性状,如产量、品质、抗病性、抗胁迫能力,还可以研究番茄基因功能及其分子机制解析。2013年,Jiang等[54]在番茄等研究中,证明了CRISPR/Cas9系统可以短期应用于植物基因组编辑。
3.1.1 产量和品质 2018年,Li等[55]在《Nature》发表成果,通过多重CRISPR-Cas9编辑花、果实以及抗坏血酸合成相关的基因的上游开放阅读框,编辑植株的后代具有驯化表型,且保留了亲本抗病性和耐盐性。同时,Zsögön等[56]利用CRISPR-Cas9策略,使用多种gRNA串联的Csy4阵列,展开针对番茄产量、生产力等6个重要基因座编辑,实现了野生番茄从头驯化。该研究成功编辑了6个靶向基因座中的4个(SP、O、FW2.2、CycB),基因编辑后植株的果实其大小增加了3倍,果实数量增加了10倍,番茄红素提高了500%。番茄PROCERA基因编码DELLA蛋白,功能丧失突变抑制了生长,Tomlinson等[57]使用CRISPR/Cas9和sgRNA靶向PROCERA DELLA结构域,杂合子在幼苗期显示出中间表型,成熟后与纯合子一样矮小。Li[58]、Nonaka[59]等利用CRISPR/Cas9有效地增加了番茄果实中γ-氨基丁酸的含量。D’Ambrosio等[60]利用CRISPR/Cas9技术靶向类胡萝卜素生物合成的2个关键基因Psy1、CrtR-b2,结果证明:CRISPR-Cas9系统是可以在番茄中产生有用突变的有效且快速的方法,可以在育种计划中实施。Li等[61]通过人工引入含有多个sgRNA表达盒的转化载体,增加番茄红素的含量,成功应用pYLCRISPR/Cas9多靶点编辑系统,在番茄类胡萝卜素合成和代谢途径中产生许多相关基因突变,为获得具有改良农业性状的新番茄品种提供了基础。
3.1.2 抗性 Nekrasov等[62]通过使用CRISPR/Cas9技术获得对白粉病真菌病原体具有更高抗性的番茄植物。Ortigosa等[63]通过CRISPR/Cas9介导的SlJAZ2编辑产生抗细菌性果斑病的番茄品种。Manal等[64]用Cas9-sgRNA靶向番茄黄叶曲叶病毒(TYLCV)基因组产生了有效病毒干扰,研究结果证实CRISPR/Cas9系统在番茄耐TYLCV工程中的有效性,并为其他作物中对单个和多个感染性病毒工程抗性研究奠定基础。Li等[65]利用CRISPR-Cas9系统生成番茄slcbf1突变体,与野生型(WT)相比,slcbf1突变体表现出更严重的冷害-损伤症状,有助于更好地了解SlCBF1调节番茄冷害敏感性分子基础。通过将CRISPR-Cas9技术运用到蔬菜作物遗传改良育种,成功获得相应抗性蔬菜作物成为可能。
Murovec J等[66]利用CRISPR-Cas9首次报道了甘蓝(B.oleraceaL.)和大白菜(B.rapaL.)2种内源性报告基因(PDS)中RNPs的定点诱变,以及vernalization dedet FRIGIDA (FRI)基因的诱变,获得了较高突变频率。Sun等[67]首次采用CRISPR/Cas9系统实现了中国羽衣甘蓝基因组定点编辑;还实现了用于同时突变多基因以产生各种突变材料的单个靶位点,结果强化了CRISPR/Cas9系统在栽培芸薹属蔬菜中的应用,丰富了我们对芸薹属作物中CRISPR/Cas9突变模式的认识,为进一步研究基因功能奠定基础。Andersson等[68]利用CRISPR/Cas9技术敲除马铃薯(Solanumtuberosum)合成直链淀粉的唯一酶[颗粒结合淀粉合成酶(GBSS)]消除直链淀粉形成。GBSS基因的高效率敲除显示了CRISPR-Cas9 RNP(ribonucleoprotein)技术作为未来马铃薯育种方法的潜力。Braatz等[69]使用CRISPR-Cas9在四倍体油菜(Brassicanapus)中靶向2种ALCATRAZ(ALC)同源物。敲除ALC增加抗破碎性,避免机械收获期间的种子损失。4个等位基因仅使用一个靶序列在单个T1植物中突变。这证明了CRISPR-Cas9介导的基因组编辑在多倍体物种中同时修饰不同同源基因拷贝的潜力。Sun等[70]结果表明,CRISPR/Cas9系统在甘蓝型油菜中产生具有高抗核盘菌性的种质,BnWRKY70可以作为负调控菌核抗性的调节因子起作用。Yang等[71]利用CRISPR/Cas9系统对油菜CLV信号通路中的3个关键基因进行了高效敲除,并进行稳定转化,BnCLV3的双突变产生可遗传的多室角果,并增加种子产量。CRISPR/Cas9系统可推进油菜功能基因组研究,推动育种进程。
随着CRISPR-Cas9系统的不断改进、优化以及新的Cas系统出现,应用范围将更广泛,在基因功能研究和应用上发挥更大作用。目前,番茄杂交制种仍以人工去雄为主,一直以来花粉不育型和雄蕊退化型保持较困难,尽管花药发育机理已在拟南芥和水稻中开展了大量的研究工作,但有关番茄花药和花粉发育调控相关机理的深入研究却报道较少。本课题组在前期工作成果的基础上进一步把CRISPR-Cas9系统应用于番茄雄性不育中,通过克隆分析花粉壁合成相关基因,利用该技术获得成功转化的番茄,再经过转录组、蛋白组数据分析,获得花粉花药相关基因的调控网络,用以探索创制番茄雄性不育新方法。除了上述基因组工程应用,值得注意的是Cas9系统在下一代测序(Next Generation Sequencing,NGS)领域的革命性应用。使用Cas9系统,可以去除99%以上在测序文库中具有高丰度的冗余序列[72],且不受输入样品量的限制。CRISPR与NGS技术结合的另一个应用是短串联重复(STR)-Seq。其实现了跨越靶向微卫星位点的DNA片段的富集,并且通过NGS对超过2000个STR进行测序和并行分型。目前降低其脱靶效应和提高同源重组(HR)编辑效率是实现我国基因精准定点编辑的重要一步。总之,CRISPR/Cas9系统经过不断改进与完善,将在蔬菜作物遗传育种中发挥更大作用。