利用CRISPR/Cas9系统改造酿酒酵母的研究进展

2023-09-01 10:41陈小玲廖东庆黄尚飞陈英芦志龙陈东
生物技术通报 2023年8期
关键词:核苷酸酿酒酵母

陈小玲 廖东庆 黄尚飞 陈英 芦志龙 陈东

(1. 广西科学院非粮生物质能源技术全国重点实验室 非粮生物质酶解国家重点实验室,南宁 530007;2. 广西轻工业科学技术研究院有限公司,南宁 530031)

酿酒酵母(Saccharomyces cerevisiae)生长周期短、发酵能力强,是生产乙醇的重要菌株。选育生长速度快、乙醇产量高、耐受高温和高渗透压的工业酿酒酵母,能降低生产成本、提高经济效益,对乙醇生产企业具有重要意义。改造酿酒酵母以提高其生产性能已经成为全世界的研究热点之一。Caspeta等[1]通过适应性进化筛选到耐高温的酿酒酵母,然而适应性进化育种存在进化速度慢的问题。我们通过对高产乙醇的野生型工业酿酒酵母进行紫外线诱变[2-4]、基因敲除[5]或基因同源重组[6-7],构建了几株乙醇生产性能提高的酿酒酵母[4,6-8]。然而,传统的诱变方法存在突变频率低、遗传稳定性差、对人体和环境有危害等问题。用等离子体诱变技术改造酿酒酵母[9],能解决上述问题。但是,等离子体诱变技术与其他诱变方法一样,都属于非定点突变,通常有多个突变位点、难以识别导致表型变化的突变位点。基因敲除通常用选择性标记基因替换靶基因,如果敲除多个基因,需要循环使用有限的标记基因。而且,敲除靶基因后还要去除标记基因,因为用于工业生产的酿酒酵母不能携带标记基因。基于同源重组,用能产生目标性状的基因替换靶基因,通常一次只能改造一个基因。在实际研究中,经常需要改造酿酒酵母的多个基因,例如改造代谢途径,构建能利用木糖的酿酒酵母,用传统的改造方法短期内难以实现。

利用近年来发现的CRISPR/Cas系统可以同时编辑多个基因。CRISPR / Cas系统由CRISPR阵列和Cas基因组成,是在细菌和古细菌发现的自适应防御系统,可以保护宿主免受病毒和质粒侵袭。CRISPR的全称是成簇规则间隔的短回文重复序列(clustered regularly interspaced short palindromic repeats),Cas的全称是CRISPR相关蛋白(CRISPR-associated)。CRISPR / Cas系统对入侵核酸的沉默(切割)需要crRNA(CRISPR-derived RNA)引导,分为3个步骤:(1)含有CRISPR基因座的宿主将入侵核酸的短序列(也称原间隔子)整合到宿主CRISPR阵列近端的染色体,被整合的短序列(也称间隔子)被相同的重复序列分隔开[10-12];(2)间隔子被转录成crRNA前体(pre-crRNA),pre-crRNA被酶切后形成含有间隔子的crRNA[13-14];(3)crRNA与Cas形成复合物,引导Cas沉默入侵核酸[15-16]。

根据Makarova等[17-18]的分类方法,CRISPR/Cas系统分为3种类型。CRISPR 1和CRISPR 3属于II型[17],CRISPR 2和CRISPR 4分别属于III型和I型[17,19]。不同类型的系统加工pre-crRNA的方式和依赖的Cas不同。(1)I型和III型系统通过专门的Cas(如Csy4[14])将pre-crRNA加工成crRNA,每个crRNA与Cas组装成大型的多Cas复合物,该复合物识别和切割与crRNA互补的核苷酸。II型系统通过另一种机制加工pre-crRNA:当存在Cas9时,反式激活crRNA(tracrRNA)触发RNase III加工pre-crRNA[20]。(2)I型和III型系统需要多种Cas协同作用才能沉默入侵核酸,而 II型系统只需要 Cas9。因此, II型系统被称为CRISPR/Cas9系统。由于CRISPR/Cas9系统比较简单,它已经被广泛应用于改造酿酒酵母[21-24]或其他酵母[25]。利用它能引入多种遗传修饰[26],改造工业酿酒酵母的代谢途径[27-28],使甲羟戊酸产量提高41倍[28]。本文在介绍CRISPR/Cas9系统各组分作用的基础上,阐明在酿酒酵母中构建CRISPR/Cas9系统和进行基因编辑的研究进展,针对CRISPR/Cas9系统存在的脱靶问题,结合笔者自身的研究,提出解决方案。

1 CRISPR/Cas9系统

1.1 CRISPR/Cas9系统各组分的作用

1.1.1 Cas9蛋白 Cas9是CRISPR/Cas9系统特有的蛋白质,它特异性切割靶DNA。切割位点由crRNA与原间隔子(靶DNA)的互补区和原间隔区相邻基序(PAM)决定。Cas9可以切割线性化的DNA和超螺旋DNA[20]。来源不同的Cas9识别不同的PAM,因此Cas9的来源影响sgRNA靶序列的设计。在酿酒酵母最常用的是化脓链球菌(Streptococcus pyogenes)的Cas9(SpCas9))[29]。SpCas9对靶DNA的切割不受DNA甲基化影响,并允许sgRNA和靶DNA之间有错配,但对错配的数量、位置和分布很敏感[30]。

1.1.2 crRNA和tracrRNA tracrRNA指导内源性RNase III和Cas9将pre-crRNA加工成成熟的crRNA[13]。crRNA与tracrRNA配对形成被称为引导RNA的双RNA结构(tracrRNA:crRNA),引导Cas9切割与crRNA互补的靶DNA双链。双RNA结构使crRNA 5'端的20个核苷酸可以结合靶DNA[20](图1)。改变crRNA 5'端的20个核苷酸可以改变Cas9的切割位置[31],可以用多条crRNA引导Cas9切割酿酒酵母的多个位点。

图1 CRISPR/Cas9系统对靶DNA的特异性切割Fig. 1 Site-specific DNA cleavage by CRISPR/Cas9 system

仅保留天然tracrRNA第23-48位的核苷酸或删除crRNA 3'端10个核苷酸后,tracrRNA:crRNA还能够正常引导Cas9切割靶DNA。但是删除crRNA 5'端10个核苷酸后,Cas9不能切割靶DNA[20]。这表明tracrRNA和crRNA某些区域的核苷酸起关键作用。将tracrRNA∶crRNA设计为单个RNA嵌合体(single guide RNA,sgRNA)时,它也能指导Cas9特异性切割靶DNA双链,并且切割位置不变[20]。sgRNA的5'端要包含一段识别靶DNA的序列,其后要保留tracrRNA 5'端和crRNA 3'端之间的碱基配对结构。sgRNA使CRISPR/Cas9系统的构建更简便。因此,改造酿酒酵母时最常用的策略是将tracrRNA∶crRNA设计为sgRNA[31]。

1.2 CRISPR/Cas9系统的构建

1.2.1 Cas9的表达 在酵母表达的Cas9基因可以是天然的,也可以是针对酵母甚至人类进行密码子优化的[29]。可以将Cas9整合到酵母基因组[26]或用质粒表达。对于多基因编辑,整合到基因组的方式可以更稳定地表达Cas9[31];对于单基因编辑,优先选择质粒表达,完成编辑后消除质粒。在酿酒酵母,表达Cas9的质粒可以使用诱导型启动子(如Gal-L)或组成型启动子(如Tefl)。用诱导型启动子或较弱的启动子可以限制Cas9的毒性[29]。

1.2.2 sgRNA的设计和表达 构建CRISPR/Cas9系统的关键步骤是sgRNA的设计和表达。为了保证sgRNA有正常功能,需要合理选择启动子和终止子。酿酒酵母常用的终止子是SUP4[29]。RNA聚合酶(Pol)III启动子[32-36]、U6启动子[35,37]及tRNA启动子[38]被广泛应用于酵母和其他物种。其中,Pol III启动子(SNR52)是在酿酒酵母中常用的启动子[29,31]。与SNR52相比,用改进的Pol II-核酶系统可以用单个转录本表达更多sgRNA,从而获得更强的CRISPRi活性[39]。与SNR52和核酶-sgRNA-核酶(ribozyme-sgRNA-ribozyme,RGR)系统相比,用TEF1p-tGCC杂合启动子表达的sgRNA可以提高TPI1活力[40]。可见,选择合适的启动子能使CRISPR/Cas9系统发挥更大作用。

通常有两种表达sgRNA的方法:(1)用一个启动子表达一条sgRNA;(2)用一个启动子表达多条sgRNA,然后通过不同策略释放sgRNA。表达sgRNA的质粒可以在体内组装,也可以在体外组装。在工业酿酒酵母体内组装可以获得较高编辑效率[41],但是在体内错误组装可能导致产生假阳性菌落。体外组装质粒有助于减少假阳性菌落,也能提高编辑效率。例如体外组装携带2条sgRNA的质粒,通过一次转化能同时编辑6个基因[26]。因此,最好在体外组装质粒,用经过验证的质粒进行基因编辑。值得注意的是,一次转化的质粒越多,突变菌株包含所有突变的概率越低。

1.2.3 sgRNA靶序列的设计 设计靶序列的关键限制是PAM[29]。设计靶序列还应该考虑碱基组成,因为富含鸟嘌呤和缺乏腺嘌呤可以提高sgRNA的稳定性和活性。而sgRNA的活性与CRISPR/Cas9系统的突变效率直接相关。另外,靶序列存在唯一的限制性酶切位点有利于后期验证[26]。截短1-2个核苷酸[42-43]或5'端有错配的靶序列[42]有正常功能。截短靶序列可以减少脱靶、将某些脱靶位点的突变减少5000倍[43]。因此,靶序列的长度不必局限于20个核苷酸。设计靶序列需要有合适的设计工具来综合考虑多个设计原则。

1.2.3.1 设计原则 CRISPR/Cas9系统通过外源基因组中的PAM识别自我与非自我[44]。PAM位于靶序列的3'端[20,29],标准PAM是NGG,常见的非标准PAM是NAG。3'端连接非标准PAM的靶序列也能被CRISPR/Cas9系统识别和切割[45],因此设计靶序列时也要考虑非标准PAM,否则可能引起脱靶。PAM的精确序列和位置因CRISPR/Cas系统类型而异,大多数PAM都保守[46]。化脓链球菌II型系统的PAM为NGG[20,29],其中GG是Cas9切割靶DNA所必需的,任何一个G突变都导致Cas9 tracrRNA∶crRNA复合物对靶DNA的亲和力显著降低。PAM突变显著影响Cas9切割双链靶DNA,但是不影响Cas9切割单链靶DNA。这可能是因为双链解旋、链侵入和形成R-环结构需要PAM[20]。最近开发了不需要PAM的SpCas9突变体——SpRY,它几乎可以在基因组任何位置切割DNA[47-48]。SpRY使靶序列的设计不受PAM限制,对酿酒酵母的改造更容易。

靶序列3'端存在一个“种子”序列(与PAM近端的靶DNA匹配)。“种子”序列的任意核苷酸与靶DNA错配,都抑制Cas9的活性。Jinek等[20]认为“种子”序列至少有13个核苷酸,与靶序列5'端(非“种子”序列,与PAM远端的靶DNA匹配)有连续6个核苷酸错配的靶DNA也能被Cas9切割。DiCarlo等[29]则认为:“种子”序列只有12个核苷酸[简称S(12)],靶序列5'端8个核苷酸[简称N(8)]与靶DNA错配几乎不影响Cas9的活性。因此,只有S(12)NGG在基因组唯一,N(8)S(12)NGG形式的序列才可能是Cas9的唯一靶标。另外,因为Cas9对非标准PAM(例如NAG)也有活性[49],所以当基因组中有唯一的S(12)NGG、且不存在S(12)NAG时,N(8)S(12)NGG形式的序列才可能是Cas9的唯一靶标。Hsu等[30]还认为:除靶DNA外,如果基因组还存在与靶序列有17个以上相同核苷酸且3'端紧接PAM(NGG或NAG)的序列,会导致脱靶。Lin等[50]认为基因组DNA和靶序列凸起也造成脱靶。上述设计原则,为更好地设计靶序列提供了参考。然而,即使严格遵守上述设计原则也难以避免脱靶。随着对CRISPR/Cas9系统研究的不断深入,CRISPR/Cas9系统的打靶特异性也会越来越高。

1.2.3.2 设计工具 面对纷繁的设计原则和庞大的基因组,需要有设计靶序列和预测脱靶位点的工具。第三方比对工具只能识别基因组的部分潜在脱靶位点[45]。随着研究的深入,研究人员开发了既能设计靶序列,又能全面预测脱靶位点的工具。虽然不同工具的序列输入方式、主要特点及适用的酵母菌株有差异[27],但是通常它们都能预测脱靶位点,而且设计原理大同小异。以下介绍几种有代表性的工具,旨在使科研人员更好地为酿酒酵母设计靶序列。

Rule Set 2是基于Rule Set 1开发的sgRNA靶序列设计算法,它设计的靶序列比Rule Set 1有更好的活性和特异性。Rule Set 2主要考虑以下因素或特征。(1)核苷酸序列的独热编码,它是依赖位置的特征。独热编码,又称一位有效编码,是用N个状态变量对N个状态进行编码,每个状态变量只能取有效或无效,并且在任意时候,有且只有一个状态变量有效。核苷酸序列的独热编码,是指把A/T/G/C中某一个核苷酸转换成4个状态变量,每个状态变量的值是0或1,有且仅有一个值是1。例如,可以用0001表示A,0010表示T,0100表示C,1000表示G。因此,对靶DNA及其前后共30个核苷酸,由于任何一个位置都可以是A/T/G/C中的任何一个,它被转换成4个二进制变量状态,每个对应一种可能的核苷酸,这是一阶特征;二阶特征把所有相邻的两个核苷酸作为特征,有4×4=16种组合,如AA/AT/AG/等等。对于与PAM相关的“NGGN”,NN位置的两个核苷酸也是一个独热编码,有16个状态变量,每个状态变量是NN的可能性(如AT)。(2)不依赖位置的特征。例如靶序列中有多少个A/T/G/C,这是一阶特征,二阶特征与一阶特征类似。(3)GC含量特征。靶序列20个核苷酸中G和C的个数是一个特征,个数>10是另一个特征。(4)热力学特征。它考虑靶DNA及其前后共30个核苷酸的解链温度,还分别考虑靶序列 3个不同部位的解链温度。(5)氨基酸切割位置和肽百分比。除了设计靶序列,Rule Set 2还能对CRISPRa和CRISPRi筛选进行预测。对于筛选预测,Rule Set 2计算以2为底候选靶序列丰度变化倍数的对数(LFC)。对于有多条靶序列的基因,由于LFC的最大值不相同,不同基因之间的LFC不具有可比性。因此,通过对靶序列进行排序,并重新缩放使靶序列的最终得分在0-1之间(1表示敲除成功),获得靶序列的归一化得分。如果存在多种类型的细胞,计算各类型细胞的平均归一化得分[51]。Rule Set 2的算法能明显提高靶序列的打靶特异性,更好地预测脱靶效应,有助于大规模筛选和小规模基因编辑实验。

GuideScan可以设计单个靶序列或成对靶序列。GuideScan还可以注释靶DNA的特征和打靶效率得分,预测被编辑后的靶DNA序列。设计靶序列时,用户需提供FASTA格式的基因组,并设定PAM类型、PAM相对于靶序列的位置和靶序列长度等参数。GuideScan设计靶序列的算法与其他工具相似。首先,GuideScan扫描基因组,寻找标准PAM和非标准PAM,识别携带PAM的所有k-mer并将其写入一个临时文件。GuideScan构建所有k-mer的检索树,查找候选靶序列。携带标准PAM的k-mer在基因组唯一时,它才能作为候选靶序列;如果它在基因组出现2次以上,或者基因组还存在携带非标准PAM的k-mer,该k-mer被标记为非候选靶序列,并被列入“黑名单”。然后,GuideScan利用检索树评估与候选靶序列有错配的相似序列,确保在基因组有唯一的错配数不超过M的靶DNA。如果在M个错配内,候选靶序列在基因组不唯一,它被重新标记为非候选靶序列,并被列入“黑名单”。因为M个错配内在基因组唯一的靶序列,当完全枚举到Q(Q>M)个错配时可能含有脱靶位点,所以对于给定靶序列,GuideScan通过检索树遍历,计算错配邻域,再次确定脱靶信息。如果发现基因组存在与靶序列有P(M<P≤Q)个错配的脱靶序列,记录该脱靶序列出现的次数、汉明距离P以及用户指定的脱靶次数的位置。最后,GuideScan将候选靶序列写入一个序列比对图(SAM)格式的文件。该文件以十六进制字节的形式存储靶序列,包含作为唯一标识的序列和脱靶信息。将SAM文件转换为BAM文件并编制索引后,可以用Samtools快速访问它[45]。

网页版的GuideScan被称为Yeastriction,它专门为酿酒酵母设计靶序列。Yeastriction基于MEAN.io栈框架,并使用javascript实现。Yeastriction的设计步骤[26]如下:(1)从指定区域查找所有可能的靶序列;(2)去除有连续6个以上T的序列,因为这些序列能使Pol III终止转录[52];(3)用Bowtie[53]将靶序列与参考基因组进行比对,检查是否存在脱靶位点,如果存在脱靶位点,则丢弃该靶序列;(4)根据以下参数计算靶序列的得分:AT含量(1表示含量最高,0表示含量最低)、某些限制性内切酶酶切位点数(1表示有,0表示无)及二级结构中配对的核苷酸数量(1表示数量最低,0表示数量最高),根据指定参数的总分对靶序列进行排序。只能对单个基因的不同靶序列进行排序,不能对不同基因的靶序列进行排序。

最早开发的CRISPy(http://staff.biosustain.dtu.dk/laeb/crispy/)专门为中国仓鼠卵巢(CHO)-K1设计靶序列。CRISPy使用BioPython创建的Python脚本搜索基因组,把生成的数据库上传并存储到MySQL数据库系统,使用HTML、PHP、Javascript作为访问界面,以供外界访问数据库系统。CRISPy在指定外显子搜索G(N)19NGG格式的潜在靶序列,并在基因组其他位置搜索潜在的脱靶位点,即与潜在靶序列NGG端的13 个核苷酸(N7-N19)相匹配(允许1-2个错配)的序列[54]。基于上述版本的CRISPy,开发了专门为酿酒酵母设计靶序列的CRISPy(http://staff.biosustain.dtu.dk/laeb/crispy_yeast/)[28]和能为任何微生物设计靶序列的CRISPyweb。CRISPy-web需要指定设计靶序列的基因组区域,它以图形或文本文件的形式输出靶序列[55]。表1汇总了上述工具的优点和缺点。

表1 适用于酿酒酵母的靶序列设计工具Table 1 SgRNA design tools available for S. cerevisiae

2 CRISPR/Cas9系统在酿酒酵母的应用

2.1 利用供体DNA定点改造基因

靶DNA被Cas9切割后,断裂的DNA双链会被细胞的非同源末端连接(NHEJ)机制或同源重组(HR)机制修复。NHEJ机制容易在断裂位点引入插入/缺失突变,造成阅读框移码。如果用NHEJ机制修复,难以预料靶DNA的突变情况。如果用HR机制修复,靶DNA可以产生预期的突变(如引入单核苷酸或多核苷酸突变[49]),但是需要提供供体DNA作为修复模板。将单个线性化、携带多条sgRNA的质粒与供体DNA共转化,有利于点突变和大片段整合[58]。供体DNA的长度影响基因编辑效率。以20 为间隔,对于20-120 bp的供体DNA,100 bp的编辑效率最高[59]。100 bp的供体DNA很容易获得,可以从具有目标性状的基因扩增或者人工合成。除了作为修复模板外,利用供体DNA还能避免靶DNA被反复切割[29,49]。实现方法是设计合适的供体DNA,使其与被切割的靶DNA重组后去除靶DNA的PAM序列或使对打靶至关重要的“种子”序列突变,该方法的本质是使重组的靶DNA不被CRISPR/Cas9系统识别。

2.2 多基因编辑策略

Cas9可以在多条sgRNA的引导下同时编辑多个位点,这是CRISPR/Cas9系统最大的优势。然而,多条sgRNA的表达和释放是对酿酒酵母进行多基因编辑的挑战。这是因为在真核生物,表达多条sgRNA的遗传元件通常需要满足以下条件:在细胞核中高效、稳定地加工,单顺反子高效拼接以及序列短[40]。目前已经有几种表达和释放多条sgRNA的策略。

2.2.1 利用CRISPR/Cas系统加工pre-crRNA的能力生成多条sgRNA或crRNA的策略 Ferreira等[60]利用III型CRISPR/Cas系统的Csy4对precrRNA的加工能力[14],从酿酒酵母的单个转录本获得多条sgRNA。Bao等[59]利用CRISPR/Cas9系统对pre-crRNA的加工能力,从酿酒酵母的单个转录本获得多条crRNA并释放供体DNA。具体方法是:将tracrRNA和crRNA组成类似天然多顺反子的CRISPR阵列,在CRISPR阵列中用一个启动子表达多个被定向重复区隔开的间隔子(在引导序列前插入供体DNA),转录本被加工后释放多条crRNA;在加工过程,pre-crRNA的5'端被RNase III和其他内源核酸酶切割,从而释放DNA供体。利用这种策略能高效地编辑酿酒酵母多个基因[59-60]。

2.2.2 利用tRNA加工系统生成多条sgRNA的策略 能用tRNA加工系统释放sgRNA[38,40]的原因是:tRNA前体(pre-tRNA)在细胞核[61-62]被内源性tRNA加工系统精确切割[32],其5'端和3'端分别被核糖核酸酶(RNase)P[63]和Z切割。因为甘氨酸tRNA(tRNAGly)基因只有71个核苷酸[64],比其他内源性tRNA短,利于高效转录多条sgRNA,所以tRNAGly是常用的tRNA。由于5'端前导序列显著影响RNAse P的切割活性[65],Deaner等[40]对甘氨酸tRNA前体的前导序列进行比对,用各位置出现频率最高的核苷酸组成新的前导序列,获得比原前导序列或无前导序列更高的酶活力。目前已经有很多研究从单个表达盒表达多个tRNA-sgRNA单元[32-33,35,37-38,40]。例如,Qi等[37]基于tRNAGly表达4个tRNA-sgRNA单元。因为所有生物都有tRNA前体,并且tRNA及其加工系统在所有生物都保守,所以利用tRNA加工系统释放sgRNA的策略被广泛使用。

2.2.3 基于tRNA加工系统衍生的其他策略 基于tRNA加工系统衍生出利用Cas9的内含子同时表达多条sgRNA的策略。具体方法是将携带tRNAsgRNA的内含子与Cas9融合为一个基因,利用内源tRNA加工系统切割带有tRNA-sgRNA多顺反子的内含子[36]。基于tRNA加工系统还衍生出模块化构建tRNA-sgRNA的策略。例如Deaner等[40]利用迭代IIs型消化/连接延伸方法,模块化构建tRNAsgRNA操纵子(被称为sgRNA操纵子的CRISPR连接延伸,CRISPR-LEGO),并成功地用于改造酿酒酵母生产2,3-丁二醇的代谢途径。CRISPR-LEGO比Gibson或USER Cloning[28]更有优势:首先,通过迭代消化/连接,它有效地将操纵子拼接在一起,减少合成大型操纵子所需的DNA量和PCR反应的循环次数;其次,它可以将sgRNA简单地添加到通过模块化合成的操纵子。将CRISPR-LEGO与Pol II-tRNA相结合,可以快速为酿酒酵母生成多条sgRNA,比用Pol III表达盒或RGR操纵子有优势。

上述表达多条sgRNA的策略使CRISPR/Cas9系统成为同时编辑酿酒酵母多个基因的有力工具。在这些策略中,为了释放表达的sgRNA,sgRNA两侧需要连接可以被切割的RNA序列,这些序列可以是自切割的核酶序列(如锤头状核酶和丁型肝炎病毒核酶[66-67])、外源切割因子识别序列(如Cys4[60])或内源RNA加工序列(如tRNA序列[32-33,37,40]或内含子[36])。

2.3 影响编辑效率的因素

CRISPR/Cas9系统各组分的亲缘关系影响编辑效率。例如,化脓链球菌的tracrRNA∶crRNA不能正常引导与其亲缘关系较远的Cas9切割靶DNA。反之,与化脓链球菌亲缘关系较远的tracrRNA∶crRNA不能正常引导SpCas9切割靶DNA[20]。可以通过PCR扩增包含靶DNA的片段来检测编辑效率。利用两条sgRNA删除基因片段时,虽然这两条sgRNA的编辑效率可能不相同,但是删除效率通常与切割位点之间的距离呈负相关。在tRNA-sgRNA串联排列的单个多顺反子中,sgRNA的数量影响删除效率,但对不同靶点的影响程度不同[32]。

CRISPR/Cas9系统使酿酒酵母的同源重组频率接近100%,与不用CRISPR/Cas9系统相比,分别使单链DNA供体或双链DNA供体的同源重组频率提高5倍或130倍[29]。Ferreira等[60]利用Csy4的加工能力释放多条sgRNA,同时编辑酿酒酵母4个基因的效率达到96%。Zhang等[64]研究表达sgRNA的3种模式对酿酒酵母编辑效率的影响。其中,模式A由SNR52启动子、sgRNA-tRNAGly阵列和终止子组成单个表达盒,简称 GTR-CRISPR;模式B和C包含多个表达盒,模式B的所有表达盒均由SNR52启动子、sgRNA和终止子组成;模式C的第一个表达盒与模式B相同,其他表达盒由SNR52和tRNAGly序列组成的融合启动子、sgRNA和终止子组成(图2)。发现模式A的编辑效率最高:同时编辑3个、4个和5个基因的效率分别为93.0%、100%和88.9%;模式C的效率显著高于模式B,说明tRNAGly与SNR52融合可以提高编辑效率。模式A同时编辑6-8个基因的效率很低,可能是因为转录的sgRNA太多,SNR52的转录效率不足。基于模式A,在sgRNA-tRNAGly阵列中间引入第二个启动子后,同时编辑8个基因的效率从36.5% 提高到87%[64],这是已知能高效率编辑的最大基因数。

图2 表达sgRNA的3种模式Fig. 2 Three different sgRNA expression modes

3 存在的问题及展望

3.1 改变野生种群的风险

CRISPR/Cas9系统是改造酿酒酵母的强大工具,但是如果携带CRISPR/Cas9系统的酿酒酵母逃逸,在偶然的情况下Cas9和sgRNA可能被传播,并意外改变野生种群的基因[68],造成无法预料的影响。因此,应该降低这些酿酒酵母逃逸并改变野生种群的风险。有3种限制措施可以预防这种风险。(1)分子限制:不在一个基因表达盒表达Cas9和sgRNA,使它们分开表达。例如,用附加型质粒表达Cas9、用其他遗传元件表达sgRNA。这种方式简单、有效,即使这些酿酒酵母逃逸,较不稳定的附加型质粒也会迅速与表达sgRNA的元件分离。另外,用诱导型启动子调控Cas9或sgRNA的表达也有助于预防风险。(2)生态限制:在这些酿酒酵母无法存活的区域进行实验。(3)生殖限制:利用完全不能与野生型酿酒酵母繁殖的遗传背景,可以防止Cas9和sgRNA传播到野生型酿酒酵母[68]。在设计实验时,可以使用上述1-2种措施;在实验结束后,灭菌处理污染了酿酒酵母的物品或耗材。

3.2 脱靶问题

虽然CRISPR/Cas9系统是基因编辑的强大工具,但是它的脱靶问题[45]不容忽视。脱靶能导致对酿酒酵母的改造失败,甚至导致科研人员得出错误的结论。脱靶的主要原因是Cas9对sgRNA与DNA的错配有一定的容忍度[29]和设计靶序列所用的参考基因组与目标酿酒酵母的基因组有差异。减少靶DNA之间的核苷酸相互作用[69],调整Cas9和sgRNA的剂量[30]或者对目标酿酒酵母进行深度测序并组装高质量的基因组、根据精确的基因组序列设计靶序列都可以减少脱靶。如果参考基因组与目标酿酒酵母真实的基因组有较大差异,除了造成脱靶外,还影响靶序列设计和打靶效率。因为靶序列设计工具基于PAM查找潜在的靶序列,而靶序列的单个核苷酸与靶DNA错配就可能导致Cas9无法切割靶DNA[30]。针对某些靶序列设计工具只能选择指定的基因组[26,56,70](不能用目标酿酒酵母的基因组)作为参考基因组的问题,可以开发计算机软件工具或算法,检测靶序列在目标基因组的打靶特异性;也可以下载并修改靶序列设计工具的源代码,然后基于目标酿酒酵母的基因组在本地计算机设计靶序列。我们开发了能为任何酿酒酵母检测靶序列特异性的算法和软件工具[71-72],为已投入工业生产的野生型工业酿酒酵母[5]设计靶序列。利用我们的算法或软件工具,只需提供参考基因组和靶序列,就可以快速地检测一条或多条靶序列的特异性,有效减少脱靶。

3.3 多基因编辑效率低

CRISPR/Cas9系统对不同基因的编辑效率不一样,例如对酿酒酵母ATF2、GCY1和YPR1的编辑效率为100%,而对CAN1、ADE2和LYP1的编辑效率只有27%-87%[59],说明CRISPR/Cas9系统对多基因的高效编辑存在位点依赖性或者还需要更好的靶序列设计规则来选择高效的靶序列。另外,在酿酒酵母用一个表达盒表达多条sgRNA的能力较低。例如,表达的sgRNA超过4条时,sgRNA的转录可能不完全或(和)不稳定。解决该问题需要开发调控元件[59]或类似于tRNAGly加工系统[64]的编辑工具。

4 小结

CRISPR/Cas9系统是高效、精准的基因组编辑工具。虽然当前存在一些问题,但是与传统的基因改造技术相比,CRISPR/Cas9系统仍具有显著优势,是改造酿酒酵母的强大工具。随着研究的不断深入,靶序列设计规则将不断得到完善。另外,随着计算机技术与生物学的交叉融合,靶序列设计工具将越来越多、越来越完善。因此,随着CRISPR/Cas9系统存在的问题逐步得到解决,利用CRISPR/Cas9系统改造酿酒酵母也会越来越得心应手。

猜你喜欢
核苷酸酿酒酵母
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
上半年酿酒产业产、销、利均增长
为什么酵母菌既能做面包也能酿酒?
Acknowledgment to reviewers—November 2018 to September 2019
酵母抽提物的研究概况
酵母魔术师
人CyclinD1在毕赤酵母中的表达
酿酒忘米
生物量高的富锌酵母的开发应用