王梦雨, 王颢潜, 王旭静, 王志兴*
1.中国农业科学院生物技术研究所,农业农村部农业转基因生物安全评价(分子)重点实验室,北京100081;2.农业农村部科技发展中心,北京100176
近年来,基因编辑技术、RNA 干扰(RNA interference,RNAi)技术、合成生物学等转基因新技术飞速发展,特别是2020 年获得诺贝尔化学奖的基因编辑技术——间隔规律成簇短回文重复序列及关联蛋白(clustered regularly interspaced short palindromic repeats/CRISPR-associated proteins,CRISPR/Cas),已经成为最热门的转基因工具,为基因功能研究和生物育种开创了新局面[1-2]。2021 年中央一号文件[3]、中央经济工作会议和中央农村工作会议均明确指出要“尊重科学,严格监管,有序推进生物育种产业化应用”“打赢种业翻身仗”。基因编辑无疑是生物育种产业化应用和打赢种业翻身仗的关键核心技术,为政策落实落地提供了重大支撑。目前,CRISPR/Cas9 基因编辑技术已经被广泛地应用于水稻、大豆、玉米、番茄等多种植物的研究,并且已经有相关产品在国外获得了商业许可,即将推向市场。基因编辑技术给传统的生物育种带来巨大推动作用的同时[4],也向转基因生物安全监管提出了挑战[5-6]。
基因编辑技术主要包括3 种:锌指核酸酶(zinc finger nuclease,ZFN)[7]、转录激活因子样效应物核酸酶(transcription activator-like effector nucleases,TALENs)[8]、CRISPR/Cas[9]。基因编辑依赖于经过改造的核酸酶,核酸酶在基因组中特定位置产生位点特异性双链断裂(double strand break,DSB),诱导生物体通过同源重组(homologous recombination,HR)或非同源末端连接(non-homologous end joining,NHEJ)的方式来修复DSB[10]。HR修复的效率很低,因为需要有同源片段的存在,以其为模板才能进行修复[11]。而NHEJ修复,不需要模板,修复过程容易出错,从而实现靶点的碱基替换、缺失、插入和基因表达的调控等。利用该技术对二倍体植物进行基因编辑后,植株单个细胞会产生3种突变结果:单等位基因突变,也称杂合突变;双等位基因突变,2 个等位基因发生不同类型的突变;纯合突变,2 个等位基因发生相同的突变[12-13]。对于基因编辑可能产生的多种突变结果,需要更加精准、高效的检测技术进行检测判定[13]。因此,本文基于基因编辑检测中已报道的技术方法,从测序技术、酶切技术、PCR 技术和其他检测技术4 个方面,对每种方法的研究应用情况和优缺点进行分析,以期为今后基因编辑产品的检测提供借鉴和参考。
以Sanger双脱氧链终止法为代表的第一代测序技术,在日常科研工作中使用频率很高,该方法可以用来检测动植物基因编辑产品。通常分为PCR 产物直接测序和PCR 产物克隆后测序。若直接对PCR 产物进行测序,可将纯合突变与野生型进行序列比对,从而获知具体的突变;若将PCR产物克隆后再测序,测序峰图不会出现杂乱的双峰,可以据此判断双等位基因突变和杂合突变的类型[14]。该方法已广泛应用于水稻植株和拟南芥植株中。Sanger法测序主要适用于简单突变的样品,测序结果能更直接地反映突变类型,准确度高。即使利用其他方法进行初筛,最终都需要Sanger法测序来确定具体突变类型。但该方法成本高、耗时长、通量低,在检测时工作强度大[10]。
下 一 代 测 序(next-generation sequencing,NGS)技术又称第二代测序技术。不同的二代测序平台的区别主要体现在测序反应的技术上,根据这些差别可以分为焦磷酸测序、合成法测序、连接法测序和离子半导体测序。以焦磷酸测序(pyrosequencing)技术为例,引物与模板DNA退火后,在DNA 聚合酶、ATP 硫酸化酶、荧光素酶和三磷酸腺苷双磷酸酶这4 种酶的协同作用下,将引物上每一个dNTP 的聚合与一次荧光信号的释放偶联起来,通过检测荧光的释放和强度,达到实时测定DNA 序列的目的[15-16]。焦磷酸测序技术在检测基因编辑水稻[15,17]、基因编辑猪[18]及基因编辑大豆[19]等方面均有广泛应用。焦磷酸测序是检测短片段突变的金标准[17],使用过程简单、准确度高,可清晰、直观地获取突变的具体信息,包括突变位点、类型及等位链上变化的碱基数,已经成为中通量单核苷酸多态性(single nucleotide polymorphism,SNP)基因分型、突变检测、拷贝数研究和DNA甲基化分析的有用工具[17]。但该方法成本较高、耗时长、读长比较短,不适合大规模缺失的检测,并且后续的数据分析也更复杂[13]。
错配切割法是指识别并切割不完全配对的DNA,即用酶切反应来检测突变造成的碱基错配。将突变体和野生型目的片段等体积混合,变性复性后酶切,用琼脂糖凝胶电泳检测酶切结果,可以估计突变效率,是基因编辑产品常用的检测方法。错配切割酶包括T7核酸内切酶I(T7 endonuclease I,T7EI)检 测[20-24]、Surveyor 酶[25-29]和Cruiser酶[30]。T7EI酶检测法可以检测基因编辑的脱靶情况[20]、动植物基因组DNA 突变[21,24],同时还能检测ZFN 技术在青蛙胚胎中获得的缺失突变[20],并且研究表明T7EI 酶检测缺失突变的灵敏度要优于Surveyor 酶,但不能检测单碱基突变[22,31]。Surveyor 酶检测法可快速筛查mtDNA 中的小突变[26]以及检测单碱基突变[25],并且Surveyor酶高度敏感[27],能够检出低至32 个拷贝中的1 个罕见突变体[27]。通过Cruiser 酶消化基因组片段,评估基因组编辑的效率,使用毛状根转化(hairy-root transformation)方法可以检测点突变[30]。错配切割法能对与DNA 杂交不匹配的基因组进行切割,对靶序列的选择没有限制。但该方法成本较高,对实验要求严格,耗时耗力,容易低估突变频率[32],其灵敏性不如PCR/限制性核酸内 切 酶(PCR/restriction endonuclease,PCR/RE)技术。
限制性片段长度多态性(restriction fragment length polymorphism,RFLP)是PCR 结合限制性内切酶的一种检测方法。通过PCR 扩增靶位点的DNA 片段,再用限制性内切酶酶切扩增产物,根据酶切情况判断靶位点是否被编辑。主要包括酶切扩增多态性序列(cleaved amplified polymorphic sequence,CAPS)分析方法、CAPS 衍生方法和RGEN(RNA-guided endonucleases)介导的 RFLP分析方法3种类型。
CAPS 方 法可分 为 PCR/RE[13,33-34]、RE/PCR 和RE/PCR/RE,可以对转基因幼苗进行基因分型[34],并且近似估计突变效率[31]。该方法灵敏度高、检测成本较低、操作简单,但基因编辑位点附近必须要有适合的酶切位点,且基因编辑后的原酶切位点被破坏,否则会漏检[35-36]。其中,PCR/RE 法通常简单、敏感,适用于筛选CRISPR/Cas9 诱导的突变体,但受目标序列附近的限制性内切酶位点的可用性限制。
RGEN 是指CRISPR/Cas9 可以特异性切割靶位点,若靶位点被编辑,则无法切割,最终可通过琼脂糖凝胶电泳判断基因编辑情况。此方法适用于检测CRISPR/Cas与少数TALENs系统的基因组编辑。RGEN 介导的RFLP 分析可以检测纯合突变克隆,包含相同的双等位插入/缺失(insertions/deletions,indels)序列,不受核酸酶靶位点附近序列多态性的限制[37]。但相比于CAPS 方法所使用的限制性内切酶,CRISPR/Cas9 或CRISPR/Cas12a价格更高[13]。
扩增片段长度多态性(amplified fragment length polymorphism,AFLP)是指对基因组DNA 酶切后,使用特异性引物扩增出来不同长度的片段,通过检测片段长度的多态性,来判断靶位点的编辑情况。该方法更适用于大片段的缺失检测[38-39],对小片段的插入或缺失和碱基替换无法检测,适用范围有限[13]。
临界退火温度PCR(at critical temperature PCR,ACT-PCR)主要基于突变体与野生型的退火温度存在差异。设计特异性引物,对野生型进行梯度PCR,确定临界退火温度,由于该引物不能与突变体DNA 严格匹配,导致突变体DNA 不能被有效扩增,琼脂糖凝胶电泳后便可筛选出突变体。该方法已成功应用于基因编辑水稻和基因编辑斑马鱼中[31],ACT-PCR 可以准确地区分CRISPR/Cas9 诱导的突变体和野生型。该方法比PCR/RE 和T7EI 酶有更高的灵敏度,能检测单个碱基突变的基因编辑产品,操作简单,靶点的选择不受物种限制,适用于大批量突变体检测,但对PCR引物的设计和扩增条件有较高的要求[40]。
TaqMan 荧光探针是一种寡核苷酸探针,其5'端携带发光基团,3'端携带淬灭基团。由于发光基团和淬灭基团距离近,发射的荧光信号被淬灭基团吸收,收集不到信号;但当PCR 扩增时,Taq酶的5'→3'外切酶活性将探针酶切降解,使发光基团和淬灭荧光基团分离,从而可接收到荧光信号。即每扩增一条DNA 链,就有一个荧光分子形成,实现了荧光信号的累积与PCR 产物形成的完全同步[41-42]。双荧光探针法[43]以及锁定核酸(locked nucleic acid,LNA)探针法[44],就是在此原理上进行改进的,应用于植物基因编辑产品的检测。TaqMan 方法具有高通量、特异性好、灵敏度高、操作简便等优点,可以检测和鉴定单碱基突变,可对基因编辑位点进行分型分析。但仪器、试剂贵,不适合少量样品操作,无法区分双等位基因杂合突变和纯合突变。
微滴数字PCR(droplet digital PCR,ddPCR)是通过对DNA 样品进行微滴化处理,形成众多纳米级的小液滴,有的小液滴不含待测靶分子,而有的小液滴含有一个或多个待测靶分子,PCR 扩增后收集所有小液滴的荧光信号。根据泊松分布原理、阳性比例就可以得出靶分子浓度的绝对定量[45]。该方法最早应用在人类细胞系基因组编辑检测方面,随后Gao 等[46]首次使用ddPCR 对CRIS-PR 修饰的植物大群体进行高通量筛选;并且ddPCR 能够实现超精准检测分析,最低检测限(limit of detection,LOD)达到0.1%,成功实现了对多拷贝复杂基因组物种(如油菜、小麦等)的基因编辑精准检测分析,同时该方法适用于食品加工品的基因编辑检测,如基因编辑水稻制备的米饭等[47]。ddPCR 具有极强的绝对定量能力,需要的模板量少,实验结果很少会受到引物设计因素的影响[48],具有很高的灵敏度,适合高通量操作。但是合成探针的成本较高,对样品DNA 初始浓度有较高的要求。
等位基因特异性PCR(allele specific PCR,AS-PCR)又被称为扩增阻滞突变系统(amplification refractory mutation system,ARMS)。根据等位基因上的基因编辑位点,设计2条上游引物,将突变碱基置于3'端,同时设计1 个下游引物,只有当引物3'端与模板严格互补时,才能得到PCR 扩增产物,反之,则无PCR 产物。通过电泳分离,可判断是否为基因编辑产品。该方法易于操作、成本低廉,不受限制性内切酶的限制,对仪器设备要求不高,适用于已知基因编辑位点的样品检测。但该方法对引物设计要求较高,不适用于CRISPR/Cas12a造成的突变检测[13]。
高分辨率片段分析(high-resolution fragment analysis,HRFA)是PCR 结合毛细管电泳的一种检测方法。将PCR 扩增的产物荧光标记,进行毛细管电泳,可检测不同分子量大小的PCR 产物,分辨出基因编辑造成的不同突变类型。HRFA 可有效筛选突变体,能够识别多个突变等位基因,分辨率为1 bp[49]。该方法灵敏度较高,适用于多倍体植物的检测,可以分析多个基因位点突变情况,还可以区分小到单个碱基的插入或缺失。但其无法检测出含有单碱基替换的突变,也不能区分具有相同片段大小插入或缺失的突变[13]。
高分辨率熔解曲线(high-resolution melting,HRM)分析方法的原理是:双链DNA 的熔解温度跟它的长度和碱基组成有关,当碱基发生突变后,碱基之间的作用力也会随之改变,从而影响解链温度,突变体与野生型则会产生不同的熔解曲线,可据此检测基因编辑造成的突变、SNP 和甲基化[50-51]。该方法具有极高的灵敏度和特异性、操作简单、检测速度快,特别适用于高通量操作。但HRM 不能区分野生型和AT 颠换的突变序列,分析设备昂贵,SNP 位点会有干扰,不能进行定量检测。
异源双链泳动分析法(heteroduplex mobility assay,HMA)的原理是:野生型和突变体分子杂交后产生异源双链DNA 分子,与同源双链DNA 分子相比,在电泳中的迁移率不同,从而可以区分基因有没有发生突变。HMA 可以检测植物体16S rDNA[52]、基因编辑动物[53-54],灵敏度可至单碱基水平[53];同时对HMA 进一步改造,研发出两步混合HMA(mixing HMA,mHMA)方法来识别纯合突变体[55]。HMA 与错配切割方法相比,省去了酶切步骤,避免了切割不完全导致的假阳性,但是容易错过大片段的缺失突变。
单链构象多态(single-strand conformational polymorphism,SSCP)分析法的原理是:当单链DNA 分子中的一个碱基发生变化时,可引起空间构象改变,这种差异会导致DNA 分子在电泳时的迁移率不同。SSCP 是一种经典的SNP 检测方法,可以有效地检测CRISPR/Cas9 编辑水稻,成功鉴定多个突变体[56]。针对小片段插入、缺失和错配的检测,该方法灵敏度要高于RFLP,且不受酶切位点的限制。但其不能确定基因编辑类型,只适合初筛。
聚丙烯酰胺凝胶电泳(polyacrylamide gel electrophoresis,PAGE)的原理是:单链 DNA 的构象随碱基的变化而发生改变,不同构象的DNA 在变性聚丙烯酰胺凝胶中的迁移速率不一样。因此,PAGE法也用作CRISPR/Cas9系统编辑后代的突变检测。该方法可成功检测基因编辑油菜,除1 bp indels外,其余不同大小(2~8 bp)的缺失都可以与野生型区分开来[57]。PAGE灵敏性高,但费时费力。
连接酶检测反应(ligation detection reaction,LDR)是在连接酶链式反应(ligase chain reaction,LCR)的基础上改进而成。高温连接酶一旦检测到与DNA 互补的2 条寡聚核苷酸,在接头处有点突变类型的碱基错配,连接反应就不能进行。探针与模板只有在配对的情况下,连接反应才能进行,通过温控循环,连接反应可反复进行,达到线性扩增的效果。LDR 可以区分小的indels 和SNP[58];LDR 结合 PCR 和 qPCR 的检测方法,能够在野生型过量存在时,以单分子分辨率检测点突变[59]。该方法可以用于基因分型、检测SNP 位点和点突变,以及检测ZFN、TALENs 和CRISPR/Cas9 造成的基因突变。但是LDR 通量低,同时难以满足基因编辑产品产业化后定量标识的需求。此外,由于LDR 检测方法需要已知的序列信息,所以不能用于突变体的初筛[59]。
基因芯片(gene chips),又叫做 DNA 芯片、DNA 微阵列(DNA microarray),是利用核酸杂交原理建立的一种集成化、自动化的检测技术。将待测样品DNA 与固定在芯片上的阵列探针杂交,通过激光共聚焦扫描来检测荧光信号,并对强弱进行判断,从而判断是否进行过基因编辑。基因芯片技术在SNP 分析方面也有广泛应用[60-61]。但其只适用于少量碱基改变的基因编辑产品检测。
变性高效液相色谱(denaturing high performance liquid chromatography,DHPLC)是基于 SSCP 和变性梯度凝胶电泳(denaturing gradient gel electrophoresis,DGGE)研发的一种新的突变位点检测方法。原理类似于阴离子交换层析,通过变性退火后形成同源或异源双链DNA 分子,调节温度接近至DNA 解旋温度,异源双链DNA 分子解旋温度低,更易解旋为单链,单链在分离柱上保留时间短,易被洗脱,根据峰型或数目来确定是否有突变[60]。DHPLC 方法的检测效率高、自动化程度高,比较适合大样本自动化筛选,重复性较高。但该方法对于试剂和环境要求较高,且不能检测出纯合突变。
根据不同的电离技术,可将质谱技术分为基质辅助激光解吸电离飞行时间质谱(matrix assisted laser desorption ionization time of flight,MALDI-TOF)、电喷雾离子化质谱(electrospray ionization mass spectrometry,ESI-MS)、MassARRAY 质谱分析技术等。将变性的单链产物共价结合到芯片上,在芯片上进行引物的退火、延伸反应,由于编辑部位配对的碱基与正常配对碱基的质量不同,通过飞行时间质谱可检测出不同的峰值。目前MALDI-TOF 是应用于SNP 质谱检测的主要方法[62],已成功应用于Y-SNP 位点分析[63];MassARRAY 质谱分析技术可进行基因分型[64-65]。质谱分析方法无需对靶序列进行PCR 扩增,适用于少量碱基突变的基因编辑产品的检测。
上述3 种方法,尚无用于基因编辑产品检测的文献报道,但已成功应用于SNP的检测,具有后续应用于基因编辑产品检测的潜力。
根据国际农业生物技术应用服务组织(International Service for the Acquisition of Agri-biotech Applications,ISAAA)2020 年最新统计数据,2019年全球29个国家种植了1.904亿hm2转基因作物,种植面积比1996 年增加了约112 倍[66]。当前国内外生物技术革命和产业变革加速推进,以基因编辑为代表的转基因新技术发展迅速,转基因性状更加多样,新产品不断涌现。基因编辑技术给传统的生物育种带来了效率的提升和技术门槛的降低,是助力种业弯道超车、开展种源“卡脖子”技术攻关的关键。
基因编辑产品根据双链DNA 断裂后的不同修复机制分为3 类:第一类(SDN1)不引入修复模板及任何外源基因,只存在点突变、少量几个碱基插入或缺失;第二类(SDN2)引入同源修复模板,通过同源重组,导致基因组1 个到几个碱基突变(<20 bp);第三类(SDN3)为通过同源重组修复途径,在靶位点插入大片段外源基因[67]。相比于转基因产品而言,基因编辑技术在受体生物内留下的痕迹较少,传统的转基因检测技术很难满足基因编辑产品的检测,特别是SDN1 和SDN2 这类只涉及少量碱基改变的产品,因此,需要加强检测新技术的研究,建立针对基因编辑产品等新技术产品的检测方法。
对于SDN1 类和SDN2 类编辑位点和序列已知的基因编辑产品,可使用ACT-PCR 分析方法、Taqman 方法、ddPCR 分析方法、AS-PCR 分析方法等中的一种或几种进行初筛,对筛查得到的疑似或阳性样品再通过Sanger法测序或NGS测序进一步确定,可大幅减少工作量;对于SDN3 类编辑位点和序列已知的基因编辑产品,可参照目前转基因产品检测策略对其进行检测。对于编辑位点和序列未知的基因编辑产品,可根据热门编辑位点和常见脱靶位点等,采用错配切割法、RFLP 分析方法、AS-PCR分析方法、HRFA分析方法、HRM分析方法、SSCP 分析方法、DHPLC 分析方法、质谱分析方法等中的一种或几种进行初筛,对筛查得到的疑似或阳性样品再通过Sanger法测序或NGS测序进一步确定。同时,通过测序结合大数据分析对未知基因编辑产品进行鉴别也是未来检测技术发展的趋势之一。
就目前来说,PCR/RE、Sanger 法测序、NGS 测序技术和错配切割法应用比较广泛。其他方法的应用相对较少。选择何种检测方法,与基因编辑效率、突变类型、植物倍性等密切相关。并且每种方法都存在自身局限性,检测时可以根据具体需求进行选择,利用单一或多种方法结合起来进行检测、验证。
与此同时,基因编辑技术的快速发展也给我国农业转基因生物安全监管工作带来了前所未有的挑战。结合我国现有转基因监管和基因编辑技术的发展情况,应当完善基因编辑产品相关管理政策、法规。目前我国转基因产品监管与安全评价的主要依据是《农业转基因生物安全管理条例》《农业转基因生物安全评价管理办法》及《农业转基因生物安全评价指南》等,但由于基因编辑产品的特殊性,现行法规并不完全适用,应遵循“个案分析”与“分类管理”相结合的原则,制定、修订相关法律法规,完善安全评价与监管制度,加强基因编辑产品的管理。
随着基因编辑产品的不断涌现,对其进行快速、准确的检测以及检测方法的多样性也将成为标准检测流程构建的一个巨大挑战,优化突变检测技术仍是今后的努力方向。加快基因编辑产品检测标准与检测方法的研究,以保护研发人员的知识产权,为国家安全监管监测提供有力的技术支撑。