杨文文 倪嘉瑶 胡蕊洁 王华忠
(天津师范大学生命科学学院 天津市动植物抗性重点实验室,天津 300387)
含有反向重复序列的DNA 属于一类复杂的测序模板,目前,基于Sanger 法的常规测序方案尚不能有效地解决这一问题[1-3]。通过RNA 干扰(RNA interference,RNAi)方法创制基因沉默材料并对相应的表型进行鉴定是重要的功能基因组研究策略之一[4-6]。目前主流的RNAi 技术都需要构建靶基因反向重复序列的表达载体,进而通过转化方法在细胞中表达出RNAi 的起始效应子——双链RNA。RNAi载体构建的正确性至关重要,最终必须通过DNA 测序进行确认,这就对反向重复DNA 的序列测定带来了挑战。
目前,根据载体的类型和双链RNA 产生方式,在植物中实现RNAi 的技术主要包括发夹结构RNA(hpRNA)表达载体的转化[7]和病毒诱导的基因沉默(Virus-induced gene silencing,VIGS)[8]。hpRNA表达载体上构建有“启动子—靶基因片段反向重复—终止子”表达盒,2 个反向重复中间间隔有内含子效率更高[9]。该类载体能够在细胞内转录出含双链结构的hpRNA,经加工后诱发RNAi。VIGS 技术则是利用RNA 病毒的基因组分子携带靶基因片段进入细胞,通过病毒双链RNA 复制中间体的产生实现靶基因片段双链RNA 的生成和RNAi 的诱发[10-11]。在载体构建阶段,病毒基因组RNA 通常以cDNA 的形式保存于质粒载体上,采用常规分子克隆技术将靶基因片段插入到病毒基因组上。病毒的接种可以通过2 种方法实现,其一是通过体外转录方法获得感染性的病毒基因组RNA 用于植物接种[11];其二是通过农杆菌介导的称为agroinfiltration 的方法进行植物接种[12]。在VIGS 技术中,由于靶基因双链RNA的产生是源自病毒的双链RNA 复制中间体,在病毒基因组上仅插入靶基因的一段正向或反向片段即可实现基因沉默。但是有研究表明,插入靶基因串联反向重复片段的病毒基因组能够实现更高效的基因沉默[13]。
以上两类RNAi 载体都要求克隆有靶基因片段的反向重复。在对RNAi 载体的正确性进行测序验证时,位置紧邻的反向重复序列在测序反应中有形成单链分子内二级结构的倾向,影响引物的结合和DNA 聚合酶的延伸[1-3]。已经报道的解决方案主要围绕测序反应的优化进行,包括测序反应中各成分含量的调整、特殊添加物的使用、反应各步骤温度和时间的优化等[14-17]。这些方案的技巧性较强,不同序列组成和长度的反向重复片段形成二级结构的稳定性不同,需要反复优化测序反应,这对于大多数自身不具备测序条件而将测序试验完全委托给公司的实验室而言实施起来比较困难。
本研究在前期构建小麦基因的VIGS 载体过程中也遇到了反向重复序列的测序问题,为排除测序反应中2 个反向重复片段之间的干扰,进而开发了一种新的测序前载体处理策略:将反向重复片段中的一个切除后对保留在载体上的另外一个进行测序,经过2 次酶切和2 次测序可以有效地对载体上的2个反向重复片段分别进行序列测定,进而确认构建载体的正确性。
1.1.1 载体和试剂 小麦自噬相关基因TaATG2为天津师范大学王华忠教授课题组已克隆基因,其全长cDNA 保存于载体上。基于大麦条斑病毒BSMV的VIGS 载体BSMVγ1保存于天津师范大学王华忠教授课题组实验室。试验用到的高保真DNA 聚合酶primeSTAR、普通Taq 酶、限制性内切酶(BamHⅠ、SpeⅠ和SalⅠ)以及大肠杆菌DH5α 感受态细胞均为TakaRa 公司产品;快速连接试剂盒(LigaFast)购自Promega 公司;引物合成委托北京六合华大基因科技有限公司完成;其他试剂均为国产分析纯。
1.2.1 载体构建 设计合成2 条正向引物ATG2-F(5′-CGCGGATCCTCAAGCCTATTGTTCTGCACA-3′,下划线为BamHⅠ识别位点)和ATG2-F1(5′-ACG CGTCGACTCAAGCCTATTGTTCTGCAC A-3′, 下 划线为SalⅠ识别位点),以及一条反向引物ATG2-R(5′-GGACTAGTAGGATCAAA CTGACGAGGGA-3′,下划线为SpeⅠ识别位点)。2 条正向引物分别和同一条反向引物搭配,用于从TaATG2的同一50 bp 区段扩增出BamHⅠ-正向片段-SpeⅠ和SpeⅠ-反向片段-SalⅠ。以含有TaATG2全长cDNA 的质粒为模板,使用高保真DNA 聚合酶primeSTAR 进行PCR 扩增。2 个扩增片段经双酶切后与BamHⅠ/SalⅠ双酶切切开的载体BSMVγ1同时进行连接,目的是获得插入串联反向重复片段(BamHⅠ-正向片段-SpeⅠ-反向片段-SalⅠ)的重组载体。连接产物转化大肠杆菌后,使用菌落PCR 方法初步鉴定候选重组载体,对候选重组载体进行DNA 测序验证。
1.2.2 构建载体的测序验证 使用2 种质粒处理方法对候选重组载体进行测序验证。一种是提取完整载体质粒后直接送到公司测序;另一种是对载体质粒首先进行酶切处理,切下一个基因片段后将保留另一个片段的线性化载体送公司测序,分别完成对2 个插入片段的测序。
经PCR 扩增获得TaATG2一个50 bp 区段的2 个片段BamHⅠ- 正向片 段-SpeⅠ(图1-A)和SpeⅠ-反向片段-SalⅠ(图1-B)。将双酶切后的2 个片段与载体BSMVγ1同时进行连接,获得插入TaATG2串联反向重复片段的VIGS 载体pBSMVATG2(图1-B)。连接产物转化大肠杆菌后采用菌落PCR 法初步筛选重组克隆,菌落PCR 使用的引物P1 和P2 的识别位点位于载体上的插入位点两侧(图1-B)。根据扩增产物的电泳结果,挑选扩增出约500 bp(394 bp 载体序列+106 bp 串联反向重复片段和中间SpeⅠ切点)大小片段的菌落克隆(图1-C中的箭头所示泳道)作为候选克隆进行下一步的测序验证。
在菌落PCR 的电泳中还发现扩增产物大于500 bp 的情况(图1-C 中的非箭头所示泳道),推测是载体上同时插入了4 个或更多片段所致。这种情况产生的原因可能是连接反应中分子量较小的基因扩增片段相对浓度较高,从而容易导致多个片段串联插入到载体上。
图1 TaATG2 的VIGS 载体构建
为了验证构建载体的正确性,以提取的完整环状质粒为模板、使用载体上插入位点一侧的P2 引物向插入位点方向进行测序(图2-A)。结果发现,插入位点之前的载体序列部分测序信号正常,但进入SalⅠ位点后仅能正常测出反向片段的前20 bp 左右的序列,之后的测序信号呈现套峰(图2-B)或迅速衰减(图2-C)。更换测序公司或优化测序反应均无法解决这一问题,因而制约了对构建载体正确性的确认。
图2 以完整质粒为模板的串联反向重复片段的测序
完整质粒测序失败的原因可能是正、反向片段在载体上有形成单链内部二级结构的倾向,为此设计了一个新的测序方案:酶切切除反向重复片段中的一个后对线性化载体上的另外一个进行测序。新方案的测序结果表明,保留在载体上的正向片段(图3-A)或反向片段(图3-B)均能得到清晰的测序信号和正确的测序结果。测序信号通过目的片段到达线性化载体的末端后迅速衰减。末端序列为ACTAGA,其中ACTAG 是SpeⅠ的粘性末端,最末端的A 是由测序反应中使用的Taq 类聚合酶添加(图3)。新方案对正、反向片段的测序结果证明了构建载体的正确性。
载体构建是操纵基因表达或沉默的重要环节之一。过去一段时间,通过酶切、连接方法构建的载体一般通过酶切获得插入片段的方法进行正确性验证。但是经酶切验证的载体仍然可能存在错误,如来自PCR 扩增的插入片段可能是或混有大小相近的非特异性扩增产物、PCR 过程引入了序列突变、多个载体同时构建时不同插入片段的交叉污染以及构建载体的交叉污染或人为混淆等。这些错误如得不到发现会使后续的基因表达或沉默试验得不到正确的结论,也浪费了时间、人力和物力。近年来随着DNA 测序成本的下降,构建的载体最终都要通过测序来确保准确。开展hpRNA 表达或VIGS 等RNAi试验都需要构建能够表达靶基因反向重复片段的载体[7,13]。此类载体上的反向重复片段,特别是串联反向重复片段的直接测序目前还是Sanger 测序法应用上的难点[1-3]。本研究也证实了这一困难的存在,对串联反向重复片段进行测序时因模板二级结构的形成导致测序信号出现乱峰或衰减。为了解决这一困难,本研究尝试了将反向重复片段中的一个切除后对保留在载体上的另外一个进行测序的方案,发现该方案确实可以有效地实现对2 个重复片段的序列测定,进而确认构建载体的正确性。
也有报道采用在载体上的2 个反向重复片段之间进行酶切后测序的方法,酶切后的2 个片段分别位于线性化载体的2 个末端[1-2]。本研究也尝试了这一方法,但目的片段部分的测序信号杂峰较严重,序列可读性差。这种方法的可行性可能与插入片段的序列组成及长度,以及载体的大小(影响酶切后2 个位于末端的反向重复之间的距离和形成二级结构的难易)有关。
近几年的载体构建工作中,Gibson assembly、LIC(ligation-independent cloning) 和Gateway 等 几种不依赖于酶切、连接的无缝克隆方法也逐渐被采用[18-20]。鉴于反向重复片段在直接测序上的困难,在使用这几种方法构建RNAi 载体时建议在插入的反向重复片段两端和中间引入适当的酶切位点,以便采用本研究开发的策略对正、反向片段分别测序,实现对所构建载体正确性的准确判断。
图3 酶切切除载体上反向重复片段中的一个后对另外一个进行测序
开发了一个有效的RNAi 载体上的反向重复片段测序策略:切除一个片段后对保留的另外一个进行测序,经过2 次酶切和2 次测序可以有效地对2个反向重复片段分别进行序列测定,进而确认构建载体的正确性。