靶向敲除棉花GhAGL16 高效sgRNA 的筛选

2024-04-09 06:48雷建峰尤扬子张锦恩代培红于莉杜正阳李月刘晓东
中国农业科学 2024年6期
关键词:突变体亚组靶向

雷建峰,尤扬子,张锦恩,代培红,于莉,杜正阳,李月,刘晓东✉

1 新疆农业大学农学院/棉花教育部工程研究中心,乌鲁木齐 830052;2 新疆农业大学生命科学学院,乌鲁木齐 830052

0 引言

【研究意义】棉花是我国重要的经济作物,在生长发育过程中会受到各种非生物胁迫的影响,其中,干旱和土壤盐渍化是影响棉花产量和品质下降的重要因素。超表达抗旱耐盐正调控基因,培育棉花新种质是当前普遍采用的思路和方法[1-3],但是,在棉花体内还存在一些抗旱耐盐的负调控基因[4-6],获得这些基因的相应突变体材料是进一步明确基因功能、解析棉花重要农艺性状形成分子机制的关键步骤。CRISPR/Cas基因编辑技术的出现解决了随机突变盲目性的缺点,为创制棉花突变体、实现棉花的精准遗传改良提供了重要的技术手段。然而,sgRNA 作为CRISPR 系统关键元件之一,在基因组的很多位点上是低效或者无效的[7]。在利用CRISPR 系统获得棉花突变体之前,必须要对能够高效敲除靶基因的sgRNA 进行筛选。因此,利用简单、快捷的技术手段筛选出能高效敲除棉花靶基因的sgRNA,对缩短获得棉花突变体的周期具有重要意义。【前人研究进展】MADS-box 基因是植物体内一类重要的转录调控因子,几乎参与了植物整个生长发育的过程。大量研究表明,MADS-box 基因家族众多成员在植物胚胎细胞分化、配子体和营养组织发育及果实成熟等过程中起着核心而保守的作用[8]。例如,AGL12调控拟南芥根分生组织的增殖和开花转化[9]。AGL21在多种环境和生理信号诱导下调控拟南芥侧根的发育,并且可以通过响应ABA信号来调控种子萌发[10-11]。在番茄中,超表达SlMBP9降低了生长素的生物合成和极性运输,并且负调控番茄侧根的形成[12]。马铃薯StPOTM1在腋窝分生组织中大量积累,参与调控腋芽的形成[13]。此外,还有研究报道,在拟南芥中,异源超表达柑橘CiMADS43能够促进转基因拟南芥早花和卷叶[14]。然而,目前大部分研究都集中在MADS-box 转录因子调控植物生长发育的研究,对于其参与植物逆境胁迫应答反应的研究还相对匮乏。近期,研究发现Ⅱ型MADS-box 家族成员AGL16(AGAMOUS-LIKE16)转录因子与抗旱反应存在非常紧密的关系。AGL16通过调控拟南芥气孔密度和ABA 含量在响应干旱胁迫的过程中发挥负调控的作用[15]。此外,AGL16还可以与HsfA6a和MYB102启动子中的CArG 基序结合,抑制二者的表达,拟南芥agl16突变体表现出良好的耐盐性[16]。最重要的是AGL16发生移码突变后,其突变体在生长发育上与野生型相比并没有明显差异[15],暗示着AGL16突变后并不影响植株的正常生长发育,可作为作物抗旱耐盐育种的理想候选基因。【本研究切入点】目前,关于棉花GhAGL16转录因子参与调控干旱和盐胁迫应答反应的研究还未见报道。在前期工作中,雷建峰课题组利用病毒诱导的基因沉默技术(virus-induced gene silencing,VIGS)在陆地棉中沉默了GhAGL16,沉默植株表现出良好的抗旱性。获得棉花agl16突变体是进一步明确GhAGL16功能的关键步骤,因此,迫切需要利用基因编辑技术创制棉花agl16突变体。【拟解决的关键问题】本研究根据实际克隆的GhAGL16序列,设计了3 个能同时靶向敲除GhAGL16-A 亚组和GhAGL16-D 亚组序列的sgRNAs。利用CLCrV 介导的 VIGE 系统[17]筛选能靶向敲除GhAGL16的sgRNAs,并验证这些sgRNAs 的特异性,为定向创制棉花agl16突变体奠定坚实的基础。

1 材料与方法

1.1 试验材料

试验于2022—2023 年在新疆农业大学农业生物技术重点实验室进行。所用AtU6-26::sgRNA 载体、棉花叶皱缩病毒载体 CLCrV-A 和 CLCrV-B 及Cas9-OE 棉花材料YZ-1 均由棉花教育部工程研究中心保存。引物合成及测序由上海生工生物科技有限公司完成。

1.2 CLCrV-AtU6-26::GhAGL16-sgRNAs 载体构建

基于在棉花YZ-1 中A 亚组和D 亚组上实际克隆的GhAGL16基因组序列,利用CRISPR-GE[18]在线工具(http://skl.scau.edu.cn/targetdesign/)设计了3 个能同时靶向敲除GhAGL16-A 亚组和D 亚组序列的sgRNAs(表1)。每个sgRNA 在PAM 位点上游都包含了一个酶切位点,便于突变检测。使用截短的拟南芥AtU6-26 启动子(330 bp)驱动sgRNA 表达,sgRNA 合成方法及操作流程参照雷建峰等[19]方法,测序验证3 个AtU6-26::GhAGL16-sgRNAs 表达载体的正确性。将测序正确的AtU6-26::GhAGL16-sgRNAs质粒用SpeⅠ和PacⅠ酶切,回收核心片段与CLCrV-A载体重组。候选的重组质粒经SpeⅠ和PacⅠ酶切鉴定正确后命名为:CLCrV-AtU6-26::GhAGL16-sgRNA1、CLCrV-AtU6-26::GhAGL16-sgRNA2 和CLCrV-AtU6-26::GhAGL16-sgRNA3。最后,将不同靶向敲除棉花GhAGL16的CLCrV-GhAGL16-sgRNAs 终载体转入农杆菌感受态GV3101,用于下一步接种转化试验。

表1 本研究中使用的引物序列Table 1 Primer sequences used in this study

1.3 Cas9 表达量检测

选取种质饱满的YZ-1 野生型和Cas9-OE 棉种放入水中,28 ℃浸泡24 h,使其萌发露白。待发芽后将其移栽至营养土中(蛭石∶黑土=3∶1),放置培养室(28 ℃,16 h 光/8 h 暗)培养。选取生长14 d 左右的棉花子叶,参照植物多糖多酚RNA 提取试剂盒说明分别提取野生型和Cas9-OE 棉花子叶总RNA,并使用反转录试剂盒合成cDNA。以上述cDNA 为模板,棉花GhUBQ7作为内参基因,qPCR 扩增Cas9,引物设计见表1。每个样品设置3 组技术重复,并根据2-ΔΔCt公式[20]计算Cas9表达量。

1.4 CLCrV-GhAGL16-sgRNAs 瞬时转化Cas9-OE 棉花

将冻存的不同CLCrV-AtU6-26::GhAGL16-sgRNAs和CLCrV-B 农杆菌菌液划线培养,挑取单克隆接种于2 mL LB 培养基(含50 µg·mL-1Kan 和50 µg·mL-1Rif)中活化,28 ℃,200 r/min 培养过夜。分别吸取50—100µL 不同活化菌液接种到10 mL LB(含50 µg·mL-1Kan和50 µg·mL-1Rif)培养基中,28 ℃,200 r/min 大摇,培养菌液浓度OD600至1.6—1.8 左右,4 000 r/min 离心10 min 收集农杆菌培养物。彻底去除液体培养基后,将不同农杆菌培养物重悬于转化液(10 mmol·L-1MgCl2、10 mmol·L-1MES 和200 μmol·L-1乙酰丁香酮)中,并调整OD600终浓度为1.0 左右。最后,将CLCrV-B与不同的CLCrV-AtU6-26::GhAGL16-sgRNAs 重悬液等比例混合,室温下静止3 h 后进行接种转化试验。

1.5 突变检测

接种7—10 d 后,分别从接种不同CLCrV-AtU6-26::GhAGL16-sgRNAs 棉花子叶中提取基因组DNA。取接种相同sgRNAs 株系DNA 各1 µL 进行混样,以野生型棉花和混样DNA 为模板,使用突变检测引物(表1)对GhAGL16进行覆盖靶位点的PCR 扩增。PCR 反应程序为98 ℃ 30 s;98 ℃ 10 s,60 ℃ 30 s,72 ℃ 24 s,35 个循环;72 ℃ 7 min。反应结束后,对覆盖GhAGL16-sgRNA1、GhAGL16-sgRNA2和GhAGL16-sgRNA3 靶点的PCR 产物回收、纯化,用相应的限制性内切酶FspBⅠ、DdeⅠ和XapⅠ进行酶切消化处理。未被消化的PCR 产物进一步回收、纯化,与Blunt Zero 平端克隆载体连接、转化。挑取单克隆进行测序,验证3 个不同靶点的GhAGL16是否发生突变,筛选出可有效敲除GhAGL16的sgRNAs。

1.6 sgRNA 二级结构分析

利用RNAfold WebServer 在线工具对GhAGL16-sgRNAs 的二级结构进行分析。

1.7 基因编辑效率分析及脱靶率检测

为了明确GhAGL16编辑效率,对每一个单株进行PCR/RE[21]突变检测。同时,设计高通量测序检测引物(表1),利用Hi-TOM 高通量测序检测GhAGL16突变单株的真实编辑效率。另外,根据设计的GhAGL16-sgRNA2 序列,利用CRISPR-GE 在线工具确定潜在的脱靶位点。每个潜在脱靶序列都包含了3—4 个错配碱基,利用这些潜在脱靶序列在陆地棉数据库中(https://www.cottongen.org/)检索对应基因的基因组序列。设计脱靶率检测引物(表1),采用Hi-TOM高通量测序检测脱靶率。

2 结果

2.1 CLCrV-AtU6-26::GhAGL16-sgRNAs 载体构建

对3 个重组质粒进行酶切鉴定,结果显示,CLCrV-AtU6-26::GhAGL16-sgRNA1、CLCrV-AtU6-26::GhAGL16-sgRNA2 和CLCrV-AtU6-26::GhAGL16-sgRNA3 经SpeⅠ和PacⅠ酶切消化后,都产生了516 bp(AtU6-26::GhAGL16-sgRNAs 片段)和1 1282 bp(CLCrV-A 片段)2 条带,酶切结果与预期酶切片段大小相符(图1),表明不同靶向敲除棉花GhAGL16的CLCrV-AtU6-26::GhAGL16-sgRNAs 均已构建成功。

图1 CLCrV-AtU6-26::GhAGL16-sgRNAs 表达载体的酶切鉴定Fig. 1 Identification of CLCrV-AtU6-26::GhAGL16-sgRNAs expression vector by enzyme digestion

2.2 Cas9-OE 棉花植株中Cas9 表达量的检测

为验证Cas9-OE 植株中Cas9的表达水平,以野生型和一些Cas9-OE 植株的cDNA 为模板,qPCR 扩增188 bpCas9片段。结果表明,Cas9在不同Cas9-OE棉株中稳定表达(图2)。选择所有Cas9稳定表达的转基因株系用于后续研究。

图2 qPCR 检测Cas9 表达量Fig.2 Detection of Cas9 expressions by qPCR

2.3 CLCrV 介导靶向敲除棉花GhAGL16

通过PCR/RE方法检测接种不同CLCrV-AtU6-26::GhAGL16-sgRNAs 的植株GhAGL16在靶位点的突变情况。对于接种CLCrV-AtU6-26::GhAGL16-sgRNA2的植株,PCR 扩增GhAGL16(797 bp),用引导序列上的限制性内切酶DdeⅠ消化PCR 产物。结果显示,在野生型棉花中,该靶点GhAGL16的PCR 产物被DdeⅠ完全消化,未见扩增产物残留。而在Cas9-OE 植株中,却保留了大量原始的PCR 扩增产物(图3-A)。对未消化的PCR 产物克隆测序,结果显示,在棉花A亚组和D 亚组上的GhAGL16均出现了不同碱基缺失的突变类型(图3-B—C)。对于接种CLCrV-AtU6-26::GhAGL16-sgRNA1 和CLCrV-AtU6-26::GhAGL16-sgRNA3 的Cas9-OE 植株,PCR 分别扩增509 和628 bp的GhAGL16片段。PCR 产物用靶位点相应的限制性内切酶FspBⅠ(GhAGL16-sgRNA1)和XapⅠ(GhAGL16-sgRNA3)酶切,没有条带残留(图略)。以上结果表明,GhAGL16-sgRNA1 和GhAGL16-sgRNA3 是2 个无效sgRNA,而GhAGL16-sgRNA2 可有效用于棉花GhAGL16的靶向敲除。

图3 CLCrV 介导靶向敲除棉花GhAGL16Fig. 3 CLCrV-mediated targeted knockout of cotton GhAGL16 gene

2.4 GhAGL16-sgRNAs 的二级结构分析

进一步探究GhAGL16-sgRNA1和GhAGL16-sgRNA3不能实现编辑原因,比较3 个GhAGL16-sgRNAs 的二级结构。结果显示,3 个sgRNA 除缺失非必须颈环1外,均具有颈环2、颈环3 和颈环RAR 必须环状结构(图4),并且引导序列与gRNA 序列之间的总碱基对(total base pairs,TBPs)均未大于12 个。其中,GhAGL16-sgRNA1 10 个,GhAGL16-sgRNA2 12 个,GhAGL16-sgRNA3 11 个。3 个sgRNA 连续碱基对(consecutive base pairs,CBPs)均不超过7 个,无引导序列内部碱基对(internal base pairs,IBPs)。虽然GhAGL16-sgRNA1 和GhAGL16-sgRNA3 的CBPs 数量均未超过上限(7 个),但参考碱基对概率发现GhAGL16-sgRNA1 和GhAGL16-sgRNA3 可能存在引导序列易与其他位点发生配对并且不易解链的现象,从而干扰了引导序列对目标位点的识别,导致sgRNA无效。

图4 GhAGL16-sgRNAs 的二级结构分析Fig. 4 Analysis of secondary structure of GhAGL16-sgRNAs

2.5 高通量测序检测基因编辑效率

为进一步量化GhAGL16-sgRNA2 对GhAGL16的编辑效率,对每一株接种CLCrV-AtU6-26::GhAGL16-sgRNA2 的Cas9-OE 植株进行突变检测。PCR/RE 突变检测结果显示,在接种的9 株植株中有6 株(#2、#4、#6、#7、#8 和#9)发生了突变(图5),编辑效率为66.67%。同时,Hi-TOM 高通量测序分析突变单株中GhAGL16编辑效率,结果显示,在发生编辑的6株植株中,有3 株只实现了棉花A 亚组或D 亚组上GhAGL16的靶向编辑。其中,在植株#2 和#7 中仅检测到A 亚组上的缺失突变,编辑效率分别为12.71%和9.39%;在植株#4 中仅检测到D 亚组上的缺失突变,编辑效率为3.29%。此外,有3 株(#6、#8 和#9)同时实现了棉花A 亚组或D 亚组上GhAGL16的靶向编辑。其中,植株#6 的编辑效率最高,在A 亚组上编辑效率为20.40%,D 亚组上为34.02%;植株#8 和#9的编辑效率相对较低,在A 亚组上的编辑效率分别为15.21%和8.24%,D 亚组上为13.01%和5.45%(表2)。去除仅在单个亚组实现编辑的植株,经统计,GhAGL16-sgRNA2 对GhAGL16的编辑效率为13.69%—54.42%。

表2 GhAGL16 突变效率分析Table 2 Analysis of mutation efficiency of GhAGL16 gene

2.6 脱靶分析

虽然GhAGL16-sgRNA2 可实现棉花GhAGL16的定向编辑,但该位点是否存在潜在的脱靶效应需要进一步验证。通过CRISPR-GE 检索到4 个在CDS 区存在潜在脱靶的位点,off-score 值分别为0.583、0.212、0.006 和0(图6)。Hi-TOM 高通量测序结果显示,在预测的4个潜在脱靶位点中都没有出现脱靶现象(表3),说明GhAGL16-sgRNA2 靶向敲除GhAGL16不仅具有高效的基因编辑效率,而且具有专一的基因编辑特异性。

图6 4 个潜在脱靶位点序列比对分析Fig. 6 Sequence alignment analysis of four potential offtarget sites

表3 潜在脱靶点的检测与分析Table 3 Detection and analysis of potential off-target sites

3 讨论

3.1 靶向敲除棉花GhAGL16 有效sgRNA 的筛选

利用RNAi(RNA interference)技术[22]可以实现GhAGL16转录水平上的RNA 干扰,但可能存在对GhAGL16表达抑制不彻底的现象。因此,利用CRISPR/Cas 基因编辑技术创制棉花agl16突变体是明确GhAGL16功能最有效的途径。尽管CRISPR 系统的简易性使其迅速成为首选的基因组编辑工具,但要在棉花中实现靶基因的定向编辑是困难的。植物病毒载体是投送sgRNA 的理想工具,即便大多数植物病毒载体不能承载巨大的Cas9 蛋白,但足以表达短小的sgRNA[23-24]。研究表明,植物病毒介导的基因编辑(VIGE)体系可用于农作物基因的靶向编辑[25-27]。因此,本研究利用前期已建立的CLCrV 介导的VIGE 体系[17,24]筛选能高效敲除GhAGL16的sgRNA。根据在棉花YZ-1 中实际克隆的GhAGL16组序列,确定了3个能同时靶向敲除GhAGL16-A 亚组和GhAGL16-D 亚组序列的 sgRNAs,尽可能地消除不同棉种间GhAGL16靶位点存在SNP 位点,导致sgRNA 不能与靶位点有效结合的可能性。接种相应病毒载体的棉花子叶是sgRNA 表达的起点,因此,本研究提取接种不同GhAGL16-sgRNAs 植株子叶基因组DNA 进行突变检测。PCR/RE 突变检测结果显示,GhAGL16-sgRNA2能够同时敲除GhAGL16-A 亚组和GhAGL16-D 亚组序列,突变类型主要以碱基缺失为主(图3)。另外,高通量测序结果显示,去除仅在单个亚组实现编辑的植株,GhAGL16-sgRNA2 对GhAGL16的编辑效率为13.69%—54.42%,突变类型与PCR/RE 突变检测结果基本一致(表2),说明GhAGL16-sgRNA2 可有效用于GhAGL16的靶向敲除。研究发现sgRNA 的二级结构可能会影响sgRNA 与靶位点的结合效率[28]。在本研究中,接种GhAGL16-sgRNA1 和GhAGL16-sgRNA3的植株并未检测到突变,推测未检测到编辑事件的原因可能与sgRNA 的二级结构有关。尽管GhAGL16-sgRNA1 和GhAGL16-sgRNA3 的设计符合CBPs和GC含量要求[29],但存在引导序列易与其他序列发生配对并且不易解链的可能,从而干扰了引导序列对靶位点的识别,最终导致sgRNA 无效。

3.2 GhAGL16-sgRNA2 基因编辑特异性检测

CRISPR/Cas9 系统由20 bp 的sgRNA 通过碱基互补配对来识别靶位点序列,从而介导Cas9 蛋白对DNA 序列的切割,但是20 bp 的sgRNA 与目的基因靶位点结合配对的同时也有可能与基因组其他位点结合,造成脱靶现象[30-31]。已有研究表明,Cas9 蛋白具有一定的容错性,即便引导序列中存在4—5 个错配碱基,仍然可以切割与靶位点高度同源的非目标序列[32],这种潜在脱靶问题可能会限制有效sgRNA 在创制各类突变体中的应用。一个高效sgRNA 的标准不仅要有较高的基因编辑效率,而且具有专一的靶基因编辑特异性。因此,本研究继续探究了GhAGL16-sgRNA2 对GhAGL16编辑的特异性。结果表明,在预测的4 个潜在脱靶位点上均未检测到脱靶现象(表3),说明GhAGL16-sgRNA2符合高效sgRNA 的筛选标准,这为进一步精确创制棉花agl16突变体提供了良好的开端。此外,随着各类测序技术(GUIDE-seq[33]、CIRCLE-seq[34]和CHANGE-seq[35])的发展,可以高灵敏、高特异、无偏好性地检测基因编辑的特异性。

3.3 利用VIGE 系统获得可遗传棉花agl16 突变体的展望

本研究虽然利用CLCrV 介导的VIGE 系统筛选获得一个可高效敲除GhAGL16的sgRNA,但目前无法实现将GhAGL16的突变稳定遗传给下一代。研究报道,成花素FT(flowering locus T)可以将sgRNA 长距离运输至植物顶端分生组织(shoot apical meristem,SAM)中,实现生殖细胞的编辑,从而获得可遗传的基因编辑[36-37]。此外,还有研究表明,大麦条纹花叶病毒(barley stripe mosaic virus,BSMV)是一种可以定植在SAM 组织的植物病毒,未经修饰的sgRNA 接种Cas9-OE小麦后,也能够实现可遗传的基因编辑[26]。这些研究为难以遗传转化的植物不经过组织培养过程,定向创制突变体提供了新的策略。因此,要想利用VIGE 系统获得可遗传的棉花agl16突变体后代,需要对可系统侵染棉花的各类植物病毒进行改造,测试这些病毒是否可以实现SAM 组织中靶基因的编辑。如果该思路可行,可以极大地促进棉花基础生物学和棉花分子设计育种的研究。

4 结论

利用CLCrV 介导的VIGE 系统成功筛选获得1 个能高效敲除GhAGL16的sgRNA。

猜你喜欢
突变体亚组靶向
慢性阻塞性肺疾病患者膈肌移动度分析
如何判断靶向治疗耐药
槭叶铁线莲亚组的研究进展
MUC1靶向性载紫杉醇超声造影剂的制备及体外靶向实验
毛必静:靶向治疗,你了解多少?
冠心病患者肠道菌群变化的研究 (正文见第45 页)
CLIC1及其点突变体与Sedlin蛋白的共定位研究
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
SHP2不同突变体对乳腺癌细胞迁移和侵袭能力的影响
靶向超声造影剂在冠心病中的应用