任文闯 ,王 欣,张亚辉,汤蕴琦,黄 君
(华南农业大学 农学院, 广东 广州 510642)
籽粒是玉米储存营养物质的重要器官,其发育状况与玉米品质和产量密切相关。早在1980 年,就有学者利用EMS 化学诱变对玉米籽粒突变体相关基因进行了研究,并根据表型将籽粒突变体分成了籽粒不透光、穗发芽、小籽粒、皱缩、空果皮、胚缺陷和胚乳缺陷7 个类型[1]。近年来,随着玉米全基因组测序完成和生物技术的不断发展,不同类型的玉米籽粒突变体,包括胚特异突变体、胚乳缺陷突变体、胚和胚乳双缺陷突变体被广泛应用于籽粒发育相关的基因功能研究[2-9]。
胚特异突变体一般籽粒发育迟缓,胚的生长受到干扰导致有明显缺陷,而胚乳发育正常。近年来,已经筛选出大量的与胚发育相关的emb(Embryo-specific)突变体,并证实emb类突变体相关基因作用于籽粒发育不同阶段[2]。玉米籽粒胚乳缺陷突变体的典型类型是玉米粉质胚乳突变体,该突变体会出现不同程度的蛋白体结构或功能缺陷,表型通常与胚乳内蛋白体或淀粉粒相关[3]。目前为止,这类突变体研究较多的是高赖氨酸突变体如o2、o5和o7等,高赖氨酸突变体的表达通常与醇溶蛋白的结构、分布和含量密切相关[4-6]。胚与胚乳发育缺陷突变体按照表型特点主要有3 种不同类型,分别是空果皮、胚乳缺陷和小籽粒突变体,这些突变体相关基因除了emp2、emp6、smk2等小部分之外,大多属于PRR 基因家族,主要参与线粒体基因的加工与转录,包括RNA 的剪切和编辑,调控线粒体基因的表达等过程[7-9]。
虽然玉米籽粒发育相关基因的克隆和分子机理研究已经取得较大的进展,但由于玉米基因组较大,转座子原件较多,相对于拟南芥和水稻而言基因组更加复杂,仍有大量籽粒突变体基因的功能及分子机制不清楚。本研究以玉米自发籽粒突变体shank2021(sh2021)为试验材料,通过表型鉴定、遗传分析和基因定位等,为后续该基因的克隆和籽粒发育调控网络的解析奠定基础。
‘B73’种植过程中的自发籽粒皱缩突变材料,命名为shank2021(sh2021),以正常玉米自交系‘W22’为父本与突变体杂交,通过F1自交构建F2分离群体进行后续定位研究。
观察野生型(Wild type, WT)和突变体籽粒的表型,分析其在籽粒大小、结构、胚和胚乳发育等方面的差异。
分别取100 粒野生型和突变体的完熟期籽粒,室温条件下用水浸泡36 h 后,对胚进行剥离,自然风干至质量不再变化;分别称量玉米籽粒的胚和非胚部分质量,计算胚质量比,重复3 次,取平均值。具体计算公式如下:
通过α-淀粉酶和淀粉葡糖苷酶将淀粉水解成D-葡萄糖,然后D-葡萄糖与GOPOD 试剂缓冲液反应生成昆亚胺染料,比色法[10]测定淀粉含量。
将石蜡作为包埋剂,经过固定、脱水、透明后将材料包埋在石蜡中,然后利用切片机进行切片。籽粒经干燥后,选择有代表性的籽粒,提取淀粉过100 目筛,取约100 mg 淀粉样品置于载物台上,压紧,铺匀,通过扫描电镜观察。
1.6.1 基因初步定位 选取F2定位群体中籽粒胚乳缺陷型和正常籽粒单株各30 株,每株取幼苗新鲜叶片0.1 g,构建2 个子代DNA 混合池,建库进行30×基于Mut Map 的BSA 测序。将基因组DNA 随机打断成DNA 片段,两端加上polyA 尾巴和测序接头,磁珠纯化后扩增建库,上机进行测序。测序所得的原始数据过滤后进行参考基因组比对、变异检测、标记SNP 筛选,最后进行区间定位和候选区域内区间基因及突变注释。
1.6.2 InDel 引物设计及精细定位 根据BSA 分析所得InDel 位点设计并合成引物,筛选出在亲本间具有多态性的引物。在3 号染色体末端候选区域中,选取差异较大的InDel(插入/缺失)位点,在变异位点两侧找到合适的位置设计引物,利用聚丙烯酰胺凝胶电泳筛选出在亲本间具有多态性的可用标记,引物序列如表1 所示。在F2定位群体中选取384 株隐性植株,利用多态性InDel 标记(ID1~ID4;ID10~ID15;C3-102)进行基因型鉴定,筛选交换单株,确定与目的基因连锁的标记。
表1 sh2021 基因定位引物Table 1 Primers used for gene mapping of sh2021
取授粉后16、26 d 的野生型和突变体籽粒,3 次生物学重复,送上海凌恩科技有限公司进行转录组测序。利用FPKM(Fragments per kilo bases per million reads)衡量每个基因在不同样本中的表达量,并以2 倍表达差异(|log2Fold-change| ≥ 1)、P<0.01 作为标准,筛选玉米籽粒在WT 和sh2021突变体之间及授粉后16、26 d 这2 个时期之间的差异表达基因。
利用玉米遗传学和基因组学数据库MaizeGDB(https://www.maizegdb.org/)和基因本体论GO 数据库(http://www.geneontology.org/),查询候选区间中基因的相关信息,与Gramene(http://www.gramene.org/)中查询的信息进行比对,筛选候选基因,进行功能注释,分析注释基因的表达特性。借助公共数据库Uniprot(https://www.uniprot.org/)和NCBI 中的CDD (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)、BLAST (https://blast.ncbi.nlm.nih.gov/Blast.cgi)公共数据库预测候选基因的保守结构,寻找在其他物种中的同源或相似基因并分析结果,筛选候选基因。
使用Primer3Plus(https://www.primer3plus.com)设计qRT-PCR 引物(表2),以UBQ7 为内参基因,使用2×SYBR premixe ExTaqII(Takara)进行qRTPCR 检测基因的表达量,扩增程序为94 ℃ 30 s;94 ℃5 s,60 ℃ 30 s,40 个循环;增加熔解曲线,95 ℃ 10 s,60 ℃ 5 s,0.5 ℃/s 至95 ℃。本试验有3 次生物学重复,每个反应体系配置3 次技术重复。试验数据采用2-ΔΔCT法计算基因相对表达量,用SPSS 软件分析差异显著性,并用软件GraphPadPrism8 绘图。
表2 qRT-PCR 定量验证引物Table 2 qRT-PCR quantitative verification primers
将‘B 7 3’种植过程中的自发突变材料sh2021与野生型‘B73’进行杂交,组配F2分离群体进行后续相关研究。性状分离果穗表型结果显示,与野生型籽粒相比,sh2021籽粒凹陷皱缩、颜色加深、籽粒整体呈现不规则(图1A、1B),突变型籽粒百粒质量比野生型籽粒显著降低(图1C)。
图1 sh2021 突变体表型鉴定(F2 分离群体)Fig. 1 Phenotypic identification of sh2021 mutants (F2 segregating population)
完熟期籽粒石蜡切片结果(图2)显示突变体籽粒的胚在籽粒中的占比大于野生型,基底胚乳转移层无明显差异。对野生型和突变体的籽粒胚质量比进行比较发现,野生型和突变体的胚总质量差异不显著,野生型籽粒的胚质量比为9.09%,而突变体的胚质量比为14.92%,表明突变体非胚组织部分在籽粒中所占比例要明显低于野生型材料。
图2 WT(A)和sh2021(B)籽粒的石蜡切片图Fig. 2 Paraffin sections of mature WT (A) and sh2021 (B)grains
为明确突变体籽粒胚乳成分的变化,本研究测定了野生型和sh2021玉米籽粒淀粉含量,结果显示野生型籽粒淀粉质量分数为52.85%,sh2021玉米籽粒淀粉质量分数为14.92%,sh2021籽粒中淀粉质量分数比野生型质量分数减少了37.93%,表明突变体籽粒在发育过程中淀粉合成可能受阻。对籽粒进行扫描电镜分析,发现突变体籽粒的胚乳细胞、淀粉粒比野生型籽粒的小,且突变体的淀粉粒大小不均匀(图3),说明突变体籽粒淀粉的生物合成存在异常。
图3 野生型与sh2021 籽粒扫描电镜观察Fig. 3 Scanning electron microscope observation of WT and sh2021 grains
对F1、F2代籽粒胚乳发育的分离情况进行调查分析,结果表明F1代籽粒胚乳发育正常, F2代籽粒发生性状分离,在2 550 粒籽粒中,正常籽粒数为1 930,突变体籽粒数为620,正常表型籽粒与突变体表型籽粒比例符合3∶1 的理论分离比,表明该突变体性状受1 对隐性等位基因控制。
按照滑窗分析方法对获得的SNP-index 及相关计算结果进行拟合,以曼哈顿图直观反映SNPindex 在染色体上的分布情况(图4)。结果显示sh2021基因定位于3 号染色体末端。进一步对3 号染色体上ΔSNP-index 分布图(图5)进行分析,将目的基因初步定位在3 号染色体末端大小约为13.25 Mb 的区域。
图4 SNP-index 的全基因组分布图Fig. 4 Genome-wide distribution of SNP-index
图5 SNP-index 在3 号染色体上的分布Fig. 5 Distribution of SNP-index on Chromosome 3
在F2定位群体中选取384 株隐性植株,利用多态性InDel 标记(ID1~ID4;ID10~ID15;C3-102)进行基因型鉴定,筛选交换单株,确定与目的基因连锁的InDel 标记。结果发现,在标记ID4 和ID10 处都仅有1 个交换单株,表明目的基因与这2 个标记连锁紧密,根据定位结果绘制遗传图谱(图6)。
图6 sh2021 基因的精细定位Fig. 6 Fine mapping of sh2021 gene
进一步在ID4 与ID10 之间(917.7 kb)开发标记ID5、ID9,利用F2群体的983 株隐性植株进行目的基因精细定位。结果显示在标记ID5 和ID9 处各有17 和20 个交换单株。将目的基因定位在ID5(219 821 271)~ID9(220 350 877)之间529.60 kb 范围内(图6),该区间共包含18 个基因。结合玉米参考基因组数据库(https://www.maizegdb.org/)获取候选基因在不同组织的表达量数据对候选基因进行分析。研究结果发现有14 个基因在玉米籽粒的胚、胚乳和果皮中均有表达,另外4 个基因(Zm00001d044135、Zm00001d044143、Zm00001d044132和Zm00001d044133)在玉米籽粒不同部位的表达量不同FPKM 均小于1,认为基因在玉米籽粒各部位均不表达。
通过转录组测序检测WT 和sh2021在授粉后16 和26 d 的差异表达基因。研究结果显示与同时期的WT 相比,突变体在授粉后16 d 的差异表达基因数目是3 636 个,其中上调表达的基因是2 592个,下调表达的基因是1 044 个;而sh2021在授粉后26 d 的差异表达基因是5 113 个,上调基因3 787个,下调基因是1 326 个。授粉后26 d 的WT 和sh2021之间的差异基因明显多于授粉后16 d,由此可见,突变体sh2021籽粒在发育后期受到的影响更大,这与籽粒缺陷表型主要在发育后期表现较为一致。从授粉后16 和26 d 突变体和野生型的差异表达基因交叉情况,可以看出,造成突变体籽粒缺陷的基因可能在籽粒发育后期发挥作用。
为进一步探究玉米缺陷籽粒发育过程的分子调控机制,本研究对差异表达基因进行GO 和KEGG 功能注释及显著性富集分析。
在所有的差异表达基因中,分别有1 362 (授粉后16 d)和1 744(授粉后26 d)个差异基因能够通过GO 分析进行功能注释。与同时期的WT 相比,授粉后16 和26 d 的sh2021分别富集到45 和35 条GO 条目。其中富集最多的是生物学过程类(Biological process, BP),其次是分子功能类(Molecular function, MF),而细胞组分类(Cellullar component, CC)只在授粉后16 d 富集到,在授粉后26 d 未富集到。富集程度较高的前30 个GO 条目如图7A、7B 所示,在不同时期的差异基因中,MF 类别主要是以结合和调控活性的基因数目居多,例如调控氧化还原酶的活性,能够参与呼吸过程,直接或间接影响能量产生,进而影响籽粒生长发育及物质积累。在BP 类别中,基本都是参与细胞生物合成调控的基因,与基因表达调控相关的基因往往在籽粒的生命活动中扮演着重要角色,可能参与许多功能基因的表达调控过程。在授粉后16 d的CC 类别中主要是以细胞器膜为主,其中包括线粒体膜以及其他细胞器膜,而在授粉后26 d 的GO 类别中,不包含CC,说明籽粒发育后期细胞分化等已经基本完成,主要是大分子生物合成等活动,开始合成积累蛋白质、淀粉、维生素等营养物质,这些差异基因可能影响了包含淀粉在内的生物大分子的合成积累,或者间接影响能够导致籽粒缺陷的其他物质,比如维生素B6 合成、巯基依赖泛素特异性蛋白酶活性等。
所有的差异表达基因中,有1 405(授粉后16 d)和1 554(授粉后26 d)个差异基因能够通过KEGG 进行富集分析,与同时期的WT 相比,授粉后16 和26 d的sh2021分别富集到193 和204 条KEGG 条目。富集程度较高的前30 个KEGG 条目如图7C、7D所示,其中代谢途径、次生代谢物生物合成、抗生素的生物合成在授粉后16 和26 d 富集程度都最高,表明代谢途径在籽粒发育的不同时期保障生命活动正常进行。与转录、翻译、修饰相关的通路在不同时期也有较高富集,如:核糖体、内质网中的蛋白质加工、植物激素信号转导、碳代谢、氨基酸的生物合成,这说明调控突变体缺陷的机制与这些过程都有关联。其他与玉米胚乳发育及淀粉合成相关的途径也有显著富集,例如淀粉和蔗糖代谢、糖酵解、光合作用、精氨酸和脯氨酸代谢、细胞色素P450 对外源物质的代谢。
结合转录组测序数据,在sh2021的定位区间(Chr3: 219 821 271~220 350 877 bp)进行差异表达基因筛选,设置 log2FC(Fold-change)绝对值大于 2,即WT 与突变体之间表达量差异大于2 倍(P<0.05),在授粉后26 d 的WT 和sh2021材料中共筛选出5 个差异表达基因(Zm00001d044119、Zm00001d044120、Zm00001d044122、Zm00001d044129和Zm00001d044142),其中只有4 个差异表达基因(Zm00001d044120、Zm00001d044122、Zm00001d044129和Zm00001d044142)在授粉后16 d 的转录组数据中被鉴定。说明Zm00001d044119可能主要在发育靠后的时期发挥作用,且发挥作用的时期与对候选基因在各个发育时期的表达分析结果保持一致。5 个候选基因中,除Zm00001d044122是上调表达外,其他均是下调表达。
将定位区间与转录组分析的结果进行整合,共得到5 个候选基因,分别对其进行qRT-PCR 分析。相对表达量验证结果如图8 所示,基因Zm00001d044119、Zm00001d044120、Zm00001d044129、Zm00001d044142较W T 表达都下调,而Zm00001d044122呈上调趋势,与RNA-seq 结果完全吻合,可将这5 个基因列为sh2021的候选基因。
图8 候选区间内差异表达基因qRT-PCR 验证Fig. 8 Validation of differentially expressed genes in candidate intervals by qRT-PCR
本研究发现突变体sh2021籽粒相较于野生型凹陷皱缩、颜色加深、籽粒整体呈现不规则且淀粉含量低、淀粉粒小而不均匀。不同授粉时期差异表达基因的GO、KEGG 富集分析表明,糖酵解、淀粉-蔗糖合成途径与淀粉合成的关系较为直接。sh2021突变体性状由单隐性基因控制,目的基因精细定位在标记ID5 与ID9 的529.60 kb 之间。结合转录组分析结果最终预测Zm00001d044119、Zm00001d044120、Zm00001d044122、Zm00001d044129、Zm00001d044142这5 个基因可能是影响玉米籽粒发育的重要候选基因。
突变体sh2021籽粒成熟时表现为胚乳发育异常,籽粒凹陷皱缩、颜色加深,胚质量增加。在已经报道的籽粒突变体中,sh2、bt1、bt2等籽粒胚发育正常,胚乳呈现不同程度的皱缩或变小[11-13],sh2021突变体籽粒与此表型类似。对突变体成熟籽粒的淀粉含量进行检测,发现其淀粉含量明显降低,胚乳淀粉合成异常。同时sh2021的淀粉粒变小,这与dek101、dek48相似,但dek101、dek48淀粉粒虽然呈现大小、结构等发育异常,却均具有独立的淀粉粒形态,而本研究中sh2021突变体的淀粉粒互相黏着,合成受阻[14-15]。推测淀粉粒结构及大小的异常是导致突变体籽粒胚乳淀粉含量减少、发育缺陷的主要原因。
对突变体sh2021和WT 籽粒不同授粉时期的差异表达基因进行GO、KEGG 富集分析,发现多种生物学过程参与籽粒发育以及淀粉物质合成,其中糖酵解、淀粉-蔗糖合成途径与淀粉合成的关系较为直接,还有许多差异表达基因与能量合成有关。除此之外,一些差异表达基因涉及植物的生长发育调控、激素信号转导、响应生物和非生物胁迫等多个生理过程。筛选的候选基因也有参与到这些途径中,特别是已经报道过的Zm00001d044129(sh2),主要与显著富集的淀粉-蔗糖代谢,碳水化合物代谢相关,该基因的调控通路再次得到证实。在与玉米籽粒发育缺陷相关的众多途径中,本试验中显著富集到的途径与已发表过的一些调控途径一致,说明这些途径确实与玉米籽粒缺陷息息相关。例如基因Dek15影响玉米有丝分裂的细胞周期和核内复制,从而影响胚乳细胞的增殖[16];Smk2编码参与维生素B6 从头合成的PLP 合酶复合物的谷氨酰胺酶亚基,在玉米中维生素B6 的缺乏对胚乳发育产生较大影响,导致籽粒变小[9];opaque1(o1)突变体通过影响内质网形态和运动来影响蛋白质体的生物合成,最终影响胚乳的结构[17],fl2与fl4能导致内质网和蛋白体结构的异常[18-19],而Mc1能引起内质网结合蛋白水平的提高[20]。由此可见,玉米籽粒缺陷受多方面的协调影响,与之相关的调控网络复杂,值得进一步深入探讨。
根据全基因组重测序和定位结果确定候选区间,结合RNA-seq 结果,借助公共数据库对区间内基因进行功能和表达量预测,共筛选到5 个候选基因,包括Zm00001d044119、Zm00001d044120、Zm00001d044122、Zm00001d044129、Zm00001d044142。其中Zm00001d044119含有1 个CBS 保守结构域,在Kushwaha 等[21]的研究中,CBS 结构域本身没有明确的功能,但对许多酶起调节作用,因此有助于维持细胞内氧化还原平衡。王立成[22]对玉米CBS 家族基因进行了分析,Zm00001d044119(ZmCBS16)也是其中一员,但该研究主要是针对CBS 家族对干旱的响应作用。我们的研究表明,ZmCBS16基因参与调控sh2021突变体缺陷籽粒表型,但其如何进行调控待进一步验证。Zm00001d044120所属的CYP 家族,是植物中最大的酶蛋白家族,具有广泛的催化活性。过往的研究在玉米中发现了参与油菜素内酯合成通路最后一步的CYP85A1,该基因突变使玉米矮化、抗旱性增强;水稻中的CYP450基因DSS1突变体植株的粒度显著减小[23-24]。这些研究为Zm00001d044120在耐旱和籽粒发育过程中可能发挥的作用提供了一定的参考。Zm00001d044122编码花青素合成的关键酶DFR,这在不同的植物中都得到了证实,在拟南芥tt3-1突变体中异源表达红鳞毛蕨中分离出的DeDFR2导致花青素积累增加;同样,一品红DFR 在拟南芥中过表达也显著增加了花青素含量,而花青素生物合成途径的基因在玉米籽粒糊粉层中受到调节[25-27],那么该基因与玉米籽粒发育之间的调控关系值得进一步研究。Zm00001d044142编码1 个包含bHLH_AtIBH1_like 保守结构域的未知蛋白,与其相关的有非DNA 结合bHLH 转录因子,作为转录阻滞剂,负调控细胞和器官伸长,响应赤霉素和油菜素内酯信号[28]。刘浩[29]在玉米幼胚中筛选出1 个b H L H 转录因子ABP7,过表达ABP7能显著增加穗粗、籽粒大小与粒质量,并推测ABP7可能通过参与母体组织中细胞壁代谢、糖代谢、营养物质向籽粒转运等过程,促进玉米籽粒的发育。而Zm00001d044142包含bHLH_AtIBH1_like 结构,可能具有相似的调控作用。Zm00001d044129(sh2)是1 个功能已知的基因,结合其他4 个显著定位到的候选基因,推测突变体sh2021的籽粒缺陷,可能不仅是sh2单独起调控作用,上调表达基因Zm00001d044122及其他候选基因都可能在此过程中起到关键调节作用。除sh2外,其他都鲜见报道,可能是新的玉米籽粒缺陷相关的基因,这在一定程度上丰富了玉米籽粒基因资源,且对后续的育种实践十分有利。