汤亚琪,苏文文,李 莹,王保通,李 强
(西北农林科技大学植物保护学院/旱区作物逆境生物学国家重点实验室,陕西杨凌 712100)
小麦条锈病是世界范围内小麦主产区最重要的病害之一[1],其病原菌条形柄锈菌小麦专化型(PucciniastriiformisWest. f. sp.triticiEriks & Henn,Pst)为专性寄生菌[2],生理小种致病性变异迅速且频繁,容易造成主栽小麦品种抗条锈的频繁“丧失”[3],导致小麦条锈病的爆发流行,严重威胁着全球小麦的安全生产[4]。
中4是以普通小麦(TriticumaestivumL.)(2n=6x=42,AABBDD)与中间偃麦草(Thinopyrumintermedium)(2n=6x=42,E1E1E2E2XX)经有性杂交、选育获得的异源八倍体小偃麦(AABBDDXX)[5]。自1983年列为中国小麦条锈菌鉴别寄主至今,对我国现有小麦条锈菌流行小种均表现为抗病[6],其抗性稳定且持久,具有较高的研究和利用价值。但由于中4是异源八倍体小偃麦,与六倍体普通小麦经常规杂交后获得稳定遗传后代的难度较大,导致其抗性研究严重滞后[7]。蔺瑞明等[7]将中4分别与中国春phb1突变体和条锈病感病品种铭贤169杂交,对其杂交后代进行遗传分析,发现其对条锈菌小种CYR31和CYR32的抗病性由1对显性基因控制。曹世勤等[8]利用基因推导法发现中4含有未知抗条锈病基因。甘肃省天水市农业科学研究所以中4为亲本,先后选育出中梁22号[9]、中93444[10]、中93447[11]等多个具有较好丰产性和抗病性的品种(系)材料。但是其抗条锈病机制目前尚未见报道。
本研究利用转录组测序,筛选中4接种条锈菌后的差异表达基因,以期为进一步解析中4抗条锈性分子机制提供科学依据。
供试小麦品种为我国小麦条锈菌鉴别寄主中4和条锈病感病品种铭贤169,小麦条锈菌为我国小麦条锈菌流行小种CYR32,均由西北农林科技大学植物保护学院小麦病原真菌监测及抗病遗传实验室提供。
挑选籽粒发育良好、颜色形状一致的中4种子,催芽后播种在7 cm × 7 cm的小花盆内。待小麦幼苗长至第一叶完全展开时,接种条锈菌CYR32,接种0、12、24和48 h后,分别采集接种叶片样品,以未接种叶片(0 h)为对照,每个时间点采集3个生物学重复,用于转录组数据质量测定。接种48 h后的材料在人工气候箱(温度15~17 ℃、湿度90%、16 h光照/8 h黑暗、光照强度10 000 lx)继续培养16 d,用于观察表型,以铭贤169作为感病对照。
样品总RNA的提取按照Plant RNA Midi Kit(OMEGA,美国)试剂盒说明书进行,获取总RNA后,检测RNA样品的纯度、浓度和完整性,用带有Oligo(dT)的磁珠富集真核生物mRNA,加入Fragmentation buffer将mRNA随机打断,以First Strand cDNA Synthesis Kit(OMEGA,美国)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H和DNA polymerase I合成第二条cDNA链,利用AMPure XP beads纯化双链cDNA,纯化后的双链cDNA须先进行末端修复、加A尾并连接测序接头,再用AMPure XP beads进行片段大小选择,最后通过PCR富集得到 cDNA文库。
通过Illumina高通量测序获得12个cDNA文库,用FastQC对cDNA文库的碱基质量值(Q30)、碱基含量分布(GC含量)和重复相关性(r2)等指标进行检测,以判断文库数据质量并评估其是否满足后续分析。用HISAT2对reads进行高效比对,用StringTie进行从头组装,基于中国春全基因组(https://wheat-urgi.versailles.inra.fr/Seq-Repository)进行有参组装。
将完成组装的转录本数据用非冗余(non-redundant,NR)数据库和基因本体(gene ontology,GO)数据库进行比对注释,用真核生物同源蛋白簇(eukaryotic orthologous groups,KOG)、蛋白质直系同源簇(cluster of orthologous groups of proteins,COG)以及基因的进化谱系:非监督直系群(evolutionary genealogy of genes:non-supervised orthologous groups,eggNOG)等数据库进行基因富集聚类,用京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)数据库进行代谢通路的富集分析。
选取转录组测序得到的差异表达基因,根据其全长cDNA序列,使用Primer 5设计特异性引物(表1),以小麦TaEF为内参基因。提取中4各个样品的总RNA并反转录为cDNA,按照ChamQTMSYBR○RqPCR Master Mix(Vazyme,中国)说明书的反应体系和条件,使用QuantStudio 5(ABI,美国)进行qRT-PCR,按照2-△△Ct计算基因相对表达量,重复3次。
表1 荧光定量PCR所用引物Table 1 Primers used for fluorescence quantitative PCR
从图1可以看出,中4叶片只有少许坏死斑且不连片,表现为高抗,而铭贤169产生大量夏孢子堆。
取接种条锈菌0、12、24和48 h后的中4叶片样品,每个处理3个重复,共计12个样品进行转录组测序分析,共获得130.51 Gb Clean Data,各样品Clean Data均达到8.42 Gb;碱基质量值Q30的碱基百分比为92.83%~94.14%,表明碱基识别可靠,准确度高;G和C、A和T的含量为58.33%~60.83%。分别将各样品的Clean Reads与中国春全基因组IWGSC RefSeq v1.0进行序列比对,比对效率为60.29%~69.03%,由于中4为异源八倍体小偃麦(AABBDDXX)[6],其X染色体组与普通小麦亲缘关系较远,所以转录组的比对效率没有出现高度匹配。基于比对结果进行基因表达量分析、功能注释、富集分析以及新基因的发掘[8],发掘新基因20 788个,其中 15 069个得到功能注释。关于样品相关性,r2值越接近1,说明两个重复样品相关性越强且样品重复性良好,测序结果显示,中4接种条锈菌CYR32 0 h后,3个样品的r2值为0.960~ 0.983;接种条锈菌CYR32 12 h后,3个样品的r2值为0.958~0.975;接种条锈菌CYR32 24 h后,3个样品的r2值为0.972~ 0.982;而接种条锈菌CYR32 48 h后,3个样品的r2值为0.824~0.932,表明样品间整体相关性较强,重复性良好。
以Fold Change≥2且FDR<0.01为筛选标准[12],对不同时间点差异表达基因的分布进行调查,发现0 h VS 12 h(表示两个侵染时间点差异表达基因的比较,下同)、0 h VS 24 h、0 h VS 48 h分别筛选出7 816、10 412、9 563个上调表达差异基因和7 209、10 159、9 612个下调表达差异基因;12 h VS 24 h、12 h VS 48 h、24 h VS 48 h分别筛选出937、1 150、57个上调表达差异基因和 2 866、 1 643、229个下调表达差异基因。结果表明,以0 h为对照,24 h获得的差异表达基因最多,48 h次之,12 h最少;以12 h为对照,24 h获得的差异表达基因多于48 h;48 h较24 h新增加了286个差异表达基因。
为获得潜在的抗病相关基因,本研究重点关注上调表达差异基因,从图2可以看出,共获得13 674个上调表达差异基因,12 h与24 h、48 h共有的上调表达差异基因分别有6 241、5 611个,24 h与48 h共有的上调表达差异基因7 416个,0~48 h筛选到持续上调表达的差异基因5 151个,这些基因可能与中4的的抗条锈性有关。对5 151个上调差异基因进行染色体定位,其中 4 482个获得定位信息,其余669个无法确定其染色体位置,为新基因。进一步分析发现,差异表达基因在B染色体组上分布最多,为1 581个;D染色体组次之,为1 523个;A染色体组最少,为 1 378个。上调表达差异基因在2B(7.12%)、5B (6.38%)、3B(6.34%)、2D(5.85%)、7D(5.42%)染色体上所占比例较高。
2.4.1 共同上调表达差异基因的GO功能注释
中4转录组测序数据中有58 059个转录本在GO数据库中被注释,5 151个共同上调表达差异基因中3 411个基因获得GO注释。获得注释的转录本可分为分子功能、细胞组分和生物学过程3大类,46个亚类(图3)。分子功能包含13个亚类,其中蛋白结合、催化活性通路富集到的上调表达差异基因数目较多,此外,在转运活性、受体活性、酶调节活性、抗氧化活性、蛋白结合转录因子活性等通路也富集到上调表达差异基因;细胞组分包含13个亚类,其中细胞部件、细胞、细胞器等通路富集到的上调表达差异基因数目较多,在大分子复合物、细胞连接、超分子复合物等通路也富集到上调表达差异基因;生物学过程包含20个亚类,其中细胞过程、代谢过程、单有机体过程等通路富集到的上调表达差异基因数目较多,此外,在生殖过程、多有机体过程、信号转导等通路也富集到上调表达差异基因。
2.4.2 共同上调表达差异基因的功能富集分析
利用COG、KOG、eggNOG数据库对5 151个上调表达差异基因分别进行直系同源分类,以期获得更准确的分类及功能注释。COG数据库中有2 638个上调表达差异基因获得注释分类,最大类别为R类(仅一般功能预测),包含555个基因,占21.04%;其次是K类(转录),包含306个基因,占11.60%(图4A);KOG数据库中有 2 486个上调表达差异基因获得注释分类,最大类别为R类,包含436个基因,占17.54%,其次是O类(翻译后修饰,蛋白质转换,分子伴侣),包含271个基因,占10.90%(图4B);eggNOG数据库中有3 906个上调表达差异基因获得注释分类,最大类别为S类(未知功能),包含859个基因,占21.99%,其次是R类,包含666个基因,占 17.05%(图4C)。此外,COG、KOG、eggNOG三个数据库分别注释到与防御相关的V类(防御机制)上调表达差异基因,分别为47、28、25个。虽然eggNOG数据库获得的注释基因最多,但是注释到与防御相关的基因最少,在未知功能和一般功能预测富集到的基因最多,为1 525个,占 39.04%;KOG数据库在所占比例为 5.83%~ 5.39%处出现分类富集,且数据库25个分类中均注释到上调表达差异基因;COG和KOG数据库虽然在最大类别注释相同,但是其余类别差异很大。三个数据库注释分类结果有较大差异,因此,应综合分析三个数据库弥补单一数据库的不足。
2.4.3 共同上调表达差异基因的KEGG通路富集分析
5 151个差异表达基因在KEGG数据库中注释到431个上调表达差异基因,主要分为5大类20个小类,共涉及109个代谢通路。其中,细胞过程、环境信息处理、遗传信息加工、代谢和有机系统5大类注释到的上调表达差异基因数目分别为39、24、146、203和19。有机系统类别注释到14个参与植物与病原菌互作通路的差异表达基因。将显著性设为qvalue<0.05,对上调差异基因进行富集分析,发现差异基因在剪接体、苯丙氨酸代谢、过氧化物酶体、糖和氨基酸的代谢等通路显著富集 (图5)。
基于所选参考基因组序列的比对结果,共注释到包括7种类型的33个R(resistance)基因,其中,12个与富含半胱氨酸类受体蛋白激酶有关,10个与抗病性蛋白有关(表2)。此外,还筛选到β-半乳糖苷酶、纤维素合酶、过氧化物酶等病程相关蛋白。
表2 中4抗条锈性上调差异基因中R基因的功能分析Table 2 Functional analysis of R gene in up-regulated differential genes of Zhong 4 resistance to stripe rust
将筛选到的669个上调表达的差异新基因在7种数据库注释分析,结果显示,有335个获得GO注释,123个获得COG注释,79个获得KOG注释,511个获得eggNOG注释;其中,eggNOG数据库最大的两类注释分别为功能未知和一般功能预测,占48.57%,KOG数据库中细胞周期控制、细胞分裂和染色体分裂通路中获得注释信息的基因比例较高。151个上调表达差异新基因获得KEGG注释,且其中85个差异新基因共涉及89个信号通路;562个获得NR注释。其中,苯丙素的生物合成和苯丙氨酸代谢通路分别富集到7个上调表达差异基因,谷胱甘肽代谢通路分别富集到6个,内质网蛋白加工和碳代谢通路分别富集到5个,植物与病原菌互作、剪接体、糖酵解和糖异生以及淀粉和蔗糖代谢通路分别富集到4个,说明显著富集的差异新基因主要与糖的合成与代谢、氨基酸的代谢以及植物与病原菌互作有关。上调表达差异新基因还注释到R基因、WRKY 和NAC转录因子等应答非生物胁迫的基因。
为验证转录组测序RNA-seq数据的准确度,在差异基因中随机选取与NB-ARC、钾离子转运蛋白和热激蛋白相关的3个基因进行qRT-PCR,其中,转录本数据经NCBI Blast确定其特异序列位置,用Premier 6设计与内参引物TaEF-1α 退火温度值相近的特异引物。以0 h为对照,计算基因相对表达水平与转录组数据表达量并进行对比。结果(表3)表明,转录组测序RNA-seq数据与qRT-PCR数据整体趋势一致,转录组测序数据准确可信。
表3 荧光定量PCR结果与转录组测序结果对比Table 3 Comparison of real-time PCR results with RNA-seq results
条锈病的流行严重威胁小麦的产量和品质,培育抗病品种是防治该病最有效、经济和环保的措施[1-4]。中4自育成至今,对我国现有条锈菌小种均表现为抗病,然而其抗条锈病机制尚不明确。
本研究利用转录组测序,分析了条锈菌CYR32侵染中412、24和48 h后的差异表达基因,获得 5 151个持续上调表达差异基因。经多个数据库注释及富集分析,筛选得到R基因、PR基因、蛋白酶体、WRKY和NAC转录因子等与调控小麦条锈菌有关的基因。其中33个上调表达差异基因参与植物与病原菌互作过程;大量上调表达差异新基因获得注释,在植物与病原菌互作过程、糖的合成与代谢以及氨基酸的代谢通路显著富集。
Chen等[13]通过转录组学分析小种专化性抗性、全生育期抗性和高温成株期抗性,发现高温成株期抗性中基因多样性最高,但是基因诱导表达缓慢,解释了其抗性持久性的原因。Coram等[14]分析Yr39介导的与条锈菌亲和与不亲和的两个F7重组自交系的转录本,发现条锈菌侵染48 h后时,转录本数量均达到峰值;对转录组数据进行注释后发现,50%以上的转录本参与防御和信号转导过程,例如R基因同源物、PR蛋白、苯丙氨酸的生物合成和蛋白激酶等。Coram等[15]分析Yr5介导的与条锈菌亲和与不亲和的相关转录本,发现在侵染24 h时转录本积累量出现峰值,注释后发现被诱导的转录本均参与基础防御相关过程,Yr5快速响应的信号通路和防御反应有R基因参与,包括蛋白激酶信号转导和活性氧导致的过敏性坏死反应。本研究结果发现,条锈菌侵染24 h时,差异表达基因数目出现峰值,表明小麦在应对条锈菌的诱导下,大量与寄主抗性及相关抗性基因转录表达来调控免疫反应。Hao等[16]研究发现,在条锈菌侵染24 h时,KEGG显著富集的通路有苯丙氨酸的生物合成和代谢,该途径可以产生水杨酸、类黄酮和木质素等化合物,并且苯丙氨酸代谢途径在条锈菌侵染初期参与植物防御反应;在条锈菌侵染120 h时,KEGG富集到与淀粉、蔗糖和碳水化合物代谢相关的基因,推测小麦光合作用的强度影响其对条锈菌的抗性。本研究KEGG通路分析发现,上调表达差异基因显著富集在蛋白质加工、苯丙氨酸代谢、过氧化物酶体、糖和氨基酸代谢等通路,与前人研究结果一致。Garnica等[17]研究发现,ABC转运蛋白基因在孢子萌发中差异表达,并在附着期高度富集;MFS转运蛋白优先在孢子萌发期表达,主要影响其生长过程;己糖转运蛋白和氨基酸转运体在吸器中高度表达,条锈菌的生活方式对转运体类型起决定作用。葡萄糖转运体在发芽夏孢子中高表达,说明条锈菌侵染小麦后消耗寄主碳水化合物吸收营养。
PR蛋白在系统获得抗性和植物防御中尤为重要。研究表明,PR1蛋白能够抑制小麦条锈菌的生长[18]。另外,TaWRKY49负调控小偃6号对小麦条锈菌的抗性,并诱导水杨酸、茉莉酸和活性氧响应相关基因的表达,同时抑制乙烯相关基因的表达;TaWRKY45和aWRKY62正调控小偃6号对小麦条锈菌的抗性,且水杨酸、乙烯、茉莉酸甲酯、过氧化氢和脱落酸均能够诱导TaWRKY62基因表达[19-20]。NAC基因家族编码的蛋白质是目前发现的最大的植物特异性转录因子之一[21-23],在植物应答非生物和生物胁迫以及调控植物发育等方面发挥着重要的作用,TaNAC4[21]、TaNAC21/22[22]和TaNAC30[23]负调控小麦对条锈菌的抗性,且茉莉酸甲酯、乙烯和脱落酸能够诱导TaNAC4基因的表达,而水杨酸对TaNAC4基因的表达无影响[21];TaNAC21/22作为tae-miR164的靶标在小麦对条锈菌的抗性方面发挥着重要作用[22];沉默TaNAC30可显著增加H2O2的积累量,说明TaNAC30可增加小麦对条锈菌的抗性[23]。
本研究分析了条锈菌CYR32侵染中4的转录组数据,通过基因组序列比对获得7种类型R基因并得到大量的新基因,新基因中也预测到R基因和抗条锈性相关基因,表明小麦品种中4中蕴含丰富的抗性基因。