王付娟,李宗震,仝胜利,李淑梅
(1.信阳农林学院农学院,河南信阳 464000; 2.河南农业大学农学院,河南郑州 450002)
随着全球气候变化,高温和干旱已经严重影响到小麦碳同化和淀粉合成,造成产量和品质的下降[1-2]。干旱常常伴随高温,高温直接导致许多不耐热蛋白质变性和植物细胞中活性氧(ROS)积累[3-4]。植物在进化过程中形成了应对逆境胁迫的调控机制,包括诱导大量热激蛋白(heat shock protein,Hsps)和ROS清除剂等基因的表达。在热适应过程中,热激蛋白转录因子(heat shock factors,Hsfs)对热诱导的重建转录起着重要的调控作用[5]。
热激蛋白转录因子广泛存在于所有真核生物中。Hsfs蛋白的特征是存在一个Hsf DNA结合域,该域由一个中心螺旋-旋转-螺旋基序和两个疏水氨基酸重复片段(HR-A and HR-B)组成[6]。已经发现并鉴定,拟南芥中21个Hsf蛋白[7],水稻中25个Hsf蛋白[7-8],大麦中28个Hsf蛋白[9],大豆中34个Hsf蛋白[10],棉花中40个Hsf蛋白[11],小麦中56个Hsf蛋白[12]。根据蛋白质结构将Hsf蛋白划分为A、B和C三个亚家族,HsfA已经在拟南芥和水稻等植物中被广泛研究,发现AtHsfA1a和AtHsfA1b参与调节拟南芥应激基因的早期表达[13];过表达GmHsfA1能够显著提高大豆的耐热性[14-15];拟南芥中超表达AtHsfA2基因,其耐强光、耐盐、耐高渗透胁迫和抗氧化能力显著提高[15-17]。超表达OsHsfA2e使拟南芥的耐盐能力显著提高[18],但超表达SlHsfA3使拟南芥的盐敏感性显著提高[19]。水稻和小麦中超表达HsfA4a均显著提高其抗重金属元素镉的能力和抗氧化能力[20]。HsfB亚家族成员在植物受高温胁迫时发挥着重要作用,拟南芥中HsfB1和HsfB2b在正常条件下抑制HsfA2和HsfA7基因的表达,对植株提高耐热性发挥积极作用[21]。有研究表明,拟南芥HsfB1和HsfB2b在提高抗病性方面也发挥着积极作用[22]。水稻中HsfC基因除了在热胁迫反应中发挥作用外,还参与了对盐、干旱和氧化应激等的应激反应[23-25]。OsHsfC1b和OsHsfC2b对盐和干旱非常敏感,TaHsfC2a-B在小麦籽粒灌浆过程中发挥着热保护作用[26]。
小麦作为重要的粮食作物,扬花期和灌浆期遭遇干热风和干旱的频率激增,更多有重要功能的热激蛋白转录因子有待挖掘,尤其是TaHsfC亚家族基因。为深入了解此基因的功能,本研究拟通过小麦全基因组生物信息学分析,根据拟南芥和水稻HsfC家族成员蛋白的保守结构域鉴定小麦HsfC家族成员,并利用不同小麦品种在干旱条件下的转录组数据分析其表达模式,为探究TaHsfCs介导小麦对干旱胁迫的响应提供依据。
根据拟南芥数据库(Tair:https://www.arabidopsis.org/)中公布的AtHsfC1(AT3G24520)所编码的氨基酸序列,通过Hmmer(https://www.ebi.ac.uk/Tools/hmmer/search/hmmscan)工具获得其Pfam号,然后利用Pfam号通过数据库(http://plants.ensembl.org/biomart/martview/)在小麦基因组数据库中进行比对,获得TaHsf家族候选基因的碱基、蛋白的氨基酸和CDS序列。将候选基因对应蛋白质的氨基酸序列与NCBI数据库公布的AtHsfC1(AT3G24520)、OsHsfC2a(Os02g13800)、OsHsfC2b(Os06g35960)、OsHsfC1a(Os01g43590)和OsHsfC1b(Os01g53220)的对应氨基酸序列进行同源进化分析,利用 Mega7.0 软件构建进化树,构建方法为邻近法。以进化关系距离大于80%为标准确定TaHsfC亚家族成员。
利用 Mega 7.0 软件构建TaHsfC蛋白序列进化树,构建方法为邻近法,bootstrap设置为 1 000。用GSDS 2.0(http://gsds.cbi.pku.edu.cn/)在线软件分析TaHsfC基因结构。利用Softberry(http://linux1.softberry.com/)在线软件进行TaHsfC亚细胞定位预测。使用Uniprot数据库(https://www.uniprot.org/)查询TaHsfC蛋白质的HSF结构域位置和卷曲螺旋位置。利用MG2C在线软件(http://mg2c.iask.in/mg2cv2.0/)绘制TaHsfC基因在各染色体上的位置。
以矮抗58(不耐旱品种)和晋麦47(耐旱品种)作为研究材料,将萌发5 d的苗移栽到营养液培养7 d之后,采用添加15%的PEG的营养液模拟干旱处理24 h,以正常培养的苗为对照,分别取根系提取RNA,构建cDNA文库,进行转录组测序。根据测序结果,分析响应干旱的TaHsfC基因表达情况,用 Cufflinks 软件(http://cufflinks.cbcb.umd.edu/)计算各基因或转录本的表达丰度,表达丰度用FPKM值来表示。根据各样本转录组数据中各TaHsfC基因的 FPKM 值对其基因表达模式进行分析,用TBtools软件中的Heatmap工具对表达模式作图。
从小麦全基因组中共鉴定到24个TaHsfC基因(表1),其不均匀分布在5条染色体上,其中A基因组中有7个,B 基因组中9个,D基因组中有6个,另外两个所在染色体位置不清楚(图2)。在3号染色体上最多,有12个;在4号染色体上有5个;5号染色体上有2个;7号染色体上有3个;有2 个基因在染色体上的位置未知。对24个TaHsfC基因进行亚细胞定位预测分析显示,24个TaHsfC基因全部定位于细胞核。
表1 小麦TaHsfC基因家族的特性
图1 小麦TaHsfC家族基因的染色体分布
*代表新鉴定的TaHsfC蛋白。
TaHsfC蛋白的亚类分类方法是基于Scharf等[5]对拟南芥和水稻Hsf蛋白分类。由图2可以看出,与已鉴定的拟南芥和水稻中的HsfC蛋白(AtHsfC1、OsHsfC2a、OsHsfC2b、OsHsfC1a和OsHsfC1b)进行聚类比对,24个被鉴定的TaHsfC蛋白成员可以明显的分为两大类。其中,有 12个TaHsfC蛋白已经被报道过[12],分别为 TaHsfC1a-e和TaHsfC2a-g。新鉴定的12个TaHsfC蛋白聚类为两组,分别命名为TaHsfC1f-k和TaHsfC2h-m(图2中被标记*)。与拟南芥相比,小麦HsfC蛋白与水稻HsfC蛋白的聚类更紧密,并且HsfC2亚族在单子叶植物中是唯一的。
对鉴定的24个TaHsfC基因进行基因结构分析,结果表明,TaHsfC1亚族基因至少含有一个内含子,其中TaHsfC1h含有两个内含子;TaHsfC2亚族基因则规律不清,其中TaHsfC2a、TaHsfC2b和TaHsfC2m含有一个内含子,其余成员则不含内含子。
24个TaHsfC基因中,有7组同源基因,同源基因的结构具有相似性(图3),其中有5组可能为A、B和D染色体组上的等位基因(c2e、c2g、c2i;c2a、c2b、c2m;c1b、c1c、c1d;c1a、c1e、c1f;c1j、c1h、c1k),另外2组可能为其中两组染色体上的等位基因(c2j、c2k;c2c、c2l)。
图3 小麦TaHsfCs基因结构分析
小麦TaHsfCs序列的保守结构域分析结果显示(图4),所有被鉴定的小麦TaHsfCs中均有基序1(motif 1)、基序2(motif 2)和基序3(motif 3),其中TaHsfC2a中包含HSF的AHA基序(AHA motif序列:LLLDGDFGNVSAFGPDAVDFAGFYTDDAFANAPVPVE)。
图4 小麦TaHsfCs的保守结构域分析
小麦HsfCs DNA结合结构域的多序列比对分析结果显示(图5),小麦HsfC亚族蛋白质包含“螺旋-折叠-螺旋”的结构域,属于DNA结合结构域,具有DNA结合特性,所鉴定的24个小麦HsfCs功能可能具有相似性。
图5 小麦HsfCs DNA结合域的多序列比对
以矮抗58和晋麦47两个品种的转录组数据分析响应干旱的TaHsfC基因,将达到显著差异的TaHsfC基因通过FPKM值制作热图(图6)。从图6可见,小麦品种矮抗58和晋麦47共同存在差异表达的TaHsfC基因有10个,占比 66.7%,其中TaHsfC2亚族基因占70%,且表达量均高于TaHsfC1亚族基因。表明TaHsfC2亚族基因在响应干旱胁迫中具有重要的作用。其中,TaHsfC2b、TaHsfC2c、TaHsfC2d、TaHsfC2f、TaHsfC2g和TaHsfC2m在两个品种中受干旱胁迫诱导表达上调幅度最大,表明这些基因在小麦干旱胁迫中发挥着积极响应作用。不同的TaHsfC1和TaHsfC2亚族基因在干旱响应中的表达存在较大差异,整体以TaHsfC2亚族基因在干旱处理过程中上调表达倍数较高,TaHsfC1亚族基因上调表达倍数则相对较低。晋麦47在干旱处理中有4个基因(TaHsfC2j、TaHsfC2k、TaHsfC1f和TaHsfC1c)未表现出显著变化,而TaHsfC2i在晋麦47中表现出显著差异。
图6 响应干旱胁迫的TaHsfC基因的表达模式分析
本研究在小麦基因组中共鉴定了24个TaHsfC亚族基因成员,可以分为TaHsfC1和TaHsfC2两个亚族。从进化树分析可见,小麦的TaHsfC亚族基因与水稻更为紧密。与拟南芥不同的是,小麦和水稻均有TaHsfC2亚族基因,这是禾本科植物所特有的一类基因。大量研究表明,热激蛋白转录因子是一个庞大的基因家族,可以被分为A、B和C三个亚家族,且在植物的耐热、抗寒、抗旱及耐盐等多种胁迫条件下发挥重要作用,但是由于小麦基因组的复杂性,对其TaHsfC亚族基因的功能研究仍然较少,已经公开报道的只有TaHsfC2a通过ABA介导调控途径参与小麦灌浆期的耐热性保护机制[26]。本研究主要利用小麦基因组和转录组数据对TaHsfC亚族基因进行全基因组系统分析,试图为研究TaHsfC亚族基因的功能提供理论基础。
在聚类分析中发现,鉴定出的24个TaHsfC亚族基因中存在5组三联等位基因和2组二联等位基因,其亲缘关系高度相似,这可能与六倍体小麦复杂的基因组相关,基因之间存在多个复制。前人研究报道,随着基因组的复杂性增加,热激蛋白转录因子的数量也随之增加;这种家族基因数量的增加意味着该基因家族可能在植物应对环境胁迫中发挥着重要作用[27]。在鉴定的24个TaHsfC亚族基因中,均具有热激蛋白转录因子的保守结构域。这24个被鉴定的小麦TaHsfC亚族基因的成员中,有12个是本研究初次发现,这为以后的研究提供了一定的基础信息。通过亚细胞定位预测发现,全部的TaHsfC定位于细胞核,这与其功能密切相关,转录因子参与调控下游靶基因的转录,而转录过程是在细胞核内进行的。
大部分Hsfs家族成员是通过调控一系列热激蛋白,活性氧清除酶和其他功能蛋白基因发挥抗逆作用的[28]。热激转录因子的下游基因热激蛋白作为分子伴侣可以防止细胞蛋白质在热应激下变性[27-28],同时也参与生物体对热胁迫的适应[29]。Hu等[26]研究表明,小麦中过表达TaHsfC2a-B基因能够上调一系列热保护基因,包括TaHSP16.9b、TaHSP17.3、TaHSP26.6、TaHSP62.4、TaHSP70d、HSP101b、TaGalSyn、TaHSA32、TaRof1和TaβAmy1。本研究证明了TaHsfC2a可被干旱诱导上调表达;但是过表达TaHsfC2a-B基因并不能提高小麦的抗旱性,TaHsfC2a-B过表达能够抑制植株的生长;在各个营养器官中TaHsfC2a基因干旱诱导的生理意义可能在于干旱胁迫下水分的保存。在本研究中,耐旱品种晋麦47和干旱敏感型品种矮抗58中均表现出TaHsfC2a基因在干旱条件下上调表达。本研究鉴定到的TaHsfC2b和TaHsfC2m与TaHsfC2a具有极高的同源性,此三者之间的功能有可能也是相似的。尽管其他的TaHsfC2亚族基因也能够受到干旱胁迫的诱导,但是具体的功能则有待进一步的研究。