陈 伟, 刘小红, 龙 芸, 张咏祀, 李仕伟, 刘娅娟, 侯凌鹏, 杨海鹏, 张 杰
(1.山西农业大学玉米研究所, 山西 忻州 034000; 2.西华师范大学生命科学学院, 四川 南充 637000;3.厅市共建甘薯及特色豆科作物种质创新与利用四川省重点实验室, 四川 南充 637000)
玉米(ZeamaysL.)是世界三大作物之一,在粮食、饲料及工业原料等方面都有着广泛用途[1]。随着全球气温的逐年升高,局部高温、干旱等极端天气频发,该气候变化已对玉米产量和品质产生了严重危害[2]。在我国很多地区,夏玉米常受到高温胁迫的影响[3-4],如2022年7—8月在中国南方很多区域持续的高温天气(部分地区40 ℃以上高温持续多日),对山区玉米生产造成了严重影响,导致其大幅减产甚至绝收。据专家预测,未来高温可能成为常态,因此,培育耐高温胁迫的玉米品种在玉米生产中显得尤其重要。
选育耐高温胁迫的玉米材料,首先要了解玉米耐高温胁迫的分子遗传机制。在玉米整个生育期,最易遭受高温危害的是开花散粉期和灌浆期[5]。7—8月是一年中最热的时期,也正是玉米开花散粉和灌浆期,这一时期遇上高温,可导致花粉活力下降或败育、花丝萎蔫、籽粒不够饱满,进而引起玉米减产、品质降低。高温胁迫下,植株体内会产生应激反应现象,有众多的基因表达会受到抑制或激发,即表现为上调或下调表达,其中热休克转录因子(Heat shock transcription factor,Hsf) 家族成员响应特别明显。Hsf在动植物及微生物中广泛存在,在调控逆境胁迫方面起着非常重要的作用[6],如高温[7]、干旱[8]等。单个的玉米Hsf基因有一些研究[9-10],但一次对多个Hsf成员分析以认识玉米耐高温胁迫分子机制的研究鲜有报道。所以,以玉米花粉为材料,以Hsf家族基因成员为对象,通过基因克隆、表达及功能鉴定等对认识花粉耐高温胁迫的分子遗传机制、挖掘利用耐高温胁迫的基因有着非常重要的意义。
基因克隆及表达研究有多种方法,对于有参考基因组序列信息的植物材料来说,要对众多的基因开展克隆及表达研究,转录组测序是一种经济有效的试验手段[11-13]。目前,转录组测序主要有二代测序和三代测序,二代测序相对来说读长较短,只有通过拼接才能得知全长转录本信息,但是测序成本相对较低[14-15];三代测序读长较长、不需要片段间的拼接而直接获得全长转录本信息,但测序成本相对要高很多,适合于没有参考基因组信息生物的大规模基因分析[16-17]。这两种转录组测序技术都有着广泛应用,对于像玉米等有参考基因组信息的植物来说,二代测序就可以满足一般的大规模基因表达分析需求。
本研究以耐高温胁迫的中地88和不耐高温胁迫的先玉335为材料,在不同温度环境条件下取其花粉,通过二代转录组测序分析,获得Hsf家族成员的基因转录表达信息,分析基因在不同材料和不同温度处理的差异表达,探索玉米耐高温胁迫的分子遗传机制,为耐高温胁迫相关基因的克隆利用奠定分子基础。
本试验选取2个玉米材料,包括耐高温胁迫的中地88和不耐高温胁迫的先玉335,种植环境设了大田和温室2个处理,材料种植、田间管理和试验取材在山西农业大学(山西省农业科学院)玉米研究所完成。
试验设3次重复。取高温(温室42 ℃)和常温(大田28 ℃)两种生态环境下两品种处于盛花期的花粉,液氮速冻保存,提取总RNA并分离纯化mRNA,再经mRNA片段化下处理、cDNA合成、PCR富集、文库质检和测序分析(Illumina 测序平台),获得转录组高通量测序数据。从获得的数据中搜寻Hsf转录因子家族成员信息,分析4种组合中呈现差异表达的Hsf家族成员,这4种组合为:先玉335高温/先玉335常温(A)、中地88常温/先玉335常温(B);中地88高温/中地88常温(C);中地88高温/先玉335高温(D)。
对获得的Hsf家族成员基因,根据其ID号,在网络数据库中(http://plants.ensembl.org/index.html)查找基因的全长及cDNA序列,分析其编码蛋白的氨基酸序列。
对Hsf家族成员基因表达蛋白的理化性质,通过网络数据库(https://web.expasy.org/protparam/)在线分析完成,分析参数包括:基因的染色体分布、基因的外显子数目、cDNA长度、编码氨基酸数目、分子式、分子量、等电点及不稳定指数。
对Hsf家族成员基因表达蛋白的二级和三级结构分析,利用网络在线分析软件完成,网站分别为http://bioinf.cs.ucl.ac.uk/psipred/和https://www.swissmodel.expasy.org/。二级结构分析包含结构域名称及数量、三级结构分析为参考网络数据库中的模板,利用其模型1预测其三维结构。
根据read count的均一化结果,对上述A、B、C、D共4种组合进行分析,寻找差异表达的Hsf家族成员基因。差异基因入选条件为差异倍数Fold Change(Case/Control)大于2(即|log 2 Fold Change|>1),显著性p<0.05。再统计不同组合中上调基因和下调基因的数目及其分布。
根据转录组测序结果,在4种差异表达分析中,共得到15个差异表达Hsf家族成员基因,基因的名称、ID号及编码蛋白的氨基酸序列如表1所示,不同基因,其编码蛋白含有的氨基酸数目不同,即蛋白质大小存在差异。这15个基因分布于玉米基因组的第1,3,4,5,6,7,8,9,10共9条染色体上(表2),分别各含有4,1,1,1,1,2,2,2,1个基因,在玉米第2染色体,没有检测到存在差异表达的Hsf转录因子基因。
表1 Hsf基因及其编码蛋白的氨基酸序列
表2 Hsf基因在玉米基因组中的染色体分布
根据基因编码蛋白的氨基酸序列,对这15个基因进行理化性质分析,结果如表3所示。除ZmHsf-07基因外,其余基因都为断裂基因,且都含有2个外显子。cDNA和编码多肽链的长度各不相同,cDNA最长的为ZmHsf-15,达到1 410 bp,编码469个氨基酸;最短的为ZmHsf-18,仅有774 bp,编码257个氨基酸;这15个基因的cDNA长度平均为1 113.40 bp,编码氨基酸的数目平均为370.13个。从cDNA长度、编码氨基酸数目和分子量三列数据来看,这三者间呈正相关关系,即cDNA越长,编码氨基酸数目越多,蛋白分子量也越高。等电点分析结果显示,除ZmHsf-19大于7.00之外,其余的均小于7.00,即多数蛋白显酸性。此外,从不稳定指数结果来看,这15个蛋白都属于不稳定蛋白。
表3 Hsf基因编码蛋白的理化性质
基因编码蛋白的二级结构预测结果显示,共包含四种二级结构,即螺旋区、转角区、假想结构域边界区和无规则卷曲区,总的来说,包括序列最多的为无规则卷曲区;最少的为假想结构域边界区,只在ZmHsf-16基因编码蛋白含有1个。这15个基因编码蛋白含有的螺旋区和转角区如图1所示。对于螺旋区,最小的为ZmHsf-20和ZmHsf-27基因编码蛋白,只有8个,最大的为ZmHsf-15,达到20个,平均为12.67个;对于转角区,在这15个基因编码蛋白中,变化幅度为2~7个,平均为4.06个。从图1还可以看出,基因表达蛋白的二级结构中,螺旋区和转角区数量没有相关关系。
图1 预测的Hsf家族蛋白成员的螺旋和转角结构域的数量分布
基因表达蛋白三级结构预测结果如图2所示。蓝色末端为N末端,红色末端为C末端。所有蛋白的三级结构都含有较多的螺旋区、转角区和无规则卷曲区,不同蛋白具有不同的三级结构,总的来说,蛋白的氨基酸序列越长,则其结构越复杂。蛋白的三级结构与其在细胞中相应的生物学功能密切相关。
根据材料和温度的不同,分析了4种组合的差异比较(A:先玉335高温/先玉335常温;B:中地88常温/先玉335常温;C:中地88高温/中地88常温;D:中地88高温/先玉335高温),结果如表4所示。在A、B、C、D中,上调表达基因数量分别为9,5,8,5个,下调表达基因数量分别为1,2,1,2个。总的来说,上调表达基因数量要远远多于下调表达基因数量。有的基因会同时出现在不同的差异比较中,如ZmHsf-12在A、B和C中均表现为上调表达;ZmHsf-07,ZmHsf-08,ZmHsf-13和ZmHsf-17这4个基因在A和C中均表现为上调表达。也有个别基因比较特殊,如ZmHsf-18在A中上调表达,而在C和D中下调表达,ZmHsf-03在A中上调表达,但在D中又呈现出下调表达。从差异表达倍数的数据来看,不同基因在不同差异组合中数量不同,最小的刚超过2倍,最大的为无限大(此时分母为0)。
表4 玉米Hsf家族成员基因在不同温度条件下的差异表达
随着全球气候变暖,高温已成为影响玉米生长发育主要的非生物胁迫因素之一[18],通过玉米育性、灌浆、光合作用、体内代谢物、玉米籽粒淀粉含量等生长发育方面的影响,造成产量减少和品质下降[19]。当植株长期暴露在高温缺水的环境下,为应对不利的生长环境,细胞内各种基因的表达时空模式也会随之发生变化,而基因的表达与转录因子对基因转录的调控密切相关[20]。
转录因子是激活基因转录的一类重要的调控因子,通过特异性的识别并结合在启动子的相应顺式作用元件上,从而保证目的基因以特定的强度在特定的时间与空间表达[21]。转录因子在细胞中数量众多,可以划分为多个转录因子家族,每个家族又包括多个成员。在植物中,Hsf家族是一类非常重要的与温度胁迫表达相关的蛋白质因子[22]。Hsf家族基因在动物中研究较多[23-24],在植物中的研究相对较少[25]。在热胁迫条件下,有的基因表现为上调表达,有的基因则表现为下调表达,以应对不利的生态条件。
玉米作为全世界最重要的粮食作物之一,在其耐高温胁迫研究中,主要是耐高温胁迫玉米品种的常规法田间选育[26-27],而对其耐高温胁迫的分子遗传机制研究极少,在Hsf基因家族成员方面鲜有报道[28]。本研究通过耐高温胁迫和不耐高温胁迫的两个玉米材料,在高温和常温处理条件下,对其花粉的转录组进行测序分析,筛选出了15个在不同组合比较间的差异表达基因,并对其基因的序列、表达蛋白的理化性质和结构以及基因的表达作了深入分析。总的来说,当以常温条件为对照时,在高温处理中多数基因表现为上调表达,如ZmHsf-07,ZmHsf-08,ZmHsf-13和ZmHsf-17,且差异倍数有的很大,甚至有的基因在常温条件下没有检测到转录产物,而在高温条件下却有较高水平的表达,如ZmHsf-13;当以不耐高温胁迫的先玉335为对照时,无论高温还是常温条件,多数基因都在中地88材料中表现为上调表达,仅有少数几个基因表现为下调表达。这一结果表明这些基因的表达与温度密切相关。
对于本研究获得的15个Hsf基因,其表达模式为理解玉米耐高温胁迫的分子遗传机制提供了一些分子信息。目前已获悉了基因的全长及cDNA序列,为后期对其功能作进一步鉴定奠定了基础,也为其他植物Hsf家族成员基因的相关研究提供了参考。