张安宁,毛庆丰,孙浩楠,申 晴,李志刚,刘中奇
(内蒙古民族大学农学院,内蒙古 通辽 028043)
大豆(Glycine max)起源于中国[1],已有5 000多年的栽培历史[2],春大豆主产区包括黑龙江、吉林、辽宁和内蒙古四省(区)[3]。大豆属于一年生草本植物[4],具有很高的蛋白质含量与油含量[5-6],是人类主要的粮食作物之一[7]。同时,大豆不仅可以作为食品的原材料,还可用于食用油的加工,并且加工所剩的豆饼可用于制作肥料[8-10]。大豆生长发育过程中需要芳香族类物质,而莽草酸途径作为芳香族类物质合成的必要途径,对大豆生长发育有重要作用。DHQ-SDH 是植物体内合成的、调节莽草酸途径的关键酶。一方面,可催化3-脱氢奎尼酸脱水形成莽草酸,另一方面,在NADP+存在的条件下催化3-脱氢莽草酸和莽草酸之间的可逆反应[11]。截至目前,已有学者对DHQ-SDH基因家族进行了相关研究。SINGH等[12]研究表明,拟南芥体内的DHQ-SDH蛋白为莽草酸途径中的代谢物分配提供了额外的调节水平,从而使代谢物从DHQ区域转移到SDH区域的效率提高。HAN等[13]首次报道冷胁迫对淡水绿藻DHQ-SDH基因的调控。目前,有关大豆DHQ-SDH基因家族的研究少有报道,笔者通过生物信息学方法,对大豆DHQSDH基因家族成员的理化性质、基因架构、保守基序、系统发育进化树等进行了预测与分析,旨为日后大豆DHQ-SDH基因的研究提供理论依据。
所使用的拟南芥DHQ-SDH蛋白序列、番茄DHQ-SDH蛋白序列以及大豆全基因组Glycine maxv2.1数据均来源于Ensembl(http://plants.ensembl.org/index.html)数据库[14]。
将拟南芥DHQ-SDH序列作为对照,利用Tbtools软件[15]进行blast比对,将筛选得到的候选序列上传至在线网站Pfam(http://pfam.xfam.org/)[16]检查是否含有DHQas_1序列,最终得到全部大豆DHQ-SDH基因家族成员。使用Expasy(https://web.expasy.org/protparam/)在线软件[17]预测家族成员蛋白质的理化性质,利用WoLF PSORT(https://wolfpsort.hgc.jp/)在线网站[18]对其家族成员蛋白质进行亚细胞定位预测。
根据大豆基因注释文件可获得GmDHQ-SDH家族的13个成员在染色体上的位置信息及基因结构信息,使用Tbtools软件[15]实现染色体定位与基因结构的可视化。
使用SOPMA(https://hfffg35d63ad69a164cc2swoc6n65wcbov6k6vfgfy.eds.tju.edu.cn/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)网站[19]和SWISS-MODEL(https://swissmodel.expasy.org/)网站[20]预测大豆DHQSDH基因家族成员蛋白质的二级结构以及三级结构,通过PROCHECK软件[21]完成三级结构可靠性的检测。
利用Tbtools[15]软件预测大豆DHQ-SDH蛋白的保守基序,并进行可视化。
于Ensemble(http://plants.ensembl.org/index.html)数据库[14]下载拟南芥和番茄的DHQ-SDH蛋白质序列(分别为1 个和2 个),将拟南芥和番茄2 个物种的DHQ-SDH 蛋白质序列(3 个)与所提取到的大豆DHQ-SDH蛋白质序列通过MEGA11软件[22]进行系统发育树的构建,并使用iTOL(https://itol.embl.de/)在线网站[23]美化进化树。
利用Tbtools[15]筛选大豆DHQ-SDH基因家族成员的CDS 序列,将筛选出的序列上传至psRNATarget(https://www.zhaolab.org/psRNATarget/home)在线软件[24],预测大豆GmDHQ-SDH基因的miRNA。
通过Tbtools软件[15]从基因组文件中提取得到GmDHQ-SDH基因家族成员的上游2kb序列。将提取得到的序列上传至PlantCARE(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)网站[25]进行分析,最终使用Tbtools软件[15]进行启动子顺式作用元件分布的可视化。
共鉴定出DHQ-SDH基因家族成员13个,将其命名为GmDHQ-SDH1至GmDHQ-SDH13。并对家族成员进行蛋白质理化性质分析,其中,氨基酸数量位于409~577之间;分子量为44.36~62.98 kD;不稳定系数介于23.32~32.03 之间;等电点为5.26~6.77;除GmDHQ-SDH1、GmDHQ-SDH3、GmDHQ-SDH13 外,其余蛋白均属于疏水蛋白,而且,大豆DHQ-SDH家族成员均具有较好的热稳定性,分别位于叶绿体、过氧物酶体与胞液中。
表1 GmDHQ-SDHs蛋白理化性质及亚细胞定位Tab.1 Physicochemical properties and subcellular localization by GmDHQ-SDHs protein
GmDHQ-SDHs家族成员共分布在5条染色体上,且分布具有随机性。GmDHQ-SDH13与GmDHQ-SDH12分布在1号染色体上,GmDHQ-SDH2位于19号染色体,GmDHQ-SDH1位于20号染色体,GmDHQ-SDH3分布在8号染色体上,分布在3号染色体上的基因最多,为GmDHQ-SDH4~GmDHQ-SDH11(图1)。
图1 大豆GmDHQ-SDHs基因染色体定位Fig.1 Chromosome localization of GmDHQ-SDHs gene in soybean
GmDHQ-SDH4、GmDHQ-SDH5、GmDHQ-SDH6、GmDHQ-SDH7、GmDHQ-SDH12以及GmDHQ-SDH13均含有上下游非编码区域,GmDHQ-SDH1具有下游非编码区域,而其他GmDHQ-SDHs家族成员不具备上下游编码区域。同时,该家族成员所包含的内含子数量介于7~11 个之间,表明其在结构上很保守,其中,GmDHQ-SDH3的内含子最长(图2)。
图2 GmDHQ-SDHs基因家族染色体结构图Fig.2 Chromosome structure of GmDHQ-SDHs gene family
大豆DHQ-SDH基因家族成员蛋白质的二级结构中含有α-螺旋、β-折叠、延伸链与随机卷曲。所有成员均以α-螺旋为主,其中,GmDHQ-SDH9中的α-螺旋所占比例最大,为48.33%;随机卷曲为第二主要结构,所占比例介于29.76%~34.84%之间(表2)。GmDHQSDH基因家族13 个家族成员的三级结构具有很高的相似性,而且均以α-螺旋为主(图3)。GmDHQ-SDH1至GmDHQ-SDH13的模型氨基酸在最佳允许区和次允许区的比例介于97.7%~100%之间,所以构建的GmDHQ-SDH1~GmDHQ-SDH13的蛋白三级结构符合立体化学规则。
图3 大豆DHQ-SDH基因家族三级结构预测图Fig.3 The tertiary structure prediction map of DHQ-SDH gene family in soybean
表2 GmDHQ-SDHs基因家族二级结构Tab.2 Secondary structure of GmDHQ-SDHs gene family
GmDHQ-SDHs家族成员共分为4个组(分别为Group1~Group4)。Group1中GmDHQ-SDH4和GmDHQSDH5亲缘关系较近,GmDHQ-SDH8和GmDHQ-SDH9亲缘关系较近;Group2中,GmDHQ-SDH7与GmDHQ-SDH11亲缘关系较近;Group4中,GmDHQ-SDH12和GmDHQ-SDH13亲缘关系较近。见图4(A)。
图4 GmDHQ-SDHs基因家族保守基序Fig.4 Conserved motifs of GmDHQ-SDHs gene family
GmDHQ-SDHs家族成员蛋白均包含Motif1~Motif6,而且Motif1~Motif6 共同组成了DHQas_1 结构域。同时,GmDHQ-SDH10、GmDHQ-SDH8、GmDHQ-SDH9、GmDHQ-SDH11和GmDHQ-SDH3不具有构成SDH_C结构域的Motif9,见图4(B)、图4(C)。
使用2个拟南芥DHQ-SDH蛋白序列、2个番茄DHQ-SDH蛋白序列与13个大豆DHQ-SDH蛋白序列构建系统发育树(图5)。其中,Group2 由At3g06350、Solyc01g067750、GmDHQ-SDH1、GmDHQ-SDH3、GmDHQSDH12、GmDHQ-SDH13构成,由此说明,这6条蛋白序列具有很高的保守性。而在Group3中,GmDHQ-SDH2、GmDHQ- SDH4、GmDHQ- SDH5、GmDHQ- SDH6、GmDHQ- SDH7、GmDHQ- SDH8、GmDHQ- SDH9、GmDHQ-SDH10、GmDHQ-SDH11聚在一起,说明这些蛋白序列亲缘关系较近。
图5 拟南芥、番茄、大豆DHQ-SDH基因家族进化分析Fig.5 Phylogenetic analysis of DHQ-SDH gene family in arabidopsis,tomato and soybean
使用psRNATarget(https://www.zhaolab.org/psRNATarget/home)在线软件预测大豆GmDHQ-SDH基因的miRNA,结果得到127 对调控关系,共有2 种抑制靶基因的方式,分别为剪切和翻译,其中,调控GmDHQ-SDH12与GmDHQ-SDH13的miRNA 均有23 个,为所有大豆GmDHQ-SDH基因中数量最多者。调控GmDHQ-SDH3、GmDHQ-SDH4、GmDHQ-SDH6、GmDHQ-SDH9和GmDHQ-SDH11的miRNA 数量均为7个;调控GmDHQ-SDH7、GmDHQ-SDH5的miRNA为6个;调控GmDHQ-SDH1、GmDHQ-SDH8和GmDHQ-SDH10的miRNA 均为8 个;调控GmDHQ-SDH2的miRNA 数量为10 个。将数学期望值设定为5.0,共筛选得到16 对GmDHQ-SDH12、GmDHQ-SDH13和miR9746 家族之间的调控关系,miR9746 家族成员共有8 个,分别为gma-miR9746a、gma-miR9746b、gma-miR9746c、gma-miR9746d、gma-miR9746e、gma-miR9746f、gma-miR9746g 以及gma-miR9746h,8 个家族成员分别与GmDHQ-SDH12和GmDHQSDH13有1对对应关系。见表3。
表3 靶向调控大豆GmDHQ-SDH基因的miRNATab.3 miRNA targeting GmDHQ-SDH gene in soybean
13个家族成员的顺式作用元件无论在类别或数量上均存在差异,其中,光响应元件在所有元件中出现的频率最高,据此推测大豆的DHQ-SDH基因在大豆生长发育响应光调控的过程中具有重要作用。此外,鉴定出的生长发育调控响应包括胚乳表达响应元件、分生组织表达响应元件和栅栏叶肉细胞响应元件。而且,在启动子区鉴定出了逆境胁迫响应元件,其中包括低温响应元件、干旱响应元件、厌氧感应元件,表明在受到这些胁迫时,响应元件会提高植株自身的抵抗能力。鉴定出的激素应答响应元件共有4种,数量由多至少依次为脱落酸响应元件、茉莉酸甲酯响应元件、生长素响应元件、水杨酸响应元件。见图6。
图6 GmDHQ-SDHs基因启动子区顺势作用元件分析Fig.6 Analysis of cis-acting elements in the promoter region of GmDHQ-SDHs gene
DHQ-SDH可以促进莽草酸的合成[26]。据报道,烟草DHQ-SDH基因可能参与碳源向次生代谢的运输[27]。笔者通过生物信息学方法共鉴定出13个大豆DHQ-SDH基因家族成员,大豆DHQ-SDH基因家族成员蛋白的理化性质和亚细胞定位分析显示,GmDHQ-SDH 蛋白均属于稳定蛋白,且大部分为疏水蛋白,分别位于叶绿体、过氧物酶体和胞液中,该结果与王梅等[28]在巨尾桉EuDQD/SDH5中发现的类似。保守基序分析表明,大豆DHQ-SDH基因家族成员共分为4 组,因为处于同一组中的家族成员亲缘关系较近,所以猜测GmDHQ-SDH4和GmDHQ-SDH5亲缘关系较近,GmDHQ-SDH8和GmDHQ-SDH9亲缘关系较近,GmDHQ-SDH7与GmDHQ-SDH11亲缘关系较近,GmDHQ-SDH12和GmDHQ-SDH13亲缘关系较近,而且,该家族成员均包含DHQas_1 结构域,说明其保守性很高,与SINGH 等[12]的研究结果相同。但是有些成员不具备构成SDH_C 结构域的Motif9,说明GmDHQ-SDH也具有很高的功能多样性。系统进化分析结果表明,At3g06350、Solyc01g067750、GmDHQ-SDH1、GmDHQ-SDH3、GmDHQ-SDH12、GmDHQ-SDH13位于同一组别,由此推测上述基因具有相似功能。基因结构分析表明,所有家族成员含有的内含子数量为7~11 个,其中,GmDHQ-SDH3的内含子最长。顺式作用元件分析表明,大豆DHQ-SDH基因家族成员启动子区的顺式作用元件共分为4类(光响应元件、逆境胁迫响应元件、激素应答响应元件、生长发育调控响应元件),其中,光响应元件出现频率最高,据此推测大豆GmDHQ-SDH基因在大豆植株成长时对光的变化能够迅速地做出响应。与此同时,鉴定出了逆境胁迫响应元件,HAN等[13]研究发现,低温可诱导淡水绿藻水绵DHQ-SDH基因家族成员上调表达。该家族成员具有的激素应答响应元件能够响应茉莉酸甲酯、脱落酸、水杨酸、赤霉素以及生长素,推测GmDHQ-SDH可以通过响应以上激素应答,参与调控非生物胁迫,从而增加植株对逆境的耐受能力。张林等[11]在烟草中发现NtDHQ-SDHs除具备上述元件外,还具有组成型原件,所以推测DHQ-SDH基因具有更丰富的功能。