王凌云+郭明+赵艳
摘要:蔗糖合成酶(sucrose synthase,SuS)是蔗糖代谢的关键酶,在植物的代谢反应中起重要作用。以谷子基因组数据库为平台,借用生物信息学手段对谷子SiSuS基因家族进行挖掘和分析。结果表明,谷子的SiSuS基因家族包括9个基因,它们不均匀地分布在5条染色体上。该家族氨基酸序列长度为809~1 088 aa,外显子数目为10~16个,大多数蛋白质为弱酸性。谷子SiSuS的氨基酸序列具有9个保守基序;进化树分析结果表明,谷子、水稻、高粱SiSuS蛋白聚在一起。
关键词:谷子;蔗糖合成酶;SiSuS基因;生物信息学分析;蛋白结构
中图分类号: S515.01文献标志码: A
文章编号:1002-1302(2017)15-0030-04
蔗糖合成酶(sucrose synthase,SuS)作为植物蔗糖代謝的重要酶之一,对植物的生长具有重要作用。蔗糖合成酶能够参与蔗糖的代谢和调控蔗糖的输入,影响细胞分化与纤维壁的形成,调节淀粉的合成,对作物产量和品质调控都有重要的意义[1]。蔗糖合成酶基因广泛存在于高等植物中,目前已经从马铃薯、胡萝卜、玉米、柑橘等大量植物中获得SuS基因[2]。大量研究显示,SuS是一个小的基因家族,在大多数植物中至少含有3个SuS基因,拟南芥、莴苣、橡树均含有6个SuS基因[3-5],玉米中至少有5个SuS基因,水稻中已经发现[JP3]9个SuS基因[6],烟草中发现14个SuS基因[7],但是对谷子SuS基因的研究尚未见报道,因此,本研究以谷子为对象进行分析。
谷子(Setaria italica)作为我国传统粮食作物,种植面积广,同时营养价值高,有“百谷之长”的美誉[8]。谷子基因组小且为二倍体,与水稻、高粱、玉米共线性高,是禾本科基因组研究的模式植物之一,也是研究C4植物的模式植物。目前谷子的全基因组测序已经完成,这为谷子分子生物学研究奠定了良好的基础。本研究利用生物信息学相关技术鉴定谷子SuS基因家族,并对该家族序列及蛋白系统进行比较分析,对了解SiSuS基因家族在谷子蔗糖代谢中的作用具有非常重要的意义。
1材料与方法
1.1谷子SuS基因的鉴定及序列分析
首先在Pfam数据库(http://pfam.xfam.org/)[9]中下载SuS家族的隐马氏模型文件(Pfam号码:PF00862),从Gramene(http://www.gramene.org/)中输入Pfam号码进行相似性搜索,找到与谷子相关基因的ID及其蛋白序列,进行重复性比对,除去重复项和冗余,得到无重复的基因、转录本、蛋白ID以及蛋白序列和外显子数量,共得到9条蛋白并命名为SiSuS1~SiSuS9。
利用SMART网站(http://smart.embl-heidelberg.de/)和CDD(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)网站[10-11]对蛋白的结构域进行检测。在ProtParam网站(http://web.expasy. org/protparam/)对谷子SiSuS蛋白的相关信息(分子量、氨基酸数目、等电点)进行分析[12]。
1.2染色体定位
结合谷子基因组数据库中的信息,从Ensembl Plants(http://plants. ensembl.org/Setaria_italica/Info/Index)中查询谷子染色体的长度,使用Adobe illustrator CS5软件绘制基因在染色体上的相对位置。
1.3SiSuS基因家族蛋白的绘制
分析蛋白质结构域的位置,使用PROSITE在线网站(http://prosite.expasy.org/)[13]分析9个SiSuS蛋白序列,得出每个蛋白相应的蔗糖合成酶结构域、糖基转移酶(glycosyltransferase)结构域、蔗糖磷酸合成酶(sucrose-phosphate synthase)结构域的位置。
[HTK]1.4SiSuS基因家族进化树的绘制及内含子、外显子的结构分析[HT]
利用Clustal X[14]对比所得到的SiSuS蛋白序列并下载分析结果。使用MEGA 6.0软件采用邻接法(NJ法)绘制进化树,Bootstrap设置为1 000。将Fasta格式的谷子SiSuS基因编码的核苷酸序列和相应的全核苷酸序列,通过GSD软件[15]绘制谷子SiSuS基因的内含子和外显子的结构模式图。
1.5谷子SiSuS基因编码的序列分析及模体分布
利用MEME(http://meme.nbcr.net/meme/cgibin/meme.cgi)[16]将Fasta格式的谷子SiSuS基因编码的氨基酸序列进行序列分析及保守性基序分布,设定序列长度范围为20~300 aa。
1.6谷子、高粱和水稻SuS基因家族的比较分析
将获得的谷子、高粱和水稻SuS基因的氨基酸序列以Fasta格式保存,采用“1.3”节的方法绘制这3种植物SuS基因的系统进化树,对不同物种SuS基因家族进行比较分析。
2结果与分析
2.1谷子SiSuS基因家族的鉴定及序列分析[HT]
由表1可知,通过对谷子基因组数据库的检索共鉴定出9个SuS基因,命名为SiSuS1~SiSuS9。分析9个SiSuS蛋白序列发现不同蛋白差异很大,SiSuS蛋白的氨基酸个数范围为809~1 088 aa,分子量范围为92.34~120.00 ku,等电点范围为5.88~7.49,基因含有10~16个外显子。从蛋白的基本特点可知,SiSuS蛋白无论从序列的长度还是蛋白的特性变化都很大,表示该基因家族蛋白执行不同的功能。值得注意的是,多数SiSuS蛋白的等电点小于7.00,表示多数SiSuS基因可能编码弱酸性蛋白,在酸性的亚细胞环境中发挥作用。endprint
2.2谷子SiSuS基因家族内含子、外显子的分析
为进一步研究SiSuS基因的特性,使用GSDS 2.0软件绘制SiSuS基因的结构模式图,得到谷子SiSuS基因的内含子-外显子结构。由图1可见,所有的SiSuS基因都含有内含子,除SiSuS7基因含有9个内含子外,其他8个基因的内含子数均大于10,SiSuS3基因的内含子最多,含有15个内含子。由此可知,SiSuS基因结构较为复杂。
2.3谷子SiSuS基因染色体定位
由图2可知,SiSuS基因在染色体上分布不均匀,在谷子的9条染色体中除2、3、7、8号染色体外,其余染色体上均含有SiSuS基因。5号、6号染色体上各只有1个SiSuS基因;1号、9号染色体上各含有2个SiSuS基因;4号染色体上含有3个SiSuS基因,数量最多。其中,除基因SiSuS6、SiSuS4、SiSuS5位于染色体的中上端外,其余基因均位于染色体的下端。
2.4谷子SiSuS蛋白的进化树与结构域分析
运用MAGA 5.1软件分析谷子9个SiSuS蛋白的进化,绘制出SiSuS蛋白进化树(图3-a),9个SiSuS蛋白被明显地分成了2组(组一、组二),其中,SiSuS3、SiSuS4、SiSuS7、SiASuS8、SiSuS9蛋白聚为组一,组一可以进一步被分为3组。SiSuS1、SiSuS2、SiSuS5、SiSuS6蛋白聚在组二,组二也可以进一步被分成3组。组一含SiSuS蛋白较多,约有55.5%的SuS蛋白位于组一。
利用PROSOTE在线网站分析每个SiSuS蛋白的结构域(图3-b),所有谷子SiSuS蛋白都含有植物特异的糖苷基转移酶结构域和蔗糖合成酶结构域,部分蛋白含有蔗糖磷酸合成酶结构域。其中,SiSuS3、SiSuS4、SiSuS7、SiASuS8、SiSuS9蛋白均含有2个结构域,即糖苷基转移酶结构域、蔗糖合成酶结构域,SiSuS1、SiSuS2、SiSuS5、SiSuS6蛋白不仅含有糖苷基转移酶结构域、蔗糖合成酶结构域,也含有蔗糖磷酸合成酶结构域。蛋白的进化树和结构域分组一致,即含有3个结构域的蛋白都聚集于组一,含有2个结构域的蛋白都聚集于组二,表明蛋白的结构、功能和进化的统一性。
2.5谷子SiSuS蛋白的序列分析及模体分布
模体(motif)是序列中局部的保守区域。进一步分析谷子的9个SiSuS蛋白结构域,利用MEME对SiSuS蛋白进行基序分析,设定序列长度为20~300 aa,设定大范围的长度序列可多样性搜索蛋白的模体序列。由表2可知,SiSuS蛋白3个结构域又可以细分为9个基序,9条序列氨基酸个数范围在55~200 aa之间。其中,motif1、motif3、motif4、motif7、motif9 5个保守基序包含的氨基酸数量均大于100 aa,基序motif 2、motif 5包含的氨基酸数量较少,均为55 aa。通过软件分析得出motif 3、motif4、motif7、motif8共同组成了谷子蔗糖合成酶结构域,motif1、motif2、motif5、motif6共同组成了糖基转移酶结构域,motif 9构成了蔗糖磷酸合成酶结构域。
进一步分析谷子SiSuS蛋白9个基序的保守程度(图4-a),在相同部位蔗糖合成酶结构域中SiSuS3、SiSuS4、SiSuS7、SiSuS8、SiSuS9蛋白含有motif 3,SiSuS1、SiSuS2、SiSuS5、SiSuS6则含有motif 7、motif 4、motif 8,这表明该蛋白序列可能存在缺失。进一步分析发现,9个motif中motif 8的保守性较高,保守比例为71.4%;而含200个氨基酸的motif 3保守性最低,其中许多位置的氨基酸多样性程度较高,其保守比例仅为42%(图4-b)。
2.6谷子、高粱、水稻SuS基因家族进化树比较
为了更深入研究谷子SuS基因家族的进化关系,选取高粱、水稻SuS与谷子SuS进行比较和分析。其中,高粱和水稻的基因均为9个,共27个SuS基因。如图5所示,27个基因分成了4个分支,命名为Class A~Class D。除Class C亚支含有2种植物的SuS基因外,其他3个亚支都含有3种植物(高梁、水稻、谷子)的SuS基因;Class A亚支中SuS基因最多,有10个基因,Class C亚支中SuS基因最少,仅有2个基因。通过对谷子、水稻、高粱SuS基因的进化关系分析,发现9对物种间的直系同源基因,1对水稻的旁系同源基因,约占所有基因的74.1%,表明这些基因在谷子、水稻和高粱基因组中,按照各自物种的特异方式进行了扩展,这种现象在其他植物基因家族中也普遍存在。
3討论与结论
长发育过程中发挥着至关重要的作用。1955年Cardini等首次在小麦胚芽中发现了蔗糖合成酶[17],自此以后蔗糖合成酶基因从多种植物中分离得到,其中多数为玉米、水稻等淀粉储存植物,在拟南芥、烟草等蔗糖储存植物中也相继获得。谷子是我国传统的淀粉植物,也是C4植物的模式植物,但是目前还没有对其SuS基因家族进行系统研究和分析的报道,基于此,本研究开展了谷子全基因扫描,深入分析SuS基因家族的特征、特性。
在许多植物中蔗糖合成酶以不同亚型形式存在,这些亚型至少由2个基因编码,甚至更多,玉米中至少有5个SuS基因,水稻中已经发现9个SuS基因[18]。这些基因的结构、功能和染色体定位各不相同,白杨中蔗糖合成酶基因家族的15个成员分别在2、4、6、15、17、18号染色体上[19],谷子中蔗糖合酶基因分别在1、4、5、6、9号染色体上。蔗糖合成酶在植物中催化蔗糖+二磷酸尿(嘧啶)苷果糖+尿嘧啶核苷-5′-二磷酸葡萄糖可逆反应,已经公认蔗糖合成酶基因含有2个结构域:蔗糖合成酶结构域、糖基转移酶结构域,在拟南芥中所有的AtSUS家族都有这2个结构域,本研究的结果与之相符。endprint
隨着生物信息学的发展和完善,植物蔗糖合成酶基因家族的进化与分类研究备受关注。进化分析表明,SuS基因家族可分为4族:单子叶族、双子叶SuS1族、双子叶SuS2族、NG族。本研究初步分析了谷子、水稻、高粱SuS基因家族的进化关系,结果表明,这些基因的同源性高,可为深入研究SuS家族对谷子生长调控的机制提供参考,对深入揭示蔗糖合成酶在谷子的生物学功能以及了解整个糖代谢过程具有重要意义。
参考文献:
[1]Koch K E,Wu Y,Xu J. Sugar and metabolic regulation of genes for sucrose metabolism:potential influence of maize sucrose synthase and soluble invertase responses on carbon partitioning and sugar sensing[J]. Journal of Experimental Botany,1996,47(301):1179-1185.
[2]卢合全,沈法富,刘凌霄,等. 植物蔗糖合成酶功能与分子生物学研究进展[J]. 农业生物技术学报,2005,21(7):34-37.
[3]Baud S,Vaultier M N,Rochat C. Structure and expression profile of the sucrose synthase multigene family in Arabidopsis[J]. Journal of Experimental Botany,2004,55(396):397-409.
[4]Horst I,Welham T,Kelly S,et al. TILLING mutants of Lotus japonicus reveal that nitrogen assimilation and fixation can occur in the absence of nodule-enhanced sucrose synthase[J]. Plant Physiology,2007,144(2):806-820.
[5]Xiao X,Tang C,Fang Y,et al. Structure and expression profile of the sucrose synthase gene family in the rubber tree:indicative of roles in stress responseand sucroseutilizationin the laticifers[J]. FEBS Journal,2014,281(1):291-305.
[6]Cho J I,Kim H B,Kim C Y,et al. Identification and characterization of the duplicate rice sucrose synthase genes which are associated with the plasma membrane[J]. Molecules andCells,2011,31(6):553-561.
[7]Wang Z,Wei P,Wu M,et al. Analysis of the sucrose synthase gene family in tobacco:structure,phylogeny,and expression patterns[J]. Planta,2015,242(1):153-166.
[8]陈卫军,魏益民,张国权,等. 国内外谷子的研究现状[J]. 杂粮作物,2000,20(3):27-29.
[9]Punta M,Coggill P C,Eberhardt R Y,et al. The Pfam protein families database[J]. Nucleic Acids Research,2012,40(1):290-301.
[10]Schultz J,Milpetz F,Bork P,et al. SMART,a simple modular architecture research tool:identification of signaling domains[J]. Proceedings of the National Academy of Sciences of the United States of America,1998,95(11):5857-5864.
[11]Marchler-Bauer A,Anderson J B,Chitsaz F,et al. CDD:specific functional annotation with the Conserved Domain Database[J]. Nucleic Acids Research,2009,37:205-210.
[12]Wang Y,Deng D,Shi Y,et al. Diversification,phylogeny and evolution of auxin response factor (ARF) family:insights gained from analyzing maize ARF genes[J]. Molecular Biology Reports,2012,39(3):2401-2415.
[13]Sigrist C J,Cerutti L,de Castro E,et al. PROSITE,a protein domain database for functional characterization and annotation[J]. Nucleic Acids Research,2010,38:161-166.
[14]Larkin M A,Blackshields G,Brown N P,et al. Clustal W and clustal X version 2.0[J]. Bioinformatics,2007,23(21):2947-2948.
[15]Kiefer F,Arnold K,Künzli M,et al. The SWISS-MODEL repository and associated resources[J]. Nucleic Acids Research,2009,37:387-392.
[16]Bailey T L,Boden M,Buske F A,et al. MEME SUITE:tools for motif discovery and searching[J]. Nucleic Acids Research,2009,37:202-208.
[17]Cardini C E,Leloir L F,Chiriboga J. The biosynthesis of sucrose[J]. Journal of Biological Chemistry,1955,214(1):149-155.
[18]An X,Chen Z,Wang J,et al. Identification and characterization of the Populus sucrose synthase gene family[J]. Gene,2014,539(1):58-67.
[19]Zhang D Q,Xu B H,Yang X H,et al. The sucrose synthase gene family in Populus:structure,expression,and evolution[J]. Tree Genetics & Genomes,2011,7(3):443-456.endprint