普通烟草ERF转录因子亚家族成员鉴定及表达模式分析

2017-03-09 09:10
中国烟草科学 2017年1期
关键词:拟南芥结构域烟草

(1.中国农业科学院烟草研究所,青岛 266101;2.中国农业科学院研究生院,北京 100081)

普通烟草ERF转录因子亚家族成员鉴定及表达模式分析

任昂彦1,2,孔英珍1*

(1.中国农业科学院烟草研究所,青岛 266101;2.中国农业科学院研究生院,北京 100081)

乙烯结合响应因子(Ethylene-responsive element binding factors, ERF)家族广泛参与植物的生长发育、逆境调节及激素信号应答等过程。利用生物信息方法,鉴定普通烟草基因组ERF转录因子亚家族成员,并对该亚家族成员的染色体定位、理化性质、系统发生、保守结构域、亚细胞定位和组织表达模式进行分析。结果显示,目前在普通烟草中得到 121个ERF基因,在烟草24条染色体分布位置具有不均匀性。通过构建进化树,根据拟南芥ERF亚家族的分类方式将烟草ERF亚家族分为6组,同一分组成员的理化性质及保守域呈现高度一致性。亚细胞定位分析结果显示,绝大部分成员定位在细胞核,少数定位在线粒体和叶绿体上。组织表达模式分析结果显示,烟草ERF基因在幼根、成熟根、离体叶和茎中表达量较高,不同分组成员之间表达存在差异。

普通烟草;ERF基因家族;生物信息;表达模式;基因家族

乙烯结合响应因子(Ethylene-responsive element binding factors, ERF)也可称为 EREBP(Ethylene-responsive element binding protein)是AP2/ERF转录因子超家族中最大的转录因子亚家族分支,是植物所特有的参与乙烯响应途径调节的转录因子家族,主要参与植物的逆境调节,比如干旱、低温、虫害等。AP2/ERF转录因子家族因含AP2保守结构域而得名,该结构域由58~60个保守的氨基酸序列组成。2002年Sakuma等[1]根据AP2结构域的数量及结构,将拟南芥AP2/ERF转录因子家族分为5个亚家族:AP2、RAV、ERF、DREB和其他。其中AP2亚家族成员蛋白序列中含有2个AP2结构域;RAV亚家族含有1个AP2结构域和1个B3结构域;ERF和DREB亚家族均只含有1个AP2结构域,但结构域的序列结构有所区别;除此之外有1个单独基因独立分为1个亚家族。拟南芥ERF亚家族的AP2保守结构域可与GCCbox(AGCCGCC)特异性结合,并且AP2结构域的氨基酸序列的第14和 19位分别为丙氨酸(Ala)和天冬氨酸(Asp)[1],而DREB亚家族相应位置分别为缬氨酸(Val)和谷氨酸(Glu)。近年来,陆续在不同的物种鉴定出了ERF亚家族的转录因子,例如拟南芥[2]、水稻[3]、烟草[4]、柳树[5]、大豆[6]、棉花[7]、马铃薯[8]、小麦[9]等,这些ERF转录因子主要参与低温、干旱、高渗等非生物胁迫和防御病原感染等生物胁迫调节[10]。另外,ERF类转录因子参与激素信号转导也已被广泛报道,例如大豆GmERF3可被脱落酸、水杨酸、茉莉酸和乙烯利所诱导[6]。

随着生物信息技术的发展和基因组测序工作的完成[11],AP2/ERF转录因子超级家族已成为研究的热点。在茄科植物研究中,2010年Sharma等[12]利用EST(expressed sequence tag,表达序列标签)数据库鉴定出番茄有85个ERF基因,水稻有139个AP2/ERF成员[13],在辣椒中发现123个成员[14],在马铃薯中鉴定出155个AP2/ERF成员[8]等。目前对烟草的DREB亚家族有所报导[15-16],但对ERF亚家族基因鲜有鉴定分析。

烟草作为重要的经济作物及模式植物,研究其ERF转录因子亚家族基因分布、保守结构域的结构、染色体定位、亚细胞定位及表达模式分析等,对研究烟草的生长发育具有重要意义。因此,本研究利用生物信息方法对烟草的 ERF亚家族基因进行鉴定及基因表达分析,为研究ERF基因在烟草中的功能奠定基础。

1 材料与方法

1.1 普通烟草ERF转录因子家族蛋白序列的鉴定

基于TAIR数据库(http://www.arabidopsis.org/)报导的拟南芥ERF转录因子亚家族65个成员蛋白全长序列,在茄科数据库SNG(https://solgenomics. net/)和NCBI数据库(http://www.ncbi.nlm.nih.gov/)进行Blastp检索(e值:≤1e-15),获得烟草的相似序列,去除重复,作为烟草ERF亚家族的候选序列。结合 Pfam数据库(http://pfam.sanger.ac.uk/)[17]中AP2结构域序列号PF00847和SMART(http://smart. embl-heidelberg.de/)[18]在线分析候选序列的结构域,确保含有AP2结构域,依据拟南芥ERF亚家族AP2结构域的数量和结构特征,确定烟草ERF转录因子亚家族成员。

1.2 ERF转录因子蛋白全长理化性质分析

利用ExPASy ProtParam(http://web.expasy.org/ protparam/)对所得烟草ERF蛋白序列进行理化性质分析[19]。利用WolF PSORT(http://www.genscript. com/wolf-psort.html)和TargetP(http://www.cbs.dtu. dk/services/TargetP/)在线工具对烟草ERF亚家族成员进行亚细胞定位分析[20]。

1.3 普通烟草ERF转录因子家族进化分析

利用 Muscle[19]程序对拟南芥和普通烟草 ERF亚族的蛋白序列进行多序列比对,基于比对结果利用MEGA6.0[21]软件采用邻接法(Neighbor-Joining,NJ)构建拟南芥和普通烟草ERF亚族进化树,检验参数(Bootstrap)设置为1000。

1.4 ERF亚家族蛋白全长基序及多序列比对分析

利 用 MEME4.11.2( Multiple Expectation Maximization for Motif Elicitation, http://meme. nbcr. net/meme/cgibin/meme.cgi)[22]在线平台分析普通烟草ERF亚家族成员蛋白全长的保守基序(Motif),最大motif检索值定为10。

利用 ClustalW(http://www.genome.jp/tools/ clustalw/)[10]进行多序列比对,参数设置为默认值,并利用BoxShade程序将比对结果可视化。

1.5 不同组织表达模式分析

在NCBI数据库中下载烟草转录组数据,利用R语言Bioconductor程序对转录数据进行分析并提取ERF亚家族转录组数据,进行均一化,利用MeV本地软件绘制热图。

2 结 果

2.1 普通烟草ERF亚家族成员鉴定及染色体定位

利用已知拟南芥 ERF亚族蛋白全长序列和保守的结构域序列在 NCBI和 SGN数据库中进行Blastp检索烟草序列,结合Pfam和SMART数据库和ERF家族序列特征,筛选出121个烟草ERF亚家族成员。

根据烟草基因组注释信息,将获得的烟草ERF亚家族基因定位在烟草21条染色体上(chromosome,Chr)(表1),依据染色体定位结果,对基因进行重新编号。基因定位结果显示,121个基因在21条染色体上呈不均匀分布,在Chr 4和Chr 6上ERF基因数目最多,Chr 8、Chr 21、Chr 23均没有ERF亚家族的基因存在。

2.2 蛋白序列进化树分析及理化性质分析

对获得的121个烟草ERF转录因子成员与拟南芥ERF亚家族的65个成员进行系统发生分析,根据拟南芥ERF亚家族的分类方式将烟草的ERF亚家族分为 6组(Group)(Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ),每组分别包括16、9、41、20、7和28个ERF成员,根据图1显示,将烟草ERF亚家族的GroupⅥ分为Ⅵa和Ⅵb亚组(Subgroup),烟草ERF亚家族中每组至少含有4个拟南芥ERF同源基因。

分析烟草ERF蛋白全长理化性质,结果显示,最长的蛋白序列(NtERF119)由894个氨基酸组成,最短的蛋白序列(NtERF89)包含86个氨基酸,除这两个蛋白序列外,其余蛋白序列氨基酸数目均在127~447,变化范围较小。除NtERF119(100.23 kDa)和NtERF89(9.89 kDa)外,其余蛋白分子量变化范围在14.56~48.34 KDa。烟草ERF亚家族121个成员的等电点范围在 4.44~10.05,变化幅度较大。不同分组之间的蛋白序列长度以及等电点呈无规律变化,其中GroupⅡ的蛋白序列氨基酸大小变化范围较小在233~395,等电点NtERF51为7.75,其余成员的等电点在4.56~5.76,说明该组成员的蛋白含有较多的酸性氨基酸。GroupⅤ的氨基酸长度变化范围较小在297~380,等电点在4.44~5.22,含有较多的酸性氨基酸。

2.3 蛋白序列基序及序列特征分析

由图2可知,烟草ERF蛋白全长的保守基序(Motif)特征为:同组成员的基序组成相似。并且所有成员均含有 Motif1、Motif2和 Motif3或者Motif1、Motif3和Motif10共同组成AP2保守结构域。GroupⅠ和GroupⅡ成员均只含有Motif1、Motif2和Motif3组成的AP2保守结构域;GroupⅢ是成员最多,也是保守域构成最为复杂的一组,特有的3个Motif为:Motif5、Motif8、Motif9;GroupⅣ所特有的包括Motif4和Motif7;GroupⅤ中各成员的保守域结构一致性较高,除了AP2保守结构域以外还含有Motif6;SubgroupⅥa和SubgroupⅥb存在差异,SubgroupⅥb中所有成员的 N端都有一个Motif56;SubgroupⅥa中有6个成员的AP2结构域由Motif1、Motif3和Motif10共同组成(图2)。此外,同一分组成员的基序组成具有一致性,不同组之间基序的组成不同,这一点也证实了分组的可靠性。

从GroupⅠ~Ⅴ和SubgroupⅥa中随机选取成员蛋白序列进行多序列比对,分析AP2结构域发现,该结构域均含保守较强的WLG元件,位于Motif1中(图3)。且AP2结构域由60个左右的氨基酸序列组成,其中Arg-8、Gly-11、Ile-17、Arg-18、Arg-26、Ala-39、Asp-43和Asn-57都是非常保守的氨基酸位点。对各成员蛋白全称进行分析,预测6个功能未知的保守序列,其中Motif4和Motif8分别包含41和30个保守的氨基酸序列,保守性相对较高;Motif5、Motif6、Motif7和Motif9只有少数位置上氨基酸保守性较高(图3)。

表1 普通烟草ERF家族蛋白理化性质分析Table 1 Characteristic analysis of ERF proteins inNicotiana tabacum

图1 普通烟草和拟南芥ERF家族进化树分析Fig. 1 A phylogenetic tree of ERF family proteins inN.tabacumandArabidopsis Thaliana

图2 普通烟草ERF家族蛋白分组及保守基序分布分析Fig. 2 Classification and conserved motif analysis of the ERF gene family inN. tabacum

图3 普通烟草基序序列特征分析Fig. 3 Alignment analysis of motifs inN. tabacum

2.4 组织表达模式分析

利用转录组数据分析121个烟草ERF亚家族成员在9类候选组织表达模式,发现35个成员在9类组织中均未表达,其余 86个成员分别在不同时期不同组织中有表达(图 4),约占整个亚家族的71%,表明多数ERF转录因子参与生长发育的各阶段。烟草ERF亚家族在候选9类组织中的表达基因数目如下:萌发的种子(播种后3 d)中表达的基因有42个,离体1 d的叶片中33个,愈伤组织中39个,幼根中42个,幼叶中40个,成熟根中49个,成熟叶中38个,花中46个,茎中46个。各成员在不同组织的表达明显不同,具有组织特异性,表达量较高的基因主要存在于幼根、成熟根、离体叶及茎中。有15个基因在9类候选组织均有表达,分别为NtERF4、NtERF11、NtERF13、NtERF14、NtERF17、NtERF19、NtERF20、NtERF24、NtERF33、NtERF36、NtERF75、NtERF81、NtERF119、NtERF120及NtERF121,推断这些基因可能参与各组织的发育过程。各组成员在不同组织的表达有一定的规律性,GroupⅠ的16个基因中有12个在9类组织中未见表达,约占整组的75%,NtERF38、NtERF74和NtERF115在9类候选组织中表达量较低,NtERF66在离体叶、幼根和愈伤组织中表达较高;GroupⅡ中除了NtERF51在幼叶中和NtERF65在成熟叶中无表达,其余所有基因在9类组织中都有较高的表达,说明该组基因广泛参与烟草的生长发育进程;GroupⅥ中NtERF15、NtERF36和NtERF106在愈伤组织中表达较高。分析不同组织的基因表达情况可知,在幼根表达量高的基因大多在成熟根中表达也较高,在幼叶和成熟叶中也有相似规律,比较其相对表达量,在幼根和幼叶的表达量比在成熟根和成熟叶中稍高;离体1 d的叶片中NtERF14、NtERF24和NtERF81表达量较高,初步推断这3个基因可能参与非生物胁迫。

图4 ERF转录因子家族组织表达模式分析Fig. 4 Expression patterns of ERF family genes in different tissues

3 讨 论

ERF转录因子也称为 ERF反式作用因子,是一类可与其靶基因上游核苷酸序列(GCCbox)特异性结合的蛋白质,并调控该基因的表达[23]。转录因子在植物基中占的比例较大,拟南芥中约5.9%的基因编码转录因子。转录因子对植物的生长发育及整个生命过程具有重要调控意义,因此对转录因子家族的鉴定分析一直是研究的热点[24]。目前对于烟草ERF亚家族的研究,主要体现在对个别基因的功能上,比如,在烟草中过表达番茄JERF1可提高抗盐和耐低温性[25];烟草NtERF5(本文NtERF39)参与烟草花叶病毒的抗病性[4];NtCEF1(本文NtERF4)参与乙烯诱导调节植物生物及非生物胁迫[26]等。对于普通烟草中 ERF亚家族的鉴定和分析尚未有报道。

本研究鉴定出121个普通烟草基因组中的ERF转录因子成员,所有成员的蛋白序列均含有AP2保守结构域,该结构域有保守的WLG元件,并且第14和19位氨基酸为较保守的丙氨酸及天冬氨酸,此结构特征与拟南芥ERF亚家族的AP2结构相似[1]。通过提取数据库中烟草 ERF亚家族基因定位信息发现,121个ERF基因定位在21条染色体上,并且在各染色体上呈现不均匀分布,其中Chr4和Chr6上ERF基因最多。根据拟南芥65个与烟草121个ERF成员进化树结果,将烟草121个ERF家族成员分为6组,每组成员个数与拟南芥各组成员个数在数量上有一定对应关系,并且每组中至少有4个拟南芥成员,说明植物界ERF亚家族的进化过程可能早于拟南芥和烟草的进化。通过对烟草ERF亚家族所有成员蛋白序列全长进行理化性质分析,除个别成员(NtERF119和NtERF89)外,其余成员蛋白序列分子量及蛋白序列的氨基酸数目变化范围较小,等电点变化范围较大。对烟草ERF家族的121个成员的保守域分析结果表明,每个成员均含有AP2结构域,且不同分组的基序组成存在较大差异,同一分组的成员基序组成具有一致性,说明不同分组的成员可能具有不同的生物学功能。通过对烟草ERF亚家族成员在9类组织中的表达模式分析发现,ERF家族成员在幼根、成熟根、离体叶和茎中表达量较高,具有一定的组织特异性。在幼根、成熟根及茎中表达较高,说明ERF基因可能参与烟草根和茎的生长发育;在离体叶中表达较高,推测该家族基因可能参与胁迫调节。并且GroupⅡ的成员在 9类候选组织中的表达量均较高,说明该组成员可能参与烟草各阶段的生长发育,但具体生物学功能还需进一步验证。

4 结 论

研究表明,目前可鉴定出普通烟草基因组含有121个ERF转录因子亚家族成员,该亚家族成员的序列特征与拟南芥相似,均含有保守的AP2结构域。烟草的24条染色体上只有21条存在烟草ERF转录因子家族基因,说明ERF基因在各染色体上呈不均匀分布。利用数据库中转录组数据,发现不同烟草 ERF转录因子在不同组织不同时期中的表达情况不同,其中在根、茎和离体叶中表达量较高。

[1] SAKUMA Y, LIU Q, DUBOUZET J G, et al. DNA-binding specificity of the ERF/AP2 domain of Arabidopsis DREBs, transcription factors involved in dehydration- and cold-inducible gene expression[J].Plant Cell, 2002, 290:998-1009.

[2] ONATESANCHEZ L, SINGH K B. Identification of Arabidopsis ethylene-responsive element bingding factors with distinct induction kinetics after pathogen infection[J]. Plant Physiology, 2002, 128:1313-1322.

[3] LIU D, CHEN X, LIU J, et al. The rice ERF transcription factor OsERF922 negatively regulates resistance to Magnaporthe oryzae and salt tolerance[J]. Journal of Experimental Botany, 2012, 63:3899-3912.

[4] FISCHER U, DROGELASER W. Overexpression of NtERF5, a new member of the tobacco ethylene response transcription factor family enhances resistance to tobacco mosaic virus[J]. Molecular Plant-microbe Interactions, 2004, 17: 1162-1171.

[5] RAO G, SUI J, ZENG Y et al. Genome-wide analysis of the AP2/ERF gene family in Salix arbutifolia[J]. FEBS Open Bio, 2015, 24(5): 132-137.

[6] ZHANG G, CHEN M, LI L, et al. Overexpression of the soybean GmERF3 gene, an AP2/ERF type transcription factor for increased tolerances to salt, drought, and diseases in transgenic tobacco[J]. Journal of Experimental Botany, 2009, 13: 3781-3796.

[7] MENG X, LI F, LIU C, et al. Isolation and characterization of an ERF transcription factor gene from cotton (gossypium barbadenseL.)[J]. Plant Mol Biol Rep, 2009, 28(1): 176-183.

[8] CHARFEDDINE M, SAÏDI M, CHARFEDDINE S, et al. Genome-wide analysis and expression profiling of the ERF transcription factor family in potato (Solanum tuberosumL.)[J]. Mol Biotechnol, 2015, 57(4): 348-358.

[9] ZHU X, LIU Q, CAI Shibin, et al. The wheat ethylene response factor transcription factor pathogen-induced ERF1 mediates host Responses to both the necrotrophic pathogen rhizoctonia cerealis and freezing stresses[J]. Plant Physiology, 2014, 3: 1499-1514.

[10] 黄泽军,黄荣峰,黄大昉. ERF转录因子及其在植物防卫反应中的作用[J]. 植物病理学报,2004,34(3):193-198.

[11] 刘成,李晓旭,苏玉龙,等. 普通烟草SBP转录因子家族的全基因组鉴定及其进化和表达分析[J]. 中国烟草科学,2015,36(4):1-11.

[12] SHARMA M K, KUMAR R, SOLANKE A U, et al. Identification, phylogeny, and transcript profiling of ERF family genes during development and abiotic stress treatments in tomato[J]. Mol Genet and Genomics, 2010, 284(6): 455-475.

[13] NAKANO T, SUZUKI K, FUJIMURA T, et al. Genome-Wide Analysis of the ERF Gene Family in Arabidopsis and Rice[J]. Plant Physiology. 2006, 14: 411-432.

[14] KIM S, PARK M, YEOM S I, et al. Genome sequence of the hot pepper provides insights into the evolution of pungency in Capsicum species[J]. Nat Genet, 2014, 46 (3): 270-278.

[15] 刘卫群,王永亮,赵同金,等. 烟草DREB-like转录因子的克隆与鉴定[J]. 农业技术学报,2006,14(3):376-380.

[16] 耿芳,郭伟华,郭玉双,等. 烟草DREB转录因子新基因的克隆与功能分析[J]. 浙江大学学报,2011,37(1):22-30.

[17] PUNTA M, COGGILL P C, EBERHARDT R Y, et al. The Pfam protein families database[J]. Nucleic Acids Res, 2012, 40: 290-301.

[18] LETUNIC I, DOERKS T, BORK P. SMART 7: recent updates to the protein domain annotation resource[J]. Nucleic Acids Res, 2012, 40(D1): 302-305.

[19] ARTIMO P, JONNALAGEDDA M, ARNOLD K, et al. ExPASy: SIB bioinformaticsresource portal[J]. Nucl Acids Res, 2012, 40(W1): 597-603.

[20] HORTON P, PARK K J, OBAYASHI T, et al. WoLF PSORT: protein localization predictor[J]. Nucl Acids Res, 2007, 35(S2): 585-587.

[21] TAMURA K, STECHER G, PETERSON D, et al. MEGA6: Molecular Evolutionary Genetics Analysis Version 6.0[J]. Molecular Biology and Evolution, 2013, 30(12): 2725-2729.

[22] 谷彦冰,冀志蕊,迟福梅,等. 苹果WRKY基因家族生物信息学及表达分析[J]. 中国农业科学,2015(16):3221-3238.

[23] HAO D Y, OHME-TAKAGI M, SARAI A. Unique mode of GCC box recognition by the DNA-binding domain of ethylene responsive element–binding factor (ERF domain) in plants[J]. J Biol Chem, 1998, 273(41): 26857-26861.

[24] 邵欣欣,李涛,李植良,等. 茄子 AP2/ERF转录因子的鉴定及胁迫条件下的表达分析[J]. 植物生理学报,2015,51(11):1901-1918.

[25] ZHANG H, HUANG Z, XIE B, et al. The ethylene-, jasmonate-, abscisic acid- and NaCl-responsive tomato transcription factor JERF1 modulatesexpression of GCC box-containing genes and salt tolerance in tobacco[J]. Planta, 2004, 220(2): 262-270.

[26] LEE J H, KIM D M, LEE J H, et al. Functional characterization of NtCEF1, an AP2/EREBP-type transcriptional activator highly expressed in tobacco callus[J]. Planta, 2005, 222(2): 211-224.

Genome-wide Identification and Expression Pattern Analysis of the ERF Gene Subfamily in Nicotiana tabacum

REN Angyan1,2, KONG Yingzhen1*
(1. Tobacco Research Institute, Chinese Academy of Agricultural Sciences, Qingdao 266101, China; 2. Graduate School of Chinese Academy of Agricultural Sciences, Beijing 100081, China)

Ethylene-responsive element binding factors (ERF transcription factors) family is widely involved in plant development, stress resistance and hormone response. Using bioinformatics methods, we have identified 121 ERF transcription factors that are located on 24 chromosomes irregularly inNicotiana tabacum. This was followed by analyzing their chromosomal location, protein properties, phylogenetic relation, conserved domain structure, subcellular localization as well as tissue expression profile. Based on phylogenetic analysis these 121 members of the ERF family were classified into six groups, according to the classification ofArabidopsis thaliana. Genes from the same group have similar properties and the conserved domains show a high degree of conservation. The results of subcellular localization analysis indicate that most of the genes are located in the nucleus, while a small number of them are localized on the mitochondria and chloroplasts. Some genes of ERF transcript factors have high level expression in young roots, mature roots, leaves and stems. Also, genes from different groups have different expression profiles.

nicotiana tabacum; ERF transcript factors; bioinformatics; expression pattern; gene family

S572.03

1007-5119(2017)01-0015-08

10.13496/j.issn.1007-5119.2017.01.003

国家自然科学基金项目“拟南芥MUR3基因通过影响木葡聚糖结构参与细胞伸长的分子机制研究”(31470291)、“拟南芥MYB52转录因子调控果胶质去甲酯化过程的分子机制”(31670302);国家科技部支撑计划项目“高生物量能源植物和新型生物质资源培育与综合利用示范”(2015BAD15B03)

任昂彦(1989-),女,在读硕士,研究方向为分子育种。E-mail:ray0918@163.com。*通信作者,E-mail:kongyingzhen@163.com

2016-08-16

2016-11-08

猜你喜欢
拟南芥结构域烟草
细菌四类胞外感觉结构域的概述
拟南芥START 结构域亚家族生物信息学分析及功能
拟南芥栽培关键技术研究
UBR5突变与淋巴瘤B细胞成熟
CORESTA 2019年SSPT联席会议关注新烟草、吸烟行为研究和雪茄烟
烟草依赖的诊断标准
拟南芥
口水暴露了身份
烟草镜头与历史真实
百年烟草传奇的云南叙事