摘要:通过生物信息学的方法,利用拟南芥、水稻的MADS-box基因对草莓MADS-box基因家族进行鉴定和分析,共得到83个草莓MADS-box候选基因,且MADS-box结构域高度保守。进化分析表明,FvMADS1-FvMADS33可被细分为10个亚组,分别为AG、AGL12、AGL6、AGL2、SE、SVP、FLC、AP3、SOC1、AGL17;FvMADS34-FvMADS83可被细分为4个亚组,分别为Mα(22个成员)、Mβ(1个成员)、Mγ(17个成员)、Mδ(10个成员)。
关键词:草莓;MADS-box转录因子;基因家族;生物信息学
中图分类号: S668.403文献标志码: A文章编号:1002-1302(2015)11-0021-05
收稿日期:2014-12-22
基金项目:中国教育学会学校文化研究分会“十二五”教育科研课题(编号:0613278A)。
作者简介:马明臻(1979—),女,山东寿光人,硕士,副教授,主要从事园艺植物栽培研究。E-mail:1538543122@qq.com。草莓因其浆果营养丰富、鲜红亮丽、酸甜可口、芳香多汁而深受消费者喜爱,我国是世界草莓第一生产大国,但产量水平仍不足发达国家的1/2[1-2]。由于草莓存在高杂合性、多倍性等问题,使其常规育种周期长、工作量大、效率低。近年来,随着分子生物学的兴起和发展,草莓生物技术育种获得了极大进步。MADS-box基因广泛参与植物花和果实的发育、成熟等多个过程。开展草莓MADS-box转录因子的研究,有利于探索和解析草莓花、果实在发育成熟等生理过程中的调控机制,并能为生物技术育种提供有价值的信息。
MADS-box转录因子的N末端区域含有一段约为60个氨基酸残基的保守域,称为MADS-box保守域,负责绑定目的基因中调控区域的CArG盒子(CC(A/T)6GG)[3]。MADS-box基因家族成员可根据进化关系分为类型Ⅰ(Type Ⅰ)和类型Ⅱ(Type Ⅱ)[4]。类型Ⅱ MADS-box转录因子不仅含有MADS保守域,还含有Intervening(Ⅰ)区域、Keratin(K)盒、C-terminal(C)末端3个保守结构域[5],因此类型Ⅱ又被称为MIKC类型。相对于Type Ⅱ,Type Ⅰ结构较简单且缺乏K盒。类型Ⅰ可根据进化关系进一步分为4种类型:Ma、Mβ、Mγ、Mδ[7]。近年来,随着对MADS-box转录因子研究的不断深入,现已提出主要调控花发育过程的ABCDE模型。ABCDE模型认为,A、E类基因调控萼片的发育;A、B、E类基因共同调控花瓣的发育;B、C、E类基因共同调控雄蕊的发育;C、E类基因调控心皮的发育;D、E类基因调控胚珠的发育[5,8-9]。
本研究以森林草莓(Fragaria vesca)基因组功能数据库[10]为出发点,利用生物信息学方法,对草莓MADS-box基因家族成员的数目、进化关系、亚组分类进行分析,以期为揭示花和果实发育过程中的调控网络、加快生物技术育种等问题提供理论基础,并为MADS-box基因的进一步克隆提供参考。
1材料与方法
1.1材料
根据拟南芥中已鉴别的MADS-box基因家族蛋白质序列和Pfam数据库的MADS-box保守域(PF00319)序列,利用NCBI提供的BlastP程序(http://www.rosaceae.org/tools/ncbiblast)检索草莓基因组功能数据库(http://www.phytozome.net/cgi-bin/gbrowse/strawberry/),并下载目的蛋白质序列。为进一步确认候选MADS-box基因的保守结构域,将候选MADS-box基因逐一提交至NCBI的在线工具Conserved Domain Search(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)、Pfam数据库(http://pfam.sanger.ac.uk/search)进行MADS-box保守区域确认,对含有MADS-box保守域的候选基因进行下一步分析[11]。
1.2方法
利用DNAMAN 6.0序列分析软件、WebLogo 3在线软件(http://weblogo.threeplusone.com/)分析草莓MADS-box基因保守序列。利用MEGA 4.1进化树分析软件(http://www.megasoftware.net)并根据NJ方法[执行参数:Poission correction、pairwise deletion、bootstrap(1 000次重复)],引入拟南芥(AGL)和水稻(OsMADS)的MADS-box蛋白对草莓MADS-box基因进行亚组分类。拟南芥、水稻的MADS-box蛋白序列分别下载于拟南芥(http://www.arabidopsis.org/)、水稻基因组网站(http://rice.plantbiology.msu.edu/)[12-13]。
2结果与分析
2.1草莓MADS-box基因家族的鉴定
通过NCBI提供的BlastP程序搜索草莓基因组功能数据库,共得到83个MADS-box候选基因,其开放阅读框、编码氨基酸、分子量、等电点、染色体定位、NCBI预测基因、与拟南芥同源基因的相关信息见表1。
2.2草莓MADS-box基因家族保守结构域序列分析
利用DNAMAN 6.0序列分析软件、WebLogo 3在线软件对草莓MADS-box基因家族保守结构域进行分析,发现表1草莓MADS-box基因家族成员信息
FvMADS 基因家族高度保守。经WebLogo 3在线软件分析发现,在MADS-box保守结构域,氨基酸23(R)、30(K)位点是保守不变的(图1)。
2.3草莓MADS-box基因家族进化分析
利用MEGA 4.1进化树分析软件对83个FvMADS、62个OsMADS、70个AGL蛋白的MADS-box结构域序列进行进化分析。结果显示,215个MADS-box成员被分为Type Ⅰ、Type Ⅱ共2组,其中FvMADS1-FvMADS33属于Type Ⅱ,FvMADS34-FvMADS83属于Type Ⅰ。40个OsMADS、39个AGL属于Type Ⅱ,22个OsMADS、31个AGL属于Type Ⅰ。对33个FvMADS进一步分析表明,FvMADS1-FvMADS33可被细分为10个亚组(图2),分别是AG(FvMADS21、22、24)、AGL12(FvMADS28)、AGL6(FvMADS17)、AGL2(FvMADS4、6、26)、SEP(FvMADS23)、SVP(FvMADS1、2、3、5、12、20)、FLC(FvMADS7、8、11、25、30、31、33)、AP3(FvMADS9、10、15、27)、SOC1(FvMADS13、14、16、18、19)、AGL17(FvMADS29)。对50个FvMADS进一步分析表明,FvMADS34-FvMADS83可被细分为4个亚组(图3),分别是Mα(22个成员)、Mβ(1个成员)、Mγ(17个成员)、Mδ(10个成员)。
3结论与讨论
MADS-Box基因家族广泛存在于高等植物中,参与调控花的发育,果实的发育、成熟、开裂,根的生长发育、根瘤的形成,顶端分生组织的分化,以及营养代谢、光合作用等许多过程[12]。近年来,随着植物全基因组测序工作的不断完成,在基因组层面研究植物的相关基因家族得以实现。2011年,草莓全基因组测序工作已经完成[10],草莓NAC基因家族、SBP基因家族已通过生物信息学方法得以鉴定[14-15]。拟南芥[6]、水稻[7]、毛果杨[16]、葡萄[17]、黄瓜[18]、大豆[19]、梅花[20]、大白菜[21]、苹果[11]的MADS-box基因家族鉴定和进化分析也相继完成。不同物种MADS-box基因家族成员的数量存在较大差异,在拟南芥、毛果杨、葡萄、水稻、黄瓜、大豆、梅花、大白菜、苹果中分别鉴定得到107、105、32、71、43、163、80、160、143个MADS-box基因,各物种MADS-box基因家族成员的分类统计结果见表2。本研究通过生物信息学方法系统地鉴定并分析了83个草莓MADS-box候选基因,其中MIKCC、MIKC*类型分别为32、1个;Mα、Mβ、Mγ、Mδ分别为22、1、17、10个(表2)。尽管拟南芥、毛果杨、葡萄、水稻、黄瓜、大豆、梅花、大白菜、苹果MADS-box基因家族的鉴定已经完成,但关于其功能验证的研究仍较少。MIKCC类型MADS-box基因的大多数功能已被验证,下一步研究的重点应倾向于研究较少的类型Ⅰ MADS-box基因。
通过草莓基因组数据库可以更好、更快、更全面地了解草莓MADS-box转录因子的序列和结构,从而对其进行功能鉴
定和分析,以期验证草莓MADS-box基因家族在花、果实生长发育等过程中的调控作用。克隆和分离草莓MADS-box基因并进行转基因功能验证,探索其在营养生长、生殖生长中的调控作用,将成为进一步研究的重点。
参考文献:
[1]赵密珍,王静,王壮伟,等. 世界草莓产业发展现状及江浙沪草莓产业可持续发展对策[J]. 江苏农业科学,2012,40(2):1-3.
[2]张雯丽. 中国草莓产业发展现状与前景思考[J]. 农业展望,2012,8(2):30-33.
[3]Messenguy F,Dubois E. Role of MADS box proteins and their cofactors in combinatorial control of gene expression and cell development[J]. Gene,2003,316:1-21.
[4]Henschel K,Kofuji R,Hasebe M,et al. Two ancient classes of MIKC-type MADS-box genes are present in the moss Physcomitrella patens[J]. Molecular Biology and Evolution,2002,19(6):801-814.
[5]Kaufmann K,Melzer R,Theissen G. MIKC-type MADS-domain proteins:structural modularity,protein interactions and network evolution in land plants[J]. Gene,2005,347(2):183-198.
[6]Parenicová L,De F S,Kieffer M,et al. Molecular and phylogenetic analyses of the complete MADS-box transcription factor family in Arabidopsis:new openings to the MADS world[J]. The Plant Cell,2003,15(7):1538-1551.
[7]Arora R,Agarwal P,Ray S,et al. MADS-box gene family in rice:genome-wide identification,organization and expression profiling during reproductive development and stress[J]. BMC Genomics,2007,8:242.
[8]Weigel D,Meyerowitz E M. The ABCs of floral homeotic genes[J]. Cell,1994,78(2):203-209.
[9]Ma H,Depamphilis C. The ABCs of floral evolution[J]. Cell,2000,101(1):5-8.
[10]Shulaev V,Sargent D J,Crowhurst R N,et al. The genome of woodland strawberry(Fragaria vesca)[J]. Nature Genetics,2011,43(2):109-116.
[11]Tian Y,Dong Q,Ji Z,et al. Genome-wide identification and analysis of the MADS-box gene family in apple[J]. Gene,2015,555(2):277-290.
[12]董庆龙,冀志蕊,迟福梅,等. 苹果MADS-box转录因子的生物信息学及其在不同组织中的表达[J]. 中国农业科学,2014,47(6):1151-1161.
[13]董庆龙,王海荣,安淼,等. 苹果NADP依赖的苹果酸酶基因克隆、序列和表达分析[J]. 中国农业科学,2013,46(9):1857-1866.
[14]张春华,上官凌飞,俞明亮,等. 桃NAC基因家族生物信息学分析[J]. 江苏农业学报,2012,30(2):406-414.
[15]葛安静,张春华,董清华,等. 草莓SBP基因家族生物信息学初步分析[J]. 中国农学通报,2012,28(13):215-220.
[16]Leseberg C H,Li A,Kang H,et al. Genome-wide analysis of the MADS-box gene family in Populus trichocarpa[J]. Gene,2006,378:84-94.
[17]Díaz R J,Lijavetzky D,Martínez Z J M,et al. Genome-wide analysis of MIKCC-type MADS box genes in grapevine[J]. Plant Physiology,2009,149(1):354-369.
[18]Hu L,Liu S. Genome-wide analysis of the MADS-box gene family in cucumber[J]. Genome,2012,55(3):245-256.
[19]Fan C M,Wang X,Wang Y W,et al. Genome-wide expression analysis of soybean MADS genes showing potential function in the seed development[J]. PLoS One,2013,8(4):e62288.
[20]Xu Z,Zhang Q,Sun L,et al. Genome-wide identification,characterisation and expression analysis of the MADS-box gene family in Prunus mume[J]. Molecular Genetics and Genomics,2014,289(5):903-920.
[21]Duan W K,Song X M,Liu T K,et al. Genome-wide analysis of the MADS-box gene family in Brassica rapa(Chinese cabbage)[J].Molecular Genetics and Genomics,2014,290(1):239-255.郭琳,钟金城,柴志欣,等. 西藏牦牛NGB基因克隆及生物信息学分析[J]. 江苏农业科学,2015,43(11):26-30.