棉花YABBY基因家族的全基因组分析

2015-09-14 12:47徐珍珍倪万潮张香桂郭琪徐鹏沈新莲
生物技术通报 2015年11期
关键词:共线性亚组拟南芥

徐珍珍 倪万潮 张香桂 郭琪 徐鹏 沈新莲

YABBY基因家族属于锌指蛋白超家族(Zinc finger super-family)的亚家族,在调控植物叶和花器官发育过程中起着重要的作用,是一类植物特有的转录因子家族,与植物形态建成有关[1-4]。该基因家族有两个保守的结构域,位于N端的C2C2锌指结构域和位于C端的YABBY结构域,又称与HMG box相似的“螺旋-环-螺旋”结构域[5-7]。

目前,在很多植物中都有YABBY基因家族的相关报道,在模式生物拟南芥中研究的较为清楚。拟南芥YABBY基因家族有6个成员:FIL(FILAMENTOUS FLOWER)、CRC(CRABSCLAW)、INO(INNER NO OUTER)(YABBY4)、YAB2(YABBY2)、YAB3(YABBY3)和 YAB5(YABBY5)[8-12], 拟 南芥YABBY基因家族的6个成员在其侧生器官发育过程中发挥着不同的作用。FIL参与花器官和叶的发育[10,13];CRO 和 INO 基因有一定的组织特异性,CRC参与蜜腺和心皮远轴端的发育,INO基因则在外部珠被的发育中起着重要的作用[11,14-16];YAB2、YAB3和YAB5基因主要在拟南芥的营养组织中特异表达[3,17]。

棉花作为重要的经济作物,其纤维是纺织工业重要的天然纤维来源。随着基因组学和测序技术的发展,二倍体D组雷蒙德氏棉(Gossypium raimondii L.)、A组亚洲棉石系亚1号(G. arboreum)以及陆地棉遗传标准系TM-1(G. hirsutum L. acc. TM-1)相继完成了测序工作[18-22],从而为全基因组范围内分析基因家族奠定了一定的数据基础。当前关于棉花YABBY基因家族的研究,鲜有报道。本研究利用公布的陆地棉TM-1的基因组数据,对YABBY基因家族进行全基因组扫描,并进一步分析其亚细胞定位、染色体分布、基序、进化关系和组织表达情况等,旨在为进一步深入探索YABBY基因家族的功能提供理论依据。

1 材料与方法

1.1 材料

两份陆地棉标准系TM-1(G. hirsutum L.)蛋白和CDS数据:中国农业科学院棉花研究所(http://cgp.genomics.org.cn/page/species/index.jsp)和 Pytozome 网站(http://www.phytozome.net/);拟南芥 YABBY 基因家族的氨基酸蛋白序列和陆地棉EST数据来自NCBI(http://www.ncbi.nlm.nih.gov/protein/)数据库;衣藻(Chlamydomonas reinhardtii)YABBY基因家族的氨基酸序列来自PlantTFDB(http://planttfdb.cbi.pku.edu.cn/)数据库。

1.2 方法

1.2.1 棉花YABBY基因家族的鉴定与进化树分析 将下载的拟南芥6条YABBY基因家族成员在SMART网站进行结构域预测,然后在Pfam(http://pfam.janelia.org/)网站下载鉴定到的YABBY结构域的种子文件(PF04690.9),最终利用HMMER3.1b1程序在TM-1蛋白数据库中搜索棉花YABBY基因家族成员。

利用MEGA 5.1生物信息软件对鉴定的TM-1基因组中YABBY基因家族氨基酸序列和拟南芥中6条YABBY基因家族的氨基酸序列进行多重序列比对,采用邻接(Neighbor-Joining,NJ)算法构建进化树,进行1000次Boot strap抽样。

1.2.2 棉花YABBY基因家族的染色体定位和亚细胞定位 结合Perl语言编程,在TM-1基因组数据中的gff3文件中提取YABBY基因家族成员的染色体起始和结束位置,然后利用MapInspect软件绘制YABBY基因家族的染色体物理分布图;利用在线软件 CELLO:Subcellular Localization Predictive System预测棉花YABBY基因家族成员的亚细胞定位。

1.2.3 棉花YABBY基因家族的基序分析 利用MEME软件分析棉花YABBY基因家族成员的motif类型和排列顺序。参数设置如下:基序的最大发现数目是10个,其它参数为默认值。

1.2.4 棉花的YABBY基因家族的组织表达分析 在NCBI数据库下载330 520条陆地棉的EST序列。利用Blastn程序,搜索棉花YABBY基因家族成员CDS序列与陆地棉EST序列的匹配,分析棉花YABBY基因家族成员的组织表达类型,参数设定标准为E≤10-10,其他参数为默认值。

2 结果

2.1 棉花YABBY基因家族的鉴定

通过结构域预测,发现拟南芥的6条YABBY蛋白的氨基酸序列都含有YABBY结构域。因此,利用Pfam网站中下载的YABBY结构域的种子文件在陆地棉标准系TM-1蛋白数据库中搜索,又在SMART网站进行进一步确认和人工校对,最终在TM-1基因组中鉴定到23条YABBY蛋白。根据一般植物蛋白的命名方法,对鉴定到的23条棉花YABBY蛋白进行了命名,并统计了它们对应的蛋白ID号、所在的亚基因组以及对应的蛋白长度,从159个氨基酸到220个氨基酸不等(表1)。

2.2 棉花YABBY基因家族的系统进化树分析

我们以衣藻(Chlamydomonas reinhardtii)作为外类群,利用陆地棉标准系TM-1基因组中鉴定的23条YABBY蛋白和拟南芥的6条YABBY蛋白的氨基酸序列构建了系统进化树(图1)。与拟南芥类似,棉花的YABBY基因家族也分为4个亚组(Ⅰ-Ⅳ),且每个亚组都有与拟南芥同源的基因:GhYABBY15、GhYABBY5、GhYABBY17、GhYABBY6、GhYABBY8、GhYABBY19、GhYABBY4、GhYABBY16、GhYABBY1和GhYABBY23属于Ⅲ亚组,与拟南芥AtYABBY5属于一个亚组;GhYABBY10、GhYABBY18和GhYABBY7属于亚组Ⅳ,与拟南芥AtYABBY2属于一个亚组;GhYABBY22、GhYABBY12、GhYABBY9、GhYABBY20、GhYABBY11和 GhYABBY21属于亚组Ⅰ,与拟南芥FIL和AtYABBBY3属于一个亚组;GhYABBY3、GhYABBY14、GhYABBY13和 GhYABBY2属于亚组Ⅱ,与拟南芥CRC和AtYABBY4属于一个亚组。

表1 陆地棉TM-1全基因组YABBY基因家族的基本信息

图1 陆地棉TM-1和拟南芥YABBY基因家族的进化树

2.3 棉花YABBY基因家族的染色体定位和亚细胞定位

陆地棉标准系TM-1基因组中23个YABBY基因家族成员分布在16条染色体和1条Scaffold上,分 别 为 A01、D01、D02、A03、A04、A05、D05、A06、D06、A07、D07、A09、A11、D11、A12、D12和 Scaffold3715_D01(图 2);除了 A07和 D07染色体上分别有3个成员外,其他染色体上只有1-2个成员(图2);在TM-1的A亚组和D亚组具有成对的平行进化同源YABBY基因,分布在D01、A01、Scaffold3715_D01、A05、D05、A07、D07、A11、D11、A12和D12染色体上;共有9对共线性基因,分别为GhYABBY13和GhYABBY2、GhYABBY1和 GhYABBY23、GhYABBY5和 GhYABBY15、GhYABBY6和 GhYABBY17、GhYABBY7和GhYABBY18、GhYABBY8和 GhYABBY19、GhYABBY9和 GhYABBY20、GhYABBY11和 GhYABBY21、GhYABBY12和 GhYABBY22。

图2 陆地棉TM-1基因组上YABBY基因家族的染色体分布

TM-1基因组中23个YABBY基因家族成员的亚细胞定位预测结果(表1)表明,13个YABBY基因家族成员具有1个亚细胞定位,定位到细胞核或胞外;8个成员具有2个亚细胞定位,定位到细胞核和胞外;2个成员具有3个亚细胞定位,定位到细胞核、胞外和线粒体上。

2.4 棉花YABBY基因家族的基序(motif)分析

棉花的YABBY基因组家族分为4个亚组(Ⅰ-Ⅳ),23个YABBY基因家族成员的基序分析结果显示,每个亚组的成员具有相同或类似的基序类型和排列顺序,而且9对同线性基因具有相同的基序类型和排列顺序(图3)。GhYABBY15、GhYABBY5、GhYABBY17、GhYABBY6、GhYABBY8、GhYABBY19、GhYABBY4、GhYABBY16、GhYABBY1和GhYABBY23具有相似的motifs(7-8个),motif排列顺序也基本相同;GhYABBY18、GhYABBY10和GhYABBY7具有类似的motifs(4-6个),排序顺序 也 类 似 ;GhYABBY22、GhYABBY12、GhYABBY9、GhYABBY20、GhYABBY11和 GhYABBY21具有完全相同的6个motifs,而且排列顺序完全相同;GhYABBY3、GhYABBY14、GhYABBY13和 GhYABBY2具有相似的4-5个motifs,排序顺序类似。

图3 陆地棉TM-1基因组上YABBY基因家族的基序类型

2.5 棉花YABBY基因家族的组织表达分析

TM-1全基因组中的23个YABBY基因家族成员在棉花的根、茎、叶、花、蕾、幼胚珠、胚珠、纤维、茎端分生组织、分生区和胚性愈伤组织中广泛表达(表2)。进一步分析发现,所有的23个YABBY基因家族成员在2个及两个以上的组织中表达;23个YABBY基因家族成员全部在花、蕾和茎端分生组织中表达,大部分成员在根、茎和分生区域表达,还有部分基因在胚珠和胚性愈伤组织表达。

3 讨论

本研究通过生物信息学和基因组学手段在陆地棉标准系TM-1全基因组中共鉴定了23条YABBY基因家族成员,其中有9对为共线性基因(A亚组和D亚组),只有5个基因不是共线性基因,这与以往的报道一致,二倍体A组亚洲棉和D组雷蒙德氏棉基因组之间存在很强的共线性[22];9对共线性基因中,除了GhYABBY9和GhYABBY20、GhYABBY13和GhYABBY2以外,其余7对共线性基因的氨基酸长度完全相同;除了GhYABBY13和GhYABBY2这一对共线性基因外,其余的每对共线性基因具有完全相同的亚细胞定位;9对共线性基因在进化上非常保守,在进化树上分布在相同的分支上;motif分析表明,除GhYABBY13和GhYABBY2外,其余的每对共线性基因具有完全相同的motif类型和排列顺序。

拟南芥YABBY基因家族有6个成员FIL、CRC、AtYABBY4、AtYABBY2、AtYABBY3 和 AtYABBY5,其中每个成员的功能都已研究得较为清楚[8-12]。进化树分析表明,本研究在陆地棉标准系TM-1基因组中鉴定的23个YABBY基因家族成员与拟南芥一样,分为4个亚组,且每一个亚组都有与拟南芥同源的基因,由此推测,棉花和拟南芥YABBY基因家族成员在功能上可能具有一定的相似性。因此,研究棉花YABBY基因家族成员的功能,在一定程度上可以参考拟南芥的研究结果。

表2 陆地棉TM-1全基因组YABBY基因家族的组织表达模式

组织表达分析(表2)表明,TM-1全基因组中的23个YABBY基因家族成员具有较为广泛的组织表达类型。其中,23个YABBY基因家族成员全部在花、蕾和茎端分生组织中表达,这在一定程度上暗示棉花的YABBY基因家族成员可能参与了花、蕾和茎端分生组织的发育;亚组Ⅰ的6个成员和亚组Ⅲ的部分成员都在根、茎和分生区域表达,这在一定程度上暗示这些基因可能参与了根、茎和分生区域的发育。

4 结论

本研究从陆地棉标准系TM-1(Gossypium hirsutum L. acc. TM-1)基因组中鉴定到23个YABBY基因家族成员,具有不同的亚细胞定位和染色体定位,且具有较为广泛的组织表达类型。这些成员分为4个亚组,每个亚组成员间具有相似的基序类型和排列顺序。

[1]Bowman JL. The YABBY gene family and abaxial cell fate[J].Curr Opin Plant Biol, 2000, 3(1):17-22.

[2]Reinhardt D, Frenzm M, Mandel T, et al. Microsurgical and laser ablation analysis of leaf positioning and dorsoventral patterning in tomato[J]. Development, 2005, 132(1):15-26.

[3]Eckardtn A. YABBY genes and the development and origin of seed plant leaves[J]. Plant Cell, 2010, 22(7):2103.

[4]Yamada T, Yokota S, Hirayama Y, et al. Ancestral expression patterns and evolutionary diversification of YABBY genes in angiosperms[J]. Plant J, 2011, 67(1):26-36.

[5]Kanaya E, Nakajima N, Okada K. Non-sequence-specific DNA binding by the FILAMENTOUS FLOWER protein from Arabidopsis thaliana is reduced by EDTA[J]. J Biol Chem, 2002, 277(14):11957-11964.

[6]Sieber P, Petrascheck M, Barberis A, et al. Organ polarity in Arabidopsis NOZZLE physically interacts with members of the YABBY family[J]. Plant Physiol, 2004, 135(4):2172-2185.

[7]Golz JF, Roccaro M, Kuzoff R, et al. GRAMINIFOLIZ promotes growth and polarity of Antirrhinum leaves[J]. Development, 2004,131(15):3661-3670.

[8]Siegfried KR, Eshed Y, Baum SF, et al. Members of the YABBY gene family specify abaxial cell fate in Arabidopsis[J]. Development,1999, 126(18):4117-4128.

[9]Villanueva JM, Broadhvest J, Hayser BA, et al. INNER NO OUTER regulates abaxial-adaxial patterning in Arabidopsis ovules[J].Genes Dev, 1999, 13(23):3160-3169.

[10]Sawa S, Watanabe K, Goto K, et al. FILAMENTOUS FLOWER, a meristem and organ identity gene of Arabidopsis, encodes a protein with a zinc finger and HMG-related domains[J]. Genes Dev,1999, 13(9):1079-1088.

[11]Bowman JL, Smyth DR. CRABS CLAW, a gene that regulates carpel and nectary development in Arabidopsis, encodes a novel protein with zinc finger and helix-loop-helix domains[J]. Development,1999, 126(11):2387-2396.

[12]Lee JY, Baum SF, Oh SH, et al. Recruitment of CRABS CLAW to promote nectary development within the eudicot clade[J].Development, 2005, 132:5021-5032.

[13]Stahle MI, Kuehlich J, Staron L, et al. YABBYs and the transcriptional corepressors LEUNIG and LEUNIG_HOMOLOG maintain leaf polarity and meristem activity in Arabidopsis[J].Plant Cell, 2009, 21(10):3105-3118.

[14]Zhang XL, Yang ZP, Zhang J, et al. Ectopic expression of BraYAB1-702, a member of YABBY gene family in Chinese cabbage, causes leaf curling, inhibition of development of shoot apical meristem and flowering stage delaying in Arabidopsis thaliana[J]. J Mol Sci, 2013, 14(7):14872-14891.

[15]Shamimuzzaman M, Vodkin L. Genome-wide identification of binding sites for NAC and YABBY transcription factors and coregulated genes during soybean seedling development by ChIPSeq and RNASeq[J]. BMC Genomics, 2013, 14(1):477.

[16]Ha CM, Jun JH, Fletcher JC. Control of Arabidopsis leaf morphogenesis through regulation of the YABBY and KNOX families of transcription factors[J]. Genetics, 2010, 186(1):197-206.

[17]Sarojam R, Sappl PG, Goldshmidt A, et al. Differentiating Arabidopsis shoots from leaves by combined YABBY activities[J].Plant Cell, 2010, 22(7):2113-2130.

[18]Wang KB, Wang ZW, Li FG, et al. The draft genome of a diploid cotton Gossypium raimondii[J]. Nat Genet, 2012, 44:1098-1103.

[19]Parerson AH, Wendel JF, Gundlach H, et al. Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres[J]. Nature, 2012, 492:423-427.

[20]Li FG, Fan GY, Wang KB, et al. Genome sequence of the cultivated cotton Gossypium arboreum[J]. Nature Genetics, 2014, 46(6):562-574.

[21]Li FG, Fan GY, Lu CR, et al. Genome sequence of cultivatedUpland cotton(Gossypium hirsutum TM-1)provides insights into genome evolution[J]. Nature Biotechnology, 2015, doi:10.1038/nbt. 3208.

[22]Zhang TZ, Hu Y, Jiang WK, et al. Sequencing of allotetraploid cotton(Gossypium hirsutum L. acc. TM-1)provides a resource for fiber improvement[J]. Nature Biotechnology, 2015, doi:10.1038/nbt. 3207

猜你喜欢
共线性亚组拟南芥
拟南芥:活得粗糙,才让我有了上太空的资格
槭叶铁线莲亚组的研究进展
银行不良贷款额影响因素分析
艾灸神阙穴对不同程度力竭运动大鼠海马区单胺类神经递质的影响❋
冠心病患者肠道菌群变化的研究 (正文见第45 页)
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
不完全多重共线性定义存在的问题及其修正建议
尿黑酸对拟南芥酪氨酸降解缺陷突变体sscd1的影响
两种LED光源作为拟南芥生长光源的应用探究
主动脉标化的儿童室间隔缺损与肺动脉宽度的相关性研究