4种大戟科植物Lhca基因家族的全基因组鉴定、分类与进化分析

2014-12-29 01:06杨礼富林位夫
中南林业科技大学学报 2014年10期
关键词:蓖麻麻风橡胶树

邹 智,杨礼富,安 锋,林位夫

(中国热带农业科学院橡胶研究所/农业部儋州热带作物科学观测实验站,海南 儋州 571737)

4种大戟科植物Lhca基因家族的全基因组鉴定、分类与进化分析

邹 智,杨礼富,安 锋,林位夫

(中国热带农业科学院橡胶研究所/农业部儋州热带作物科学观测实验站,海南 儋州 571737)

LHCI是植物光系统I(PSI)中与色素分子结合的一系列膜蛋白,由Lhca基因家族编码,主要参与光能的捕获与传递。虽然Lhca基因家族已在拟南芥、水稻、杨树等模式植物中得到了系统鉴定,但在以高光效和高生物量著称的大戟科植物中,至今还未见Lhca类基因的报道。研究基于蓖麻、麻风树、木薯和橡胶树等4种大戟科植物已公布的基因组和EST数据对Lhca基因家族进行全面鉴定,并分析了其基因结构、生化特性及进化关系。结果表明,蓖麻、麻风树、木薯和橡胶树分别含有6、6、9和9个Lhca基因,分属于Lhca1、Lhca2、

Lhca3、Lhca4、Lhca5和Lhca6等6个亚家族,每个亚家族含有1~2个成员不等,基因的内含子数目在2~5个之间,部分基因还存在可变剪接形式。进化分析显示,Lhca1和Lhca3亚族具有较早的起源,Lhca2和Lhca6存在于陆生生物中,Lhca4和Lhca5则只存在于高等植物中;在木薯和橡胶树中,Lhca1、Lhca2和Lhca4亚族都出现了基因的扩增。

大戟科植物;全基因组;Lhca基因家族;鉴定;进化分析

LHCI(light-harvesting chlorophyll a/b-binding proteins of photosystem I)是植物光系统I(PSI)中与色素分子结合的一系列膜蛋白,由Lhca基因家族编码,含有3个跨膜螺旋,每个跨膜螺旋包含1个保守的叶绿素结合(chlorophyllbinding, CB)结构域[1]。虽然Lhca基因家族已在拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa)和杨树(Populus trichocarpa)等模式植物中得到了系统的鉴定[2-4],主要包含Lhca1、Lhca2、Lhca3、Lhca4、Lhca5和Lhca6等 6个亚家族,但在以高光效和高生物量著称的大戟科(Euphorbiaceae)植物中,至今还未见Lhca类基因的报道。最近,蓖麻(Ricinus communisL.)、麻 风 树(Jatropha curcasL.)、 木 薯(Manihot esculentaCrantz)、 橡 胶 树(Hevea brasiliensisMuell. Arg.)等4种大戟科植物全基因组序列的释放[5-8]为基因组范围内鉴定和分析这一基因家族创造了条件。研究在全面鉴定这4种大戟科植物Lhc基因基础上,深入分析了基因的结构、编码蛋白的生化特性及进化关系,以期为下一步的功能研究与利用提供参考。

1 材料与方法

1.1 材料

莱茵衣藻(Chlamydomonas reinhardtii)、小立碗藓(Physcomitrella patens)、拟南芥、水稻、蓖麻、木薯的全基因组序列下载于phytozome v9.0(http://www.phytozome.net/);麻风树和橡胶树的全基因组序列,蓖麻、麻风树、木薯和橡胶树的cDNA与EST序列下载于NCBI(http://www.ncbi.nlm.nih.gov/)。

1.2 方法

1.2.1 蓖麻、麻风树、木薯和橡胶树Lhca基因的鉴别与分类

根据先前的研究结果,首先从莱茵衣藻、小立碗藓、水稻和拟南芥的基因组中调取了已报道的Lhca基因[2-4,9-10],然后从每个亚家族中选取1个成员作为查询序列,采用tBLASTn[11]程序(E值设为10-5)分别搜索莱茵衣藻、小立碗藓、水稻和拟南芥的基因组,蓖麻、麻风树、木薯和橡胶树的基因组、cDNA及EST序列,候选基因翻译成蛋白后再确认其是否存在跨膜螺旋和CB结构域。

1.2.2 蓖麻、麻风树、木薯和橡胶树LHCI的生化特性、进化分析及系统命名

采用在线软件ProtParam(http://web.expasy.org/protparam/)预测蛋白的理论分子量(molecular weight, Mw)、等电点(theoretical pI)、GRAVY(grand average of hydropathy);采用在线软件ChloroP软件(http://www.cbs.dtu.dk/services/ChloroP/) 预 测蛋白的信号肽。用ClustalW2[12]进行多序列比对后,采用MEGA 4.0[13]采用Neighbor-Joing法构建系统发生树,bootstrap值设为1000;最后遵循拟南芥中的命名规则及进化关系对基因进行系统命名。

2 结果与分析

2.1 蓖麻、麻风树、木薯和橡胶树Lhca基因的鉴别

综合同源搜索及已报道的研究结果,分别从莱茵衣藻、小立碗藓、水稻和拟南芥的基因组中鉴定出9、12、6和7个Lhca基因(表1)。

综合同源搜索和CB结构域分析,研究分别从蓖麻、麻风树、木薯和橡胶树的基因组和EST序列中鉴定出6、6、9和9个Lhca基因,分属于Lhca1、Lhca2、Lhca3、Lhca4、Lhca5 和Lhca6 等6个亚家族(表2)。

表 1 莱茵衣藻、小立碗藓、水稻和拟南芥基因组中鉴定的Lhca基因Table 1 List of Lhca gene family identified from Creinhardtii, moss, Arabidopsis and rice

从基因结构来看,这些基因包含2~5个内含子不等,同一亚族的基因具有相同的内含子数目,如Lhca1亚族基因都含有3个内含子,Lhca2和Lhca6亚族基因都含有4个内含子,Lhca3和Lhca4亚族基因都含有2个内含子,Lhca5亚族基因都含有5个内含子。基因编码区长度在917-1 972 bp之间,cDNA编码区长度在732~945 bp之间(表2)。

从基因分布来看,在4个物种中,这些基因都散布于不同的scaffold上,即便是木薯和橡胶树中同一亚族的两个成员也是如此(表2)。

从EST分布来看,蓖麻和木薯所有的Lhca基因在NCBI中都有存在的EST,麻风树中有3个(即50%)存在EST,而橡胶树中所有基因都缺乏对应的EST。此外,目前的EST数据显示,蓖麻、麻风树和木薯分别有1、1和4个基因存在可变剪接(表2)。

表2 蓖麻、麻风树、木薯和橡胶树基因组中鉴定的Lhca基因Table 2 List of Lhca genes identified from Castor bean, Physic nut, Cassava and rubber tree

2.2 蓖麻、麻风树、木薯和橡胶树LHCI的生化特性、进化分析及系统命名

蓖麻LHCI蛋白最长的包含297个氨基酸残基,最短的有244个残基,其Mw值在26.43到33.00 kDa之间;pI值在5.96到8.45之间;GRAVY值在-0.134到0.071之间,其中,亲水性蛋白(即GRAVY<0)的约占83.33%;AI值在81.17到89.18之间;II值在33.89到47.22之间,不稳定蛋白(即II>40)约占50.00%(表3)。

麻风树LHCI蛋白最长的包含271个氨基酸残基,最短的有245个残基,其Mw值在26.67到29.34 kDa之间;pI值在5.41到9.32之间;GRAVY值在-0.146到0.049之间,其中,亲水性蛋白约占50.00%;AI值在82.65到92.05之间;II值在34.81到47.44之间,不稳定蛋白约占66.67%(表3)。

木薯LHCI蛋白最长的包含314个氨基酸残基,最短的有243个残基,其Mw值在26.40到34.88 kDa之间;pI值在5.14到9.41之间;GRAVY值在-0.230到0.049之间,其中,亲水性蛋白的约占66.67%;AI值在82.35到94.31之间;II值在28.84到50.41之间,不稳定蛋白约占44.44%(表3)。

橡胶树LHCI蛋白最长的包含274个氨基酸残基,最短的有243个残基,其Mw值在26.44到29.69 kDa之间;pI值在5.48到8.90之间;GRAVY值在-0.123到0.071之间,其中,亲水性蛋白的约占66.67%;AI值在81.67到89.18之间;II值在26.93到53.30之间,不稳定蛋白约占55.56%(表3)。

为揭示大戟科植物Lhca基因的起源与进化,研究将莱茵衣藻、小立碗藓、水稻、拟南芥与蓖麻、麻风树、木薯和橡胶树的LHCI蛋白共同构建进化树,结果表明,这些蛋白聚成4大类,即Lhca2与Lhca6亚族聚成1类,Lhca4与Lhca5亚族聚成1类,Lhca1和Lhca3亚族分别单独聚成1类(图1)。

图1 LHCI蛋白的进化分析Fig. 1 Phylogenetic tree of Lhcas from Castor bean, Physic nut, Cassava and rubber tree with homologous proteins from other species such as Creinhardtii, moss, Arabidopsis and rice

Lhca1和Lhca3亚族具有较近的亲缘关系。由于全部莱茵衣藻和大部分小立碗藓的LHCI蛋白都聚在这2类,这表明它们应为Lhca家族的最早起源。由于水稻、拟南芥、蓖麻和麻风树的Lhca1和Lhca3亚族都只有一个成员,且其与莱茵衣藻和小立碗藓的同亚族成员具有较远的亲缘关系,这表明Lhca1和Lhca3亚族在分化后,早期是以单拷贝的形式在不同物种中进化:在莱茵衣藻中,Lhca3亚族只有1个成员,基因没有出现扩增,但在Lhca1亚族中,基因成员数增加到8个(约占总基因数的88.89%),出现了明显的扩增,并呈现出新的分支(图1);在小立碗藓中,Lhca1和Lhca3亚族都出现了基因扩增,其中,Lhca3亚族的扩增速度相对较快;在木薯和橡胶树中,Lhca3亚族没有出现基因扩增,而Lhca1亚族则增加了1倍。

Lhca2与Lhca6亚族具有较近的亲缘关系,小立碗藓中有4个成员属于该大类,它们与Lhca2与Lhca6亚族形成2个独立的分支(图1)。由于水稻、蓖麻和麻风树的Lhca2和Lhca6亚族都只有一个成员,这表明该类最先应该是以单拷贝的形式在不同物种中进化:在小立碗藓中,基因扩增和进化速度都很快;在水稻、蓖麻和麻风树中,Lhca2亚族基因没有出现扩增,而在拟南芥、木薯和橡胶树中,基因在物种的分化后出现了基因的加倍;与Lhca2亚族相比,Lhca6亚族相对保守,基因在水稻、拟南芥、蓖麻、麻风树、木薯和橡胶树中都没有出现扩增(图1)。

Lhca4与Lhca5亚族只存在于高等植物中,属于进化后期产生的大类。相对而言,Lhca5亚族较为保守,基因在水稻、拟南芥、蓖麻、麻风树、木薯和橡胶树中都为单拷贝;而Lhca4亚族则在木薯和橡胶树中都出现了基因的加倍(图1)。

最后,遵循拟南芥中的命名规则,将蓖麻、麻风树、木薯和橡胶树的Lhca基因按着进化关系依次命名为如表2和图1所示。

3 讨 论

大戟科是一个包含300余属8 000多种植物的大科,其中不乏蓖麻、麻风树、木薯和橡胶树等重要经济作物。研究基于已公布的基因组和EST数据,首次对蓖麻、麻风树、木薯和橡胶树等4种大戟科植物的Lhca基因家族进行全面鉴定:

蓖麻、麻风树、木薯和橡胶树的基因组中分别含有6、6、9和9个Lhca基因,分属于Lhca1、Lhca2、Lhca3、Lhca4、Lhca5 和Lhca6 等6个亚家族,其中蓖麻和麻风树的基因数目和组成都与水稻和拟南芥相近,而在木薯和橡胶树中,Lhca1、Lhca2和Lhca4亚族都出现了基因的加倍,考虑到这些基因都散布于不同的scaffold上,且蓖麻、麻风树、木薯和橡胶树都属于大戟科,而木薯(2n= 36)和橡胶树(2n= 36)的染色体数目差不多是蓖麻(2n= 20)和麻风树(2n= 22)的2倍,推测Lhca1、Lhca2和Lhca4亚族基因的加倍可能是染色体水平的加倍造成的,相反,加倍的Lhca3、Lhca5和Lhca6亚族则在进化中丢失了另一个拷贝(甚至极可能是随着整条染色体的丢失而丢失),不过这种推测还有待进一步的证实,因为这4个物种至今还只存在基因组草图,相关基因都未能精确地定位到染色体上[5-8]。

为探讨Lhca基因家族的起源与进化,研究用生物进化史上的重要物种——莱茵衣藻(可进行光合作用的单细胞生物)、小立碗藓(早期的陆地生物)、水稻(单子叶模式植物)、拟南芥(双子叶模式植物)与蓖麻、麻风树、木薯和橡胶树的LHCI蛋白共同构建了进化树,结果表明,Lhca的6个亚家族具有不同的起源和进化速度。Lhca1和Lhca3亚族早在单细胞的藻类中就已存在,早先以单拷贝的形式在不同物种中进化。Lhca3亚族在莱茵衣藻和高等植物中的进化较为保守,而在小立碗藓中则出现了明显的扩增。相对而言,Lhca1亚族整体的进化速度都比较快,其在莱茵衣藻、小立碗藓、杨树、木薯和橡胶树中都有扩增[3,9,10],其中尤以莱茵衣藻为甚(基因数目增加了8倍),并且快速的进化使其呈现出明显的分支(图1)。

Lhca2与Lhca6亚族在光合生物向陆地进化过程中产生,并在小立碗藓中快速扩增。在高等植物中,早期的祖先先产生Lhca2亚族,并在此基础上进化形成Lhcv6亚族(图1)。相对而言,Lhca6亚族较为保守,而Lhca2亚族则保持着原来较快的进化速度,在拟南芥、杨树、木薯和橡胶树中都出现了基因加倍[3](图1)。

随着Lhca基因家族的进一步分化,最终在高等植物中进化产生了Lhca4与Lhca5亚族,其中,Lhca5亚族相对保守,而Lhca4亚族则以较快的速度进化着,并在杨树、木薯和橡胶树中出现了基因加倍的现象[3](图1)。

总之,蓖麻、麻风树、木薯和橡胶树的鉴定不仅丰富了Lhca基因家族的成员数,同时也为下一步阐明这4种植物乃至大戟科植物高光效的分子机理奠定了良好的基础。

[1] Nelson N, Ben Shem A. The structure of photosystem I and evolution of photosynthesis[J]. Bioessays, 2005, 27: 914-922.

[2] Jansson S. A guide to the Lhc genes and their relatives inArabidopsis. Trends Plant Sci, 1999, 4(6): 236-240.

[3] Klimmek F, Sjödin A, Noutsos C,et al.Abundantly and rarely expressed Lhc protein genes exhibit distinct regulation patterns in plants[J]. Plant Physiol, 2006, 140(3): 793-804.

[4] Umate P. Genome-wide analysis of the family of light-harvesting chlorophyll a/b-binding proteins inArabidopsisand rice[J]. Plant Signal Behav, 2010, 5(12): 1537-1542.

[5] Chan AP, Crabtree J, Zhao Q,et al. Draft genome sequence of the oilseed speciesRicinus communis[J]. Nat Biotechnol, 2010,28(9): 951-956.

[6] Sato S, Hirakawa H, Isobe S,et al. Sequence analysis of the genome of an oil-bearing tree,Jatropha curcasL[J]. DNA Res,2011, 18(1): 65-76.

[7] Prochnik S, Marri P R, Desany B,et al.The Cassava Genome:Current Progress, Future Directions[J]. Trop Plant Biol, 2012,5(1): 88-94.

[8] Rahman A Y, Usharraj A O, Misra B B,et al. Draft genome sequence of the rubber treeHevea brasiliensis[J]. BMC Genomics, 2013, 14: 75.

[9] Tokutsu R, Teramoto H, Takahashi Y, Ono TA, Minagawa J. The light-harvesting complex of photosystem I inChlamydomonas reinhardtii: protein composition, gene structures and phylogenic implications. Plant Cell Physiol, 2004, 45(2): 138-145.

[10] Alboresi A, Caffarri S, Nogue F,et al.In silico and biochemical analysis ofPhyscomitrella patensphotosynthetic antenna:identif i cation of subunits which evolved upon land adaptation[J].PLoS One, 2008, 3(4): e2033.

[11] Altschul S F, Madden T L, Schäffer A A,et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs[J]. Nucleic Acids Res, 1997, 25(17): 3389-3402.

[12] Thompson J D, Higgins D G, Gibson T J. CLUSTAL W:improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice[J]. Nucleic Acids Res, 1994,22(22): 4673-4680.

[13] Tamura K, Dudley J, Nei M,et al.MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0[J].Mol Biol Evol, 2007, 24(8): 1596-1599.

[14] 邹 智, 安 锋, 杨礼富, 等. 大戟科Lhcb基因家族的全基因组鉴定、分类与进化分析[J]. 中南林业科技大学学报, 2013,33(12): 46-52.

Genome-wide identif i cation, classif i cation and phylogenetic analysis of Lhca gene family in four Euphorbiaceae plants

ZOU Zhi, YANG Li-fu, AN Feng, LIN Wei-Fu
(Danzhou Investigation & Experiment Station of Tropical Crops, Ministry of Agriculture/Rubber Research Institute (RRI), Chinese Academy of Tropical Agricultural Sciences (CATAS), Danzhou 571737, Hainan, China)

TheLhcagene family in green plants encodes several light-harvesting chlorophyll a/b-binding (LHC) proteins that collect and transfer light energy to the reaction centers of photosystem I (PSI). Although this gene family is well documented in model plants such arabidopsis, rice and poplar, little information is available in Euphorbiaceae plants which are characterized with high photosynthesis and high biomass. In this study, a genome-wide search was carried out to identifyLhcagenes in four genome sequenced Euphorbiaceae plants. As a result, a number of 6, 6, 9 and 9Lhcagenes representing 6 subgene families denotedLhca1,Lhca2,Lhca3,Lhca4,Lhca5 andLhca6 were identif i ed from castor bean, physic nut, cassava and rubber tree, respectively. These genes contain 2~5 introns, and some of them were found to have alternative splicing isoforms. The phylogenetic analysis suggests an early origin of sub-gene familyLhca1 andLhca3 up to unicellular algae, and the subfamilyLhca2 andLhca6 appeared in land organisms, while the subfamilyLhca4 andLhca5 presented only in high plants. In cassava and rubber tree plants, the gene amplif i cation was found in the subfamilyLhca1,Lhca2 andLhca4.

Euphorbiaceae plant; genome-wide;Lhcagene family; identif i cation; phylogenetic analysis

S759.95

A

1673-923X(2014)10-0056-05

2013-09-03

国家自然科学资金(31371556);海南省重点科技项目(90107);海南省自然科学基金(312026);中国热带农业科学院橡胶研究所基本科研业务费专项(1630022011014)

邹 智(1982-),男,助理研究员,研究方向:植物分子生物学;E-mail: zouzhi2008@126.com

[本文编校:吴 彬]

猜你喜欢
蓖麻麻风橡胶树
橡胶树寒害减灾技术研究
中国热科院突破橡胶树死皮康复技术难关
中国热科院突破橡胶树死皮康复技术难关
关注麻风,消除歧视, 共同走向文明进步
母校那棵蓖麻树
星空 (外一首)
37例麻风患者的家庭集聚性调查分析
橡胶树开割季在5月已经开始
巧嘴绕口令
蓖麻防害虫效果佳