裴 培
(北京林业大学生物科学与技术学院,北京 100083)
LEA蛋白的同源性及其应用潜力
裴 培
(北京林业大学生物科学与技术学院,北京 100083)
LEA蛋白(晚期胚胎丰富的蛋白质)是一种植物在干旱条件诱导下产生的蛋白[1]。本文使用软件绘制出它的结构图,并对可以产生LEA蛋白的多种不同植物的基因序列进行了比对,从而找到猜想的保守序列。通过分析一未知的序列和在拟南芥中可以产生LEA蛋白的基因序列的同源性,从而得出关于二者序列和功能之间的关系的结论。同时,根据多种近似物种LEA蛋白的保守性和同源性,分析得到其系统进化树。植物LEA蛋白的研究有助于对植物抗旱性的认识,并为调整种植布局提供参考。
保守序列; LEA蛋白; 系统发生树
近年来,由于全球变暖,干旱性自然灾害频繁发生,对植物生长造成了巨大的影响。在植物抗旱性方面进行研究与应用,可调整植物适应性布局,增加土地收入。高等植物在复杂多变的环境生长过程中,阵发性和短暂性干旱经常发生,细胞水分亏缺引起的生理干旱,影响着植物的正常生长发育[2]。提高植物对水分亏缺的耐性是一项复杂工程。一般认为,伴随种子成熟过程而形成的LEA (Late-embryogenic-abundant protein)蛋白(主要为脱水素)的生理功能与种子耐脱水性形成有关,缺乏这类蛋白使种子对脱水敏感。具有高度保守的氨基酸序列是LEA蛋白的一大特征[3]。植物赖以生存的环境并不总是适宜的,干旱缺水、炎热、霜冻、盐碱、矿质元素过多过少等都会制约植物生长、降低产量。为了适应各种胁迫,植物在长期的进化过程中发展了各种不同的生理生化机制,以抵抗、适应各种环境胁迫低分子量渗透物质的积累,如糖醇、甘氨酰甜菜碱等,被认为是增强植物对渗透胁迫适应和耐受的主要机制[4-5]。近年来的研究表明.环境胁迫除了引起代谢变化和低分子保护性化合物的积累外,植物的许多其它基因可被激活,并导致植物营养组织中新蛋白的积累[6]。近年来,植物干旱诱导蛋白的研究已受到普遍关注,其中LEA蛋白是胚胎发生后期种子中大量积累的一系列蛋白质,它广泛存在于高等植物中,且受发育阶段、脱落酸(ABA)和脱水信号的调节,因此成为当前在逆境研究方面的一个热点。
1981年,Dure等在胚胎发育后期的棉花子叶中分离到一组丰富的mRNA,命名为Lea mRNA,即为LEA蛋白[7-8]。胚胎发育晚期丰富蛋白(LEA)是种子发育后期产生的一类小分子,它是伴随着种子成熟过程而产生的。 LEA蛋白有较高亲水性,不仅有序列特异性,空间结构也有特点。在水分缺乏时,此种蛋白在细胞中有增强束缚水的作用[9-10]。Baker等研究证明:缺水条件下,D13和D11 LEA蛋白能“溶解”在细胞质的结构中,它们的结构中未卷曲部分,能形成适应其它结构的形状;在一般生理条件下,70% 以上肽链处于无规则卷曲状态,植物缺水时,这些特殊结构有束缚水分子的作用。
LEA蛋白的抗旱性也可能与它的蛋白质序列和基因序列相关。D29 LEA蛋白含有11个氨基酸[11],即T / A, A / T, Q / E,A / T, A / T, K / R, Q / ED, K / R, A / T, X, ED / Q,这些氨基酸序列能形成盐桥[12-13],可以丰富蛋白质结构,提高细胞液的离子强度,从而抵御或减轻干旱造成的危害[14-15]。
2.1材料
NCBI网站,PDB,晶体结构,DNAMAN,BIOEDIT,GeneDoc,RasMol2.71,EndNote X(10.0),LEA蛋白在PDB网站上的图片,LEA蛋白序列。
2.2方法
(1) 在NCBI网站上搜索多条不同植物上的可编码LEA蛋白的基因序列并下载LEA蛋白的图片。
(2) 使用DNAMAN软件比较所下载编号为1至8号的序列(即花生、芥菜、温州蜜柑、油棕、苜蓿蒺藜、水稻、松、小麦)相似性。
(3)选择最相似序列,再次用DNAMAN比较相似性。
(4)推测保守序列并且在网站上用BLAST软件搜索,比对相关结果。
(5)搜索具有更高分值或低e值的序列并下载该序列。
(6)将该未知序列与拟南芥中可编码LEA蛋白的
序列进行各方面比对。
3.1LEA蛋白的空间结构图及相关分析
LEA蛋白共同的结构特征是由氨基酸组成,形成高度亲水性的多肽。大多数LEA蛋白缺乏半胱氨酸和酪氨酸残基,但富含赖氨酸和甘氨酸。
图1 从NCBI网站上获得的LEA蛋白空间结构图[16]
由图1可见:该蛋白质包含A(红)、B(黄)、C(灰)3种肽链,它们之间的角度为90 °。该蛋白质由6个α-螺旋和6个β转角构成。且A、B、C 3种肽链长度均为141个氨基酸,分子量均为15553.23道尔顿。
3.2与LEA蛋白有关的同源性分析
3.2.1 花生、芥菜、温州蜜柑、油棕、苜蓿蒺藜、水稻、松、小麦8种植物与拟芥南的基因序列比较 用DNAMAN比较1号到8号不同种类的均能编码LEA蛋白的植物的基因序列,见表1。即对花生、芥菜、温州蜜柑、油棕、苜蓿蒺藜、水稻、松和小麦的mRNA序列进行比对,得到其同一性是60.3%。由上述植物绘制的系统进化树看出,芥菜和苜蓿蒺藜差距很小,而芥菜、苜蓿蒺藜、油棕和拟南芥中编码LEA蛋白的序
表1 下载的所有序列编号植物名称拉丁名基因名称1花生Arachishypogaea蛋白3基因,完整序列2芥菜Brassicajuncea胚胎发育晚期丰富蛋白(LEA1a)mRNA的完整序列3温州蜜柑Citrusunshiu5组胚胎发育晚期丰富蛋白(LEA5)mRNA的完整序列4油棕ElaeisguineensisEMZ08基因,完整序列5苜蓿蒺藜MedicagotruncatulaEm6基因,完整序列6水稻(粳稻品种组)Oryzasativa(japonicacultivar⁃group)LEA蛋白12(LEA12)mRNA的完整7松Pinus克隆15r的LEA基因,完整序列8小麦TriticumaestivumLinnLEA2蛋白(LEA2)9拟南芥ArabidopsisthalianaAt1g01470基因,完整序列10拟南芥ArabidopsisthalianaAt2g23110基因,完整序列11拟南芥ArabidopsisthalianaAt2g44060基因,完整序列12拟南芥Arabidopsisthaliana纤维蛋白1(At2g19760)mRNA的完整序列
列在系统进化树中距离较近,关系较密切。用DNAMAN对芥菜、苜蓿蒺藜、油棕和拟南芥中编码LEA蛋白的序列进行同一性的比对,同一性较高,基因序列中有多处重复部分(标记蓝色)。从序号为171到217的序列部分重复性较高。47个碱基中,仅仅有11个碱基不同,重复率为76.6%。
3.2.2 对编码LEA蛋白的保守序列的预测和分析 由DNAMAN的同一性比对预测保守序列结果为(从第171号到第217号可编码LEA蛋白的序列):
CATCTTGCTGAAGGAAGGAGCAAGGGAGGGCAGA-
CAAGGAAGGAGCA预测的保守序列在NCBI网站上BLAST所得到的结果,几乎所有得到的序列都与LEA蛋白相关,从而可以推断,预测的保守序列具有一定的可靠性。而BLAST的结果中有2种未知的基因序列,一是大豆克隆JCVI-FLGm-6A14(未知),另一种是大豆克隆JCVI-FLGm-5F4(未知)。这两种基因序列登录号分别为:BT094816.1和BT090966.1。
用第一个未知的mRNA,即大豆克隆JCVI-FLGm-6A14(未知)的基因与表1中列出的1至8号植物的序列分别进行同一性比对。大豆克隆JCVI-FLGm-6A14未知基因与其他序列比对得到同一性为47.33%。然而,大豆克隆JCVI-FLGm-5F4未知基因的同一性比较结果较低,最高的同一性仅为13.3%。由此可以推测第一种未知的基因序列与可以表达LEA蛋白的基因序列具有一定的相似性。
从以上分析可以得出预测,大豆克隆JCVI-FLGm-6A14未知基因同可以编码LEA蛋白的基因具有一定的相似性,从而推测其可以翻译并表达LEA蛋白,在该植物中表现出LEA蛋白的抗旱性。
3.2.3 大豆克隆JCVI-FLGm-6A14未知基因所表达的蛋白和拟南芥(克隆AT10-3)胚晚期丰富蛋白基因转录的蛋白之间的同源性比较 大豆克隆JCVI-FLGm-6A14未知基因表达的氨基酸序列为:
MESQQANREELDEKARQGETVVPGGTGGKSLEAQ-EHLAEGRSRGGQTRKQQLGSEGYHEMGTKGGQTRKEQ-MGREGYQEMGRKGGLSTMDKSGRERAEEEGIEIDESKF-KIT
拟南芥(克隆AT10氨基酸序列-3)胚晚期丰富蛋白(LEA)的基因所表达的氨基酸序列为:
MASKQLSREELDEKAKQGETVVPGGTGGHSLEAQE-HLAEGRSKGGQTRKEQLGHEGYQEIGHKGGEARKEQL-GHEGYKEMGRKGGLSTMEKSGGERAEEEGIEIDESKFT-NK
将大豆克隆CVI FLGm-6A14未知基因表达的氨基酸序列与拟南芥(克隆AT10氨基酸序列-3)胚晚期丰富蛋白(LEA)的基因所表达的氨基酸序列进行BLAST分析得到结果为:score=172bits(437),Expect=9e-49,Method:Compositional matrix adjust. Identities=90/109(82%),Positives=100/109(91%),Gaps=0/109(0%)。即总分是172,而E值是9e - 49,E值相当小。两种蛋白质序列的相似性为82%。从而可以得出结论,大豆克隆JCVI-FLGm-6A14未知基因可以编码LEA蛋白或LEA蛋白的类似物。从而可以推测该基因所表达的蛋白具有抗旱功能。
3.2.4 大豆克隆JCVI-FLGm-6A14未知基因序列的基本属性 通过BIOEDIT分析大豆克隆JCVI-FLGm-6A14未知基因序列的长度是569个碱基对,单链分子量为174281.00,双链分子量为345192.00道尔顿。G和C含量为42.36%,而A 和 T含量为57.64%。
3.3系统进化树的构建
利用DNAMAN软件,采取默认参数,选取进化中具有代表性的14个物种构建系统进化树,见图2。结果显示,所有这些物种均属同一分支,且各个物种间的进化距离均在0.001与0.172之间。如果数据库中这几种同源蛋白的序列是正确的,则利用LEA蛋白的保守性对不同植物物种进行分类的价值有待进一步探讨。
图2 基于LEA蛋白序列构建的物种进化树状图
本文主要讨论了LEA蛋白的同源性,并利用DNAMAN对不同植物能表达产生LEA蛋白的基因序列进行分析比较,预测出保守序列。凭借预测的保守序列BLAST得到一种未知的大豆序列。通过BLAST比较此未知mRNA序列和拟南芥中可表达LEA蛋白的序列(clone AT10-3),认为二者有很大的相似性。从而推测未知的基因序列所表达的蛋白可行使与LEA蛋白相同的功能,即该未知大豆mRNA序列在植物抗旱性方面可能有相关作用。然而,本研究所预测的保守序列未经测试,所得到的结果还须经进一步检验。本研究为该未知大豆mRNA序列(Soybean clone JCVI-FLGm5F4 unknown mRNA )的功能做了可能性分析,也为大豆的抗旱性机理提供了一种推断,可以在实践中更进一步的探讨和验证。
同时,由于LEA蛋白是一种较保守的蛋白,利用DNAMAN绘制的进化树可以在一定程度上显示不同植物之间的进化关系。 因本实验所选取的材料较少,系统进化树可靠性有一定的局限。尽管如此,我们可以运用此方法对众多植物进行抗旱性研究并做出分类,以便我们根据自然环境状况,特别是干旱情况的发生频率,对植物的种植布局做出调整,优化种植结构避免自然灾害带来损失,获取更大社会经济效益。
[1] Yuan, K., et al., Alterations in human breast cancer adhesion-motility in response to changes in cell surface glycoprotein displaying alpha-L-fucose moieties[J].International Journal of Oncology, 2008,32(4): 797-807.
[2] Wysocki, R., et al., Transcriptional Activation of Metalloid Tolerance Genes in Saccharomyces cerevisiae Requires the AP-1ike Proteins Yap1p and Yap8p[J]. Molecular Biology of the Cell, 2004,15(5): 2049-2060.
[3] Valente, M.A.S., et al., The ER luminal binding protein (BiP) mediates an increase in drought tolerance in soybean and delays drought induced leaf senescence in soybean and tobacco[J]. Journal of Experimental Botany, 2009,60(2): 533-546.
[4] Ruijne, N., et al., Understanding the Immune Responses to the Meningococcal Strain-Specific Vaccine MeNZB Measured in Studies of Infants[J].Clinical and Vaccine Immunology,2006,13(7): 797-801.
[5] Rodriguez, M., et al., Tumor Necrosis Factor is Reparative via TNFR1 in the Hippocampus and via TNFR2 in the Striatum after Virus-Induced Encephalitis[J].Brain Pathology,2009,19(1): 12-26.
[6] Macconi, D., et al., Permselective Dysfunction of Podocyte-Podocyte Contact upon Angiotensin II Unravels the Molecular Target for Renoprotective Intervention[J]. American Journal of Pathology,2006,168(4): 1073-1085.
[7] Matsoso, L.G., et al., Function of the Cytochrome bc1-aa3 Branch of the Respiratory Network in Mycobacteria and Network Adaptation Occurring in Response to Its Disruption Bacteriol[J].American Society for Microbio-logy 2005,187(18):6300-6308.
[8] Jansson, L., et al., The Major Subunit, CfaB, of Colonization Factor Antigen I from Enterotoxigenic Escherichia coli Is a Glycosphingolipid Binding Protein[J].Infection and Immunity,2006,74(6): 3488-3497.
[9] Deane, J.E., et al., Structures of the Shigella flexneri Type 3 Secretion System Protein MxiC Reveal Conformational Variability Amongst Homologues[J].Journal of Molecular Biology 2008,377(4-3):985-992.
[10] Beeson, J.G., et al., Plasmodium falciparum Isolates from Infected Pregnant Women and Children Are Associated with Distinct Adhesive and Antigenic Properties[J].The Journal of Infectious Diseases. 1999.180(2): 464-472.
[11] Li, L., et al., MAIGO2 Is Involved in Exit of Seed Storage Proteins from the Endoplasmic Reticulum in Arabidopsis thaliana [J].Plant Cell, 2006,18(12):3535-3547.
[12] Abdo, M., et al., The expression of tumor necrosis factor-alpha, its receptors and steroidogenic acute regulatory protein during corpus luteum regression[J].Reproductive Biology and Endocrinology, 2008,6: 50.
[13] 马建华,郑海雷.植物耐盐的分子生物学基础[J].生物学杂志,2007,24(1):5-8.
[14] 俞磊宁.山仑.LEA蛋白与植物的抗旱性[J].生物工程进展,2002,22(2):10-14.
[15] 鲁刚宁.植物抗性与农业[J].中国科技信息,2006(3A):73.
[16] LEA蛋白空间结构图[OL].http://www.ncbi.nlm. nih.gov/Structure/mmdb/mmdbsrv.cgi?uid=76476.
(责任编辑:谭著明)
LEAproteinhomologyanditsapplicationpotentiality
PEI Pei
(College of Biological Sciences and Biotechnology, Beijing Forestry University, Beijing 100083, China)
LEA protein (Late-embryogenic-abundant protein) is a kind of induced protein by plants under drought stress[1]. This paper used software to map out its structure diagram and analyzed different plants which can produce LEA protein with mRNA sequence alignment to find conjectured conserved sequences. By analysis of the homology of the sequences in some unknown sequences and the original LEA protein inArabidopsisthaliana, some conclusions on the relationship between sequence and function of them were obtained. The phylogenetic tree of LEA proteins was also obtained based on their conservative property and homology. The research result on LEA protein would benefit to awareness on plant drought resistance, and be a reference for adjusting planting layout.
conservative sequence; LEA protein; phylogenetic tree
2010-03-19
2010-03-25
Q 943
A
1003-5710(2010)02-0020-04