刘 丹,毕德泷,陈 鑫,王立凤
(牡丹江师范学院,黑龙江牡丹江 157012)
狗枣猕猴桃(Actinidia kolomikta)别名狗枣子,是猕猴桃科(Actinidiacese)猕猴桃属(Actinidia)多年生落叶藤本植物,是最为耐寒的猕猴桃种类之一。主要分布于我国东三省、四川、云南等高山地区,俄罗斯、日本及朝鲜半岛也有分布。喜生于阔叶、针叶混交灌木林且通风良好、土质湿润、腐殖质肥沃的自然环境中。其果实富含维生素C、有机酸、蛋白质、多种糖类及人体所需的多种微量元素和氨基酸。狗枣猕猴桃的抗逆性强,还具有药物开发、食用保健等经济效益。是东北地区蕴藏丰富的野生浆果资源,是珍贵的抗寒种质资源[1-2]。胚胎发育晚期富集蛋白(late embryogenesis abundant protein,LEA),分子量在10~30 ku之间,具有高亲水性,属于逆境胁迫响应蛋白[3-4]。1989年Dure等在棉花种子中首次发现LEA的存在,后在大豆、水稻、拟南芥、葡萄等植物中陆续发现[5],LEA的结构和功能一直以来都吸引着众多科学家的兴趣和重视,广泛存在于植物中。到目前为止已克隆获得上百种LEA基因[6],通过各种分子生物学手段,人们发现,植物营养组织遭受干旱、低温、ABA处理及盐胁迫等逆境胁迫后,会产生许多新的mRNA和蛋白质,该蛋白质中相当大一部分均与LEA蛋白有同源性[7]。众多研究表明LEA基因的功能主要与抗逆性有关,植物营养组织遭受逆境胁迫后均能诱导LEA基因的表达[8]。许多LEA基因转化试验也表明,LEA可显著提高植物的抗逆性。LEA蛋白富含赖氨酸、甘氨酸、组氨酸等极性氨基酸,缺乏色氨酸和半胱氨酸,无明显的二级结构,以一种无序状态存在于溶液中。目前,LEA基因的研究越来越广泛,大多研究集中在植物抗逆性方面[9]。鉴于LEA蛋白在植物抗逆性方面的重要作用,本研究以狗枣猕猴桃转录组数据为参考,筛选到LEA蛋白的cDNA序列,利用生物信息学方法对枣猕猴桃胚胎发育晚期富集蛋白的理化性质、疏水性/亲水性、蛋白结构功能域、二级结构、三级结构及同源性等方面进行预测和分析,以期为狗枣猕猴桃抗寒能力形成的相关研究提供参考。
狗枣猕猴桃胚胎发育晚期富集蛋白cDNA序列从笔者所在实验室转录组数据中获得;山黄麻(Parasponia andersonii)、东方苔草(Trema orientale)、欧洲栓皮栎(Quercus suber)、荷花(Nelumbo nucifera)、中华猕猴桃原变种(Actinidia chinensis var.chinensis)、苹果(Malus domestica)、土瓶草(Cephalotus follicularis)、博落回(Macleaya cordata)、可可树(Theobroma cacao)、甜椒(Capsicum annuum)、巴 卡廷辣椒(Capsicum baccatum)、番茄(Solanum lycopersicum)、向日葵(Helianthus annuus)、香 青 蒿(Artemisia annua)、杨 树(Populus trichocarpa)、石榴(Punica granatum)等植物氨基酸序列在NCBI数据库中下载。
狗枣猕猴桃AkLEA的理化性质用Prot Param(https://web.expasy.org/cgi-bin/protparam/protparam)进行分析;NCBI-CDD进行保守结构域及蛋白家族预测(https://www.ncbi.nlm.nih.gov/Structure/cdd/);Inter-Prot Scan(http://www.ebi.ac.uk/interpro/search/sequence-search)预测功能位点;NetNGlyc(http://www.cbs.dtu.dk/services/NetNGlyc/)对N-糖基化位点进行预测;NetOGlyc(http://www.cbs.dtu.dk/services/NetOGlyc/)对O-糖基化位点进行预测;采用Predict Protein数据库(https://www.predictprotein.org/)对AkLEA蛋白进行二级结构预测;使用SWISS-MODEL(http://swissmodel.Expasy.org/)在线软件预测蛋白质三级结构。从NCBI(https://www.ncbi.nlm.nih.gov/)数据库中获得19条不同植物的LEA氨基酸序列信息,利用MEGA 5.0软件的Neighbor-joining法构建蛋白质系统进化树。
利用Prot Param软件对狗枣猕猴桃AkLEA氨基酸序列进行分析,结果表明,狗枣猕猴桃AkLEA基因cDNA全长为1 292 bp,编码区(CDS)为cDNA上第247~912个碱基,共编码221个氨基酸,分子量24 130.33 u,理论等电点为10.40,负电荷残基总数(Asp+Glu)为49,正电荷残基总数(Arg+Lys)为12,分子式为C1052H1770N314O306S13,总原子数3 455,亲水性(GRAVY)的平均水平:0.152。不稳定指数(instability index,Ⅱ)为33.97,说明该蛋白较为稳定。该蛋白中含量最多的为亮氨酸,占12.2%,其次为异亮氨酸和苏氨酸,各占10.9%和8.6%。含量最少的为谷氨酰胺、谷氨酸、组氨酸、酪氨酸,均为1.8%(图1)。有研究表明,大部分植物中的LEA蛋白富含赖氨酸、甘氨酸、组氨酸等极性氨基酸,缺乏色氨酸和半胱氨酸,本研究中狗枣猕猴桃色氨酸缺乏,但是存在半胱氨酸,这是狗枣猕猴桃不同于已研究的其他植物的一个特性。
在自然界中常见的氨基酸均具有亲水性和疏水性,其排列顺序侧链基因之间的相互作用决定了其合成蛋白质三维空间结构的主要原因,通过测定和分析可以为高级结构的预测提供参考。通过Prot Scale软件分析预测,结果表明:该基因蛋白的整个肽链中均含有亲水性和疏水性氨基酸,得分最大值为3.867,在56、57、58个氨基酸处,最小值为-2.600,在第36个氨基酸处。根据蛋白质亲水和疏水的得分判定该蛋白为亲水蛋白(图2)。
有些蛋白质合成以后,需要转移到特定位置发挥作用,信号肽就是引导蛋白质到达特定位置的特殊氨基酸序列,一般位于蛋白质的N端,长约10~30个氨基酸,包含信号肽的C端、N端和疏水核心区。SignalP-4.1预测AkLEA蛋白不含信号肽,也不存在跨膜结构(图3)。
通过氨基酸序列的比对,对狗枣猕猴桃AkLEA保守序列及蛋白家族进行预测,结果表明,狗枣猕猴桃AkLEA是LEA基因家族的LEA2成员,它的第100~200氨基酸之间的序列区域为LEA2组的保守结构域(图4)。NCBI-CDD 和Inter-ProtScan预测结果表明,67~221氨基酸为狗枣猕猴桃AkLEA的N端序列,1~39氨基酸为狗枣猕猴桃AkLEA的C端序列。
用Predictprotein对AkLEA的二级结构进行预测,结果表明,组成AkLEA的221个氨基酸中,其中8.14%的氨基酸可能会形成螺旋(helix),43.44%的氨基酸可能形成延伸链(strand),48.42%的氨基酸可能形成环(loop),无二硫键的形成,没有特殊的二级结构。用SWISS-MODEL对AkLEA蛋白进行三级结构的预测,结果如图5所示。
蛋白质磷酸化是调节和控制蛋白质活力和功能的最基本、最普遍,也是最重要的机制。通过predictprotein分析表明,AkLEA上含有5个糖基化位点(c N-glycosylation site)、7个蛋白激酶C磷酸化位点(Protein kinase C phosphorylation site)、1个酪蛋白磷酸激酶Ⅱ磷酸化位点(Casein kinaseⅡphosphorylation site)、5个十四烷酰化位点(N-myristoylation site)(表1)。
蛋白质的N-糖基化修饰是生物体调控蛋白质在组织和细胞中的定位、功能、活性、寿命和多样性的一种普遍的翻译后修饰。通过NetNGlyc1.0 server对N-糖基化位点进行预测,结果表明,该蛋白内有5个潜在的N-糖基化位点,分别在93(NLTV)、146(NMTI)、172(NMSS)、198(NCTM)及204(NATS)氨基酸处。O-糖基化是另一种重要的蛋白质翻译后修饰,O-糖链能维持所连接蛋白质部分的空间构象,NetOGlyc4.0 server对O-糖基化位点进行预测,预测分数均大于0.5的认为是阳性,故推测该蛋白内含3个O-糖基化位点,分别在22、26、108氨基酸处。
表1 AkCHS1蛋白修饰位点的预测
在NCBI数据库中分别下载山黄麻、东方苔草、欧洲栓皮栎、荷花、中华猕猴桃原变种、苹果、土瓶草、博落回、可可树、甜椒、巴卡廷辣椒、番茄、向日葵、香青蒿、杨树、石榴等17种植物的LEA序列,与狗枣猕猴桃AkLEA氨基酸序列进行同源性分析,结果表明,狗枣猕猴桃AkLEA与中华猕猴桃原变种亲缘关系较近,而与杨树、石榴等植物亲缘关系较远(图6)。
本研究利用已测的狗枣猕猴桃转录组数据,筛选出狗枣猕猴桃AkLEA基因cDNA序列信息,并对其进行了生物信息学分析。结果表明,AkLEA基因cDNA总长1 292 bp,CDS为657 bp,编码蛋白由221个氨基酸构成。具有LEA的保守序列,是LEA2(PLN03160)超家族的一员,是一个亲水性、稳定的蛋白。LEA_2组中的蛋白大多为非典型的LEA蛋白,它们与其他分组之间存在着较低的序列同源关系[10],AkLEA基因在NCBI数据库中进行Blast,结果显示在与狗枣猕猴桃LEA蛋白相比的98条LEA基因的氨基酸序列中,一致性最高的为93.15%,最低的为44.44%。该结果与Galau等的研究结果[10]相符。LEA2分组中的非典型LEA蛋白,与典型的LEA蛋白相比,往往具有较高疏水特性,并且具有较为稳定的结构。典型的LEA蛋白具有较强的亲水特性,它们在脱水条件下可以起到亲水性溶质的作用,进而维持蛋白结构的稳定。因此,为了鉴定AkLEA基因cDNA序列是否也具有非典型LEA蛋白的这些特性,本研究通过Prot Param在线软件进行了疏水性鉴定,但是结果预测该AkLEA蛋白为亲水性蛋白。这一结果表明了AkLEA蛋白可能拥有不同于非典型的LEA蛋白的功能。选取17条氨基酸序列与狗枣猕猴桃的氨基酸序列进行比对,经MAGA 5.0分析,结果表明,狗枣猕猴桃AkLEA与中华猕猴桃变种亲缘关系较近,而与杨树、石榴等植物亲缘关系较远。