野生种花生钙依赖蛋白激酶基因家族的生物信息学分析

2017-05-30 14:16李东霞石鹏贺梁琼杨伟波符海泉徐中亮
热带作物学报 2017年1期
关键词:生物信息学

李东霞 石鹏 贺梁琼 杨伟波 符海泉 徐中亮

摘 要 Ca2+是植物中重要的第二信使,几乎介导了植物生长发育的全部反应。钙依赖蛋白激酶(CDPKs)是植物中重要的钙传感蛋白,在植物生命活动中扮演着重要角色。目前2个二倍体野生种花生全基因组序列已经公布,而由2个野生种杂交后形成的异源四倍体栽培种花生的全基因组序列还没有公布,野生种花生CDPKs的生物信息学分析结果可以为栽培种花生CDPKs的研究提供参考。本研究采用生物信息学方法和工具对2个野生种花生CDPKs基因家族的全基因组分布、基因结构、进化和理化性质等进行分析。结果表明:2个野生种花生全基因组均比对到35个CDPKs基因序列,野生种花生与拟南芥CDPKs基因结构类似,蛋白质结构具有典型的蛋白质激酶和EF手型结构域,2个野生种花生与其它物种在进化过程中CDPKs变异较小,可能作为钙传感蛋白在细胞内各个部位和细胞器中行使功能。本研究结果可为栽培种花生的CDPKs结构和功能研究提供参考。

关键词 野生种花生;钙依赖蛋白激酶;生物信息学;EF手型结构域

中图分类号 S565.2 文献标识码 A

Bioinformatics Analysis of Calcium Dependent Protein Kinases

Gene Family in Wild Peanut

LI Dongxia1,2, SHI Peng1,2, HE Liangqiong3, YANG Weibo1,2, FU Haiquan1,2, XU Zhongliang1,2

1 Coconut Research Institute, Chinese Academy of Tropical Agricultural Sciences, Wenchang, Hainan 571339, China

2 Hainan Key Biological Laboratory of Tropical Oil Crops, Wenchang, Hainan 571339, China

3 Cash Crops Research Institute of Guangxi Academy of Agricultural Sciences, Nanning, Guangxi 530007, China

Abstract The calcium ion(Ca2+)is known as a key second messenger in plants , almost participate plant growth and development. Calcium dependent protein kinases(CDPKs)is the important calcium sensor proteins, it play an important role in the life of plant. Now, two wild diploid peanut genome sequences have been published, but the sequence of allotetraploid peanut that derived from a hybridization between two wild species has not been published. The results of bioinformatics can offer a reference for the CDPKs analysis of cultivated peanut. In this study, we analyzed two wild peanut CDPKs' genome distribution, genes structure, evolution, physical and chemical properties using bioinformatics methods and tools. The results indicated that 35 CDPKs gene sequences were found in two wild peanut genome respectively, CDPKs genes structure is similar between wild peanuts and Arabidopsis thaliana, protein kinases and EF hand domain were found in the protein structure, CDPKs variation is small between two wild peanuts and other species in the evolutionary process, CDPKs may function as calcium sensor protein within all the parts of cell and organelles. The results can provide reference for the study of CDPKs' structure and function of cultivated peanut.

Key words wild peanut; calcium dependent protein kinases; bioinformatics; EF-hand domain

doi 10.3969/j.issn.1000-2561.2017.01.017

花生(Arachis hypogaea L.)是中國主要的油料作物和经济作物之一,也是海南省的重要油料作物[1-2]。钙是植物生长发育过程必需的营养元素之一,参与植物从种子萌发、生长分化、形态建成到开花结果的全过程[3]。而花生是喜钙作物,对缺钙非常敏感[4],因土壤缺钙造成花生大幅减产降质的问题尤为突出。海南岛是一个典型的热带土壤分布区,成土过程中钙淋失严重,且盐基高度不饱和,肥料施入后易遭损失而且海南岛也是中国植物中含钙最低的地区之一[5-6]。因此,在生产成本降低和环境保护双重压力下筛选耐低钙花生品种对提高海南花生产量至关重要。

CDPKs(calcium-dependent protein kinases)是在植物中首先发现的一种钙依赖型蛋白激酶,是植物和一些原生生物所特有的一类丝氨酸/苏氨酸型蛋白激酶,在胞内钙信号的放大并向下级联传递过程中起着十分重要的作用[7]。CDPK拥有4个特别的结构域,N-末端结构域,ATP结合激酶结构域,自动抑制结构域和包含4个钙离子结合EF-hand的C-末端的类钙调蛋白结构域。钙离子能直接结合到CDPK的类钙调蛋白结构域上,因此CDPK能发现细胞内钙离子的浓度变化,由此带来的构象变化会造成激酶结构域的激活和自动抑制结构域的变化[8-9]。钙信号的进一步传递则需经Ca2+结合蛋白和钙依赖蛋白激酶等才能完成,最后引起胁迫相关基因表达量的变化,从而引发植物细胞和植株生理生化过程的变化,提高植物对不良环境刺激的耐受性[10-11]。

植物CDPKs的研究起步较晚,但发展很快,目前在拟南芥中找到了34个CDPK基因,而且梨、棉花、大豆、水稻、番茄和玉米等许多其它物种中也存在CDPK家族[12-17]。CDPK主要参与植物干旱和高盐胁迫、抗病反应、激素信号转导、光周期调节和营养代谢等生理活动,在玉米、拟南芥、水稻、黄瓜等作物中都有相关研究报道[18]。Jain等[19]研究发现花生在土壤缺钙情况下,种子发育过程中CDPK基因上调表达。同时,在荚果发育过程中也维持着较高的表达水平。

目前生产上种植的花生是栽培种花生(Arachis hypogaea L.),是四倍体一年生草本作物。其祖先为野生种花生,这2个野生种(Arachis duranensis,Arachis ipaensis)均为二倍体,已经测序完成并公布序列[20]。对花生钙依赖蛋白激酶开展研究非常必要,值得注意的是目前野生种花生公布了序列,而栽培种花生的全基因组序列还没有公布,要研究栽培种花生CDPK,可以借鉴已公布序列的野生种花生。生物信息学作为一门新学科,近年来随着测序技术的发展,得到了越来越多的应用[21]。目前栽培种花生CDPKs研究较少,本文从生物信息学的角度收集和分析野生种花生CDPK基因序列,为栽培种花生CDPK提供借鉴和参考。

1 材料与方法

1.1 材料

拟南芥AtCDPK1-AtCDPK34这34个基因蛋白质序列从TAIR网站下载(http://www.arabidopsis.org/)。野生花生种Arachis duranensis由广西农业科学院经济作物研究所提供。从NCBI(National Center for Biotechnology Information)网站上下载到用于构建系统进化树的其它物种CDPK氨基酸序列有:拟南芥(Arabidopsis thaliana,AtCDPK1,NP_196107.1)、野生大豆(Glycine soja,GsCDPK,KHN05362.1)、野生大豆(Glycine soja,GsCDPK1,KHN08596.1)、蒺藜苜蓿(Medicago truncatula,MtCDPK1,XP_003589907.1)、可可(Theobroma cacao,TcCDPK1,XP_007010504.1)、陸地棉(Gossypium hirsutum,GhCDPK,ACH88439.1)、陆地棉(Gossypium hirsutum,GhCDPK1,ACX37459.1)、山葡萄(Vitis amurensis,VaCDPK2,AGS14999.1)、杨树(Populus trichocarpa,PtCDPK2,XP_002315411.1)。

1.2 试剂

反转录试剂盒购自Thermo Fisher公司(K1622);Taq DNA聚合酶购自中科瑞泰;引物合成和TA克隆测序通过华大基因公司完成;其它生化试剂均为进口或国产分析纯试剂。

1.3 方法

野生花生CDPKs序列比对在Peanutbase网站(http://peanutbase.org/)上进行,以拟南芥的CDPK基因蛋白质序列进行比对,选取E-value小于10-5的序列(值越低,结果可靠性越高);基因结构分析使用GSDS 2.0(http://gsds.cbi.pku.edu.cn/)在线工具进行;野生花生种Arachis duranensis叶片RNA提取采用陈高等[22]方法进行;cDNA第一条链合成按照Thermo Fisher公司反转录试剂盒说明书进行;以预测的AdCDPK1基因的CDS序列为模板设计克隆引物(表1),以cDNA为模板进行PCR扩增。50 μL反应体系如下:模板10 μL、10×Taq Buffer 5 μL、Taq DNA Polymerase(5 U/μL)1 μL、dNTPs(10 mmol/L)1 μL、上下游引物各2.5 μL、ddH2O 28 μL。2对引物的PCR程序:94 ℃预变性5 min;94 ℃变性30 s,59.5/54 ℃退火30 s,72 ℃延伸1 min,35个循环;72 ℃延伸10 min。扩增完成后,用1.2%琼脂糖凝胶电泳检测扩增产物,送PCR产物到公司克隆测序;蛋白质结构域分析使用ExPASY中的Prosite工具进行;蛋白质三维结构建模采用Swiss-Model在线工具(http://swissmodel.expasy.org/interactive)进行;系统进化树构建利用MEGA 6软件进行,采用邻接关系法(Neighbor-Joining),进行1 000次bootstrap统计计算;亲水/疏水性、跨膜结构域和信号肽预测使用ProtScale、TMHMM和SignalP在线工具。

2 结果与分析

2.1 野生种花生CDPKs基因分布与特点

利用拟南芥34个CDPK基因在2个野生种花生中均分别比对到35个基因,且在10个染色体上都有分布(表2,表3)。野生种花生Arachis duranensis的3和8号染色体上分布最少只有2个,2和10号染色体上分布最多有5个。野生种花生Arachis ipaensis的8和9号染色体上分布最少只有1个,2和5号染色体上分布最多有5个。2个野生种在基因分布上有相似性,比如都在2号染色体上分布着5个CDPK基因,说明2个野生种基因组之间存在一定同源性,在进化中相距的时间不会太长。野生种花生Arachis duranensis的CDPK基因CDS长度平均为1 644 bp,蛋白质长度平均为547 aa,外显子数平均为8个。野生种花生Arachis ipaensis的CDPK基因CDS长度平均为1 619 bp,蛋白质长度平均为538 aa,外显子数平均为8个。

通过对2个野生种花生CDPKs基因的基因结构进行分析,发现2个野生种同一染色体上的CDPK基因结构相似,例如2号染色体上的AdCDPK1,AdCDPK2,AdCDPK3与AiCDPK1,AiCDPK2,AiCDPK3基因结构类似,不过外显子数目、外显子和内含子长度存在部分差异(图1)。

2.2 AdCDPK1基因序列验证

为驗证基因序列预测的真实性,以AdCDPK1基因为例进行了PCR扩增和测序验证。取野生种花生Arachis duranensis幼嫩叶片提取总RNA(图2),使用反转录试剂盒合成第一链cDNA(图3)。利用预测的AdCDPK1基因CDS序列设计2对扩增引物,以cDNA为模板进行PCR扩增,得到2条900 bp左右的条带(图4)。送华大基因进行TA克隆测序,对测序结果进行拼接,得到一条1 755 bp的序列。该序列与预测的基因序列进行比对,发现同源性高达99.6%,只有7个碱基的差异(图5)。该结果说明,野生种花生Arachis duranensis中的确存在预测的AdCDPK1基因,证实了生物信息学预测的基因真实性。

2.3 野生种花生CDPKs蛋白质结构与进化分析

蛋白结构分析发现,野生种花生的CDPK蛋白质基本具有钙依赖蛋白质激酶的特征结构域。以AdCDPK1为例,发现AdCDPK1的121~379位为蛋白质激酶保守域,该区域是受Ca2+介导的蛋白质激活结构,422~563分布着4个EF-hand结构,作为Ca2+结合位点,是钙依赖蛋白激酶的标志性结构(图6)。野生种花生CDPK蛋白质结构与拟南芥等物种相似,特别是蛋白质激酶域和EF-hand结构,这些区域的保守性非常高。其中,每个EF-hand结构域由13个氨基酸残基组成(DTDNSGQITFEEL,DIDNSGTIDYGEF,DKDGSGYITQDEL,DQDNDGR

IDYNEF),这些氨基酸残基形成2个α-螺旋,进而形成环,钙离子正是通过这些环结合上去。

AdCDPK1蛋白质三维结构建模,发现与模板4mx9.1.A相似性最高,建模结果也表明是钙依赖蛋白激酶(图7)。图中箭头所示即为特征结构域4个EF-hand形成的钙离子结合环状结构,与Prosite工具分析的结果一致。

将70个野生种花生CDPKs氨基酸序列与拟南芥、野生大豆、蒺藜苜蓿、可可、陆地棉、山葡萄和杨树进行比对并构建系统进化树。系统进化树表明,这些物种和野生花生CDPKs蛋白质的氨基酸序列变异较多,造成不同物种聚在一起的可能性很低(图8)。但是值得注意的是,野生种花生Arachis duranensis和Arachis ipaensis的CDPKs相互混杂在一起,可能是因为2个野生种花生基因组具有一定同源性。利用CDPK氨基酸序列分析野生花生和其它物种进化关系时,能较好地体现物种间的真实亲缘关系。

2.4 野生花生AdCDPK1的野生种花生CDPKs蛋白质的理化性质分析

通过对野生花生CDPKs蛋白质进行理化性质分析,发现其可能作为感受蛋白在细胞内各个部位和细胞器中行使功能。分析结果以AdCDPK1为例进行展示,分析发现其为亲水性蛋白质;没有发现明显的跨膜结构域,说明其不是跨膜蛋白质;AdCDPK1预测分数没有达到阈值,不是信号肽,说明不是作为信号肽行使功能(图9~11)。

野生种花生CDPK蛋白质的亚细胞定位分析发现,2个野生种的CDPK定位基本一致,主要分布在叶绿体基质、细胞核、内质网膜、细胞质、过氧化物酶体、细胞质膜和叶绿体内囊体膜中。其中Arachis duranensis部分CDPK蛋白质亚细胞定位结果见表4。

3 讨论

Ca2+作为重要的第二信使,它在细胞质中浓度的变化是植物响应环境刺激信号网络中的重要组成部分。最近的研究结果揭示了CDPKs作为Ca2+介导的免疫及胁迫响应的重要调控者,对植物的生存至关重要[10,23]。花生是中国长江以南各省主要食用油料作物之一,然而华南、长江流域2大花生产区高温、多雨,土壤酸度高,缺钙普遍严重,花生的生长受低钙胁迫严重,因土壤缺钙造成花生大幅减产降质的问题突出。栽培种花生基因组没有公布序列,本文借鉴野生种花生基因组序列来分析CDPK,借此了解栽培花生CDPK基因家族的结构和功能,为进一步研究栽培种花生CDPK基因家族对于钙吸收传递、抗逆性和碳氮代谢等生命活动提供依据。对AdCDPK1的克隆测序也验证了生物信息学预测基因的真实性,也可为分析栽培种花生CDPK基因提供参考。

水稻OsCPK21的ORF为1 698 bp,编码565个氨基酸,OsCDPK14的ORF为1 542 bp,编码513个氨基酸,与野生种花生CDPK的CDS和氨基酸长度基本一致[24-25]。拟南芥34个CDPK基因分布在5个染色体上,4号染色体上最多有11个,3号染色体最少只有4个。野生种花生Arachis duranensis的每条染色体上CDPK基因数量为2~5个,野生花生Arachis ipaensis的每条染色体上CDPK基因数量为为1~5个,与拟南芥相比偏少。2个野生种花生有4个染色体上CDPK基因数量相同,其它6个染色体则存在一些差异。拟南芥中34个CDPK蛋白质的激酶结构域、自动抑制结构域和类钙调蛋白结构域高度保守,而N末端结构域则变异较大。其中类钙调蛋白结构域包含94~147个氨基酸,由4个EF手型结构构成,具有结合钙离子的功能,单个钙离子分子可以结合到EF手型结构形成的环状结构上[26],野生种花生CDPK也是如此有类似的结构,说明也可能具有同样的功能。杨树和拟南芥CDPK蛋白质进化分析表明,它们大致可以分为3类,总体来看相互之间进化关系较近,大部分CDPK蛋白质具有相似的功能[27]。野生种花生CDPK同源性同样很高,系统进化树分析表明它们混杂在一起,而与十字花科拟南芥、豆科的野生大豆、梧桐科的可可、锦葵科的陆地棉和杨柳科的杨树等其它物种聚在一起的可能性很低,可能是由于CDPK蛋白质N末端的序列变异较大造成,与Shu-Hua等[26]的研究结果一致。由于CDPK蛋白质除了EF手型和激酶结构域较为保守外,N末端等区域变异较多,因此用CDPK蛋白质的氨基酸序列来研究物种的进化关系能很好地展现其真实亲缘关系。拟南芥中9个CDPK基因亚细胞定位分析表明,AtCPK3、AtCPK4在细胞质与细胞核中存在,而AtCPK1、7、8、9、16、21、28则定位在膜上,水稻OsCPK21定位在细胞质膜上,OsCPK18定位于细胞膜,烟草NtCPK4在整个细胞中都存在,NtCPK5定位于细胞膜,马铃薯的StCDPK5定位于细胞膜(Dammann,Campos-Soriano,wang,Kobayashi)[28-31]。2个野生种花生CDPK蛋白质与以上物种定位结果基本一致,基本分布在细胞中各个部位和细胞器中。

参考文献

[1] 杨伟波, 付登强, 刘立云, 等.海南花生研究现状及展望[J]. 热带农业科学, 2013, 33(5): 73-75.

[2] 王文壮. 海南与台湾: 农业发展比较与合作竞争[M]. 北京: 中国农业出版社, 2008.

[3] 李新国, 万书波. 钙对花生生长发育调控的研究進展[J]. 山东农业科学, 2011, 8: 65-67, 74.

[4] Rui Y. Calcium availability to runner-type peanut (Arachis hypogaea L.) in the southeastern United States[D]. Auburn: Graduate Faculty of Auburn University, 2015.

[5] 龚子同, 张甘霖, 赵文君, 等. 海南岛土壤中铝钙的地球化学特征及其对生态环境的影响[J]. 地理科学, 2003, 23(2): 200-207.

[6] 魏玉云. 热带地区砖红壤上不同土壤pH和含水量对尿素挥发的影响研究[D]. 儋州: 华南热带农业大学, 2006.

[7] 倪天华, 魏幼璋. 钙依赖蛋白激酶(CDPKs)在植物中的生理功能[J]. 西北农林科技大学学报(自然科学版), 2002, 30(6): 214-247.

[8] Hrabak E M, Chan C W M, Michael G, et al. The Arabidopsis CDPK-SnRK superfamily of protein kinases[J]. Plant Physiology, 2003, 132(2): 666-680.

[9] Vidya C, Stollar E J, Kresten L L, et al. Structure of the regulatory apparatus of a calcium-dependent protein kinase (CDPK): a novel mode of calmodulin-target recognition[J]. Journal of Molecular Biology, 2006, 357(2): 400-410.

[10] Sanders D, Pelloux J, Brownlee C, et al. Calcium at the crossroads of signaling[J]. Plant Cell, 2002, 14(Suppl): S401-417.

[11] McAinsh M R, Pittman J K. Shaping the calcium signature[J]. New Phytol, 2009, 181: 275-294.

[12] 许园园, 李晓刚, 李 慧, 等. 梨CDPK基因家族全基因组序列鉴定分析[J]. 江苏农业学报, 2015(3): 659-666.

[13] Liu W, Li W, He Q, et al. Genome-wide survey and expression analysis of calcium-dependent protein kinase in Gossypium raimondii[J]. PLoS One, 2014, 9(6): e98 189.

[14] Man-Ho O, Xia W, Huber S C. Impact of Ca(2+) on structure of soybean CDPKβ and accessibility of the Tyr-24 autophosphorylation site[J]. Plant Signaling & Behavior, 2013, 8(12): e27 671-27 671.

[15] Wei S Y, Hu W, Deng X M, et al. A rice calcium-dependent protein kinase OsCPK9 positively regulates drought stress tolerance and spikelet fertility[J]. Bmc Plant Biology, 2014, 14(1): 133.

[16] Wang J P, Xu Y P, Munyampundu J P, et al. Calcium-dependent protein kinase (CDPK) and CDPK-related kinase (CRK) gene families in tomato: genome-wide identification and functional analyses in disease resistance[J]. Mgg Molecular & General Genetics, 2015: 1-16.

[17] Kong X, Wei L, Jiang S, et al. Genome-wide identification and expression analysis of calcium-dependent protein kinase in maize[J]. Bmc Genomics, 2013, 14(1): 447-450.

[18] 杨洪强, 梁小娥. 高等植物中的CDPK及其生理生化功能[J]. 山东农业大学学报(自然科学版), 2003, 34(2): 284-288.

[19] Jain M, Pathak B K, Harmon A C, et al. Calcium dependent protein kinase (CDPK) expression during fruit development in cultivated peanut (Arachis hypogaea L.) under Ca2+- sufficient and - deficient growth regimens[J]. Journal of plant physiology, 2011, 168(8): 2 272-2 277.

[20] Bertioli D J, Cannon S B, Froenicke L, et al. The genome sequences of Arachis duranensis and Arachis ipaensis, the diploid ancestors of cultivated peanut[J]. Nature Genetics, 2016, 33(4): 118-120.

[21] 石 鹏, 曹红星, 李东霞, 等. 油棕等植物γ-生育酚甲基转移酶的生物信息学分析[J]. 热带作物学报, 2015, 36(2): 308-315.

[22] 陈 高, 单 雷, 周丽侠, 等. 花生总RNA提取方法比较研究[J]. 中国农学通报, 2011, 27(1): 214-218.

[23] 姜珊珊, 张 丹, 孔祥培, 等. 植物中的鈣依赖蛋白激酶(CDPK)的结构特征和功能研究进展[J]. 生物技术通报, 2013(6): 12-19.

[24] 魏 雪. 水稻钙依赖性蛋白激酶21(OsCPK21)基因克隆及其性质验证[D]. 北京: 北京师范大学, 2009.

[25] 张铁刚. 水稻颖果发育信号分子钙依赖性蛋白激酶(CDPK)新基因的克隆及其性质功能研究[D]. 北京: 北京师范大学, 2004.

[26] Shu-Hua C, Willmann M R, Huei-Chi C, et al. Calcium signaling through protein kinases. The Arabidopsis calcium-dependent protein kinase gene family[J]. Plant Physiology, 2002, 129(2): 469-485.

[27] 薛 彬, 夏新莉, 尹伟伦. 杨树钙依赖蛋白激酶基因家族生物信息学分析[J]. 经济林研究, 2010, 28(1): 20-25.

[28] Dammann C, Ichida A, Hong B, et al. Subcellular targeting of nine calcium-dependent protein kinase isoforms from Arabidopsis[J]. Plant Physiol, 2003, 132: 1 840-1 848.

[29] Campos-Soriano L, Gomez-Ariza J, Bonfante P, et al. A rice calcium-dependent protein kinase is expressed in cortical root cells during the presymbiotic phase of the arbuscular mycorrhizal symbiosis[J]. BMC Plant Biol, 2011(11): 90.

[30] Wang Y, Zhang M, Ke K, et al. Cellular localization and biochemical characterization of a novel calcium-dependent protein kinase from tobacco[J]. Cell Res, 2005, 15(8): 604-612.

[31] Kobayashi M, Yoshioka M, Asai S, et al. StCDPK5 confers resistance to late blight pathogen but increases susceptibility to early blight pathogen in potato via reactive oxygen species burst[J]. New Phytol, 2012, 196(1): 223-237.

猜你喜欢
生物信息学
中药蛋白质组学研究策略
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究
案例教学法在《生物信息学》本科教学中的应用
论生物信息学研究进展及在蛋白质组学研究中的应用
农学类专业《生物信息学》课程教学改革探讨
微生物二元网络作用关系研究