李墨野 赵慧 姜洋 刘笑平 林永红 李开隆
摘要 [目的]用生物信息学手段分析、预测毛白杨PLC2基因/蛋白质的结构与特征,为该基因的克隆及功能研究提供理论参考。[方法]以PLC2基因及对应蛋白质为研究对象,利用各种网上数据库及生物信息学分析软件对其进行相关分析、预测。[结果]PLC2基因的GenBank登录号为JX424764.1,ORF长957bp,编码318个氨基酸,对应蛋白质PLC2的分子量35 999.1D,理论等电点7.07;PLC2与毛果杨(XP_002313726.1)的同源性较高;PLC2属于PIPLCc_GDPD_SF超家族,无O糖基化位点,无二硫键,无跨膜区和信号肽,有16个磷酸化位点。[结论]对PLC2基因/蛋白的各级结构及功能进行预测,为下一步试验奠定基础。
关键词 毛白杨;磷酸肌醇特异性磷脂酶C;生物信息学
中图分类号 S188 文献标识码 A 文章编号 0517-6611(2014)31-10867-06
Bioinformatics Analysis of Populus tomentosa cultivar BJHR01 Phosphoinositidespecific phospholipase C (PLC2) Gene
LI Moye, ZHAO Hui, JIANG Yang, LI Kailong et al
(State Key Laboratory of Tree Genetics and Breeding, Northeast Forestry University, Harbin, Heilongjiang 150040)
Abstract [Objective] To analyze and predict the structure and feature of Populus tomentosa PLC2 gene/protein through bioinformatics method, and provide theoretical foundation for gene cloning and function research. [Method] Utilize various online databases and bioinformatics software to predict PLC2 gene and its corresponding protein. [Result] The GenBank accession number of PLC2 is JX424764.1, ORF is 957bp in length, encoding 318aa; the molecular weight of PLC2 is 35 999.1D, theoretical isoelectric point is 7.07; PLC2 has a higher homology with XP_002313726.1, belonging to PIPLCc_GDPD_SF superfamily, has no Oglycosylation site, no disulfide bond, no transmembrane domain or signal peptide, but 16 phosphorylation sites. [Conclusion] This study has predicted the structure and function of PLC2 gene/protein and paved the way for the following experiments.
Key words Populus tomentosa; Phosphoinositidespecific phospholipase C; Bioinformatics
毛白楊(Populus tomentosa)是以黄河中、下游流域为中心而广泛分布的杨柳科落叶乔木,该树种适应能力较强,是速生用材林,为防护林和行道河渠绿化的理想选择[1]。磷酸肌醇特异性磷脂酶C是真核生物胞内酶,在细胞信号转导过程中起着重要作用[2]。它能催化1磷脂酶D肌醇肌糖4,5二磷酸水解成第二信使物质甘油二脂、肌糖1,4,5三磷酸的反应,这个催化作用还受到可逆磷酸化反应以及调节蛋白质的调控[3-5]。笔者通过生物信息学手段对毛白杨(BJHR01种)磷酸肌醇特异性磷脂酶C(phosphoinositidespecific phospholipase C,PLC2)基因的核酸/蛋白质序列的分子特征、一级结构、二级结构以及三维结构进行了预测,并对该蛋白进行了系统进化分析,从而为下一步的分子生物学试验提供理论依据。
1 材料与方法
1.1 材料
所选材料为毛白杨(BJHR01种)磷酸肌醇特异性磷脂酶C基因,GenBank登录号:JX424764.1。
1.2 方法
利用BioEditClustalW软件对11个物种的磷酸肌醇特异性磷脂酶氨基酸序列进行多序列比对;应用MEGA5软件构建系统进化树;利用ExPASy中的ProtParam工具(http://www.expasy.org/tools/protparam.html)对蛋白质的理化性质进行在线分析;通过NetOGlyc(http://www.cbs.dtu.dk/services/NetOGlyc/)进行糖基化位点的预测;通过NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)对PLC 2的磷酸化位点进行预测;利用在线工具COILS预测PLC2的卷曲螺旋结构;利用PredictProtein和psipred预测PLC2蛋白的二级结构;利用PROSITE(http://prosite.expasy.org/)确定出PLC 2的活性部位;利用在线工具PredictProtein(http://www.Predictprotein.org/)和 TMpred(http://www.ch.embnet.org/software/TMPRED_form.html)方法预测PLC2氨基酸序列可能的跨膜区;应用SignalP在线预测毛白杨磷酸肌醇特异性磷脂酶C的信号肽;利用SWISS MODEL(http://swissmodel.expasy.org)预测PLC2蛋白质的三级结构;用Raswin和spdbiew软件查看三级结构预测结果。
2 结果与分析
2.1 PLC2基因及相應氨基酸序列的一级结构
2.1.1 plc2基因的开放读码框及翻译。
首先检索NCBI中的GenBank获得PLC2基因的完整cds,再利用ORF Finder查找其开放读码框,获得一条长957 bp的完整ORF,利用SMS在线翻译(+1框)该核酸序列,结果见图1。
2.1.2 plc2基因的染色体定位。
利用NCBI中的工具MapViewer初步检索毛果杨基因组,使用普通检索和高级检索,均未找到与之匹配的结果。于JGI数据库进行BLAT Search,结果发现在毛果杨的第9号和第4号染色体上的得分最高,分别为1 583.0、1 825.0,相似程度分别为90.6%、98.7%(图2)。由于毛果杨与毛白杨亲缘关系较近,因此推测PLC2基因可能位于毛白杨栽培种BJHR01的第4或第9号染色体上。
2.1.3 氨基酸序列分析。
经过ExPASy在线软件分析,得出PLC2氨基酸数目为318,相对分子质量为35 999.1 D,理论等电点(pI)为7.07。在PLC2中,亮氨酸(Leu)、赖氨酸(Lys)和缬氨酸(Val)3种氨基酸含量最高,均为7.5%。甲硫氨酸含量最低(Met),仅为1.3%(图3)。PLC2蛋白原子组成为C∶H∶N∶O∶S=1 603∶2 530∶440∶478∶12,即分子式为C1603H2530N440O478S12,原子总数为5 063。不稳定系数为38.26。
2.1.4 PLC2的亲疏水性分析。
利用ProtScale软件绘制毛白杨磷酸肌醇特异性磷脂酶C亲疏水性列谱,以预测其折叠情况。使用Hphob./Kyte&Doolittle算法进行预测,见图4。结果发现,该蛋白质仅存在1个高分值峰(Score>1.5),分布在第300~310位残基之间;而3个低分值(Score<0)的峰分别位于第40~50、150~160、190~200氨基酸残基位点附近,可初步推测这3个位置为蛋白质的卷曲结构部位。
3 讨论
该研究通过生物信息学的方法对PLC2基因的DNA序列、蛋白质序列进行了分析,并预测了相应蛋白质的结构与功能。利用PROSITE预测出该蛋白的保守结构域为PIPLC_X_DOMAIN,位于第57~185位氨基酸残基之间,其中以2个组氨酸(H)为活性中心位点,即为该酶的催化活性中心。序列比对表明,PLC2的PIPLC_X_DOMAIN结构域在不同物种中具有很高的保守型。蛋白质的结构分析显示该酶无卷曲结构,无二硫键,无明显的跨膜区,且未预测出信号肽。笔者还利用SWISS MODEL(Automated Mode)预测了PLC2的三维构型,结果表明,QMEAN Z-Score=-6.19,与模板蛋白序列比对的一致性也非常低(14.92%),说明预测结果可信度不高,原因可能是该蛋白质本身不稳定或是所选靶标蛋白不当,下一步通过Robetta BETA从头预测PLC2蛋白的三级结构。
另外,笔者通过研究发现,使用不同的分析工具对同一条序列进行分析,可能会得到不同的结果,这可能是因为不同的软件所应用的计算方法各异。因此,该研究对PLC2/PLC2的所有预测结果仅能作为参考,具体功能研究还需要经过大量严谨的试验进行验证。
参考文献
[1]
张美霞,马海燕.毛白杨栽培技术及应用[J].现代农业科技.2014(3):45
[2] MELDRUM E,PARKER P J,CAROZZI A.The PtdInsPLC superfamily and signal transduction[J].Biochim Biophys Acta,1991,1092(1):49-71.
[3] RHEE S G,CHOI K D.Multiple forms of phospholipase C isozymes and their activation mechanisms[J].Adv Second Messenger Phosphoprotein Res,1992,26:35-61.
[4] RHEE S G,CHOI K D.Regulation of inositol phospholipidspecific phospholipase C isozymes[J].J Biol Chem,1992,267(18):12393-12396.
[5] STERNWEIS P C,SMRCKA A V.Regulation of phospholipase C by G proteins[J].Trends Biochem Sci,1992,17(12):502-506.
[6] 朱琍燕,吴士良.蛋白质的糖基化作用分类及相关数据库[J].生命的化学,2007(2):108-111.
[7] RHEE S G,BAE Y S.Regulation of phosphoinositidespecific phospholipase C isozymes[J].J Biol Chem,1997,272(24):15045-15048.
[8] REBECCHI M J,PENTYALA S N.Structure,function,and control of phosphoinositidespecific phospholipase C[J].Physiol Rev,2000,80(4):1291-1335.
[9] MCGUFFIN L J,BRYSON K,JONES D T.The PSIPRED protein structure prediction server[J].Bioinformatics,2000,16(4):404-405.