绵羊GP5基因的生物信息学分析

2020-11-30 08:49宋雅萍李彦霞郭文婧张小雪
甘肃农业科技 2020年10期
关键词:生物信息学分析绵羊

宋雅萍 李彦霞 郭文婧 张小雪

摘要:为探讨绵羊血小板糖蛋白V基因(Glycoprotein V,Platelet,GP5)编码蛋白的结构和功能,以NCBI网站的GenBank数据库中发布的绵羊GP5基因序列(登录号为XM_ 027965957.1)为基础,采用生物信息学在线工具和软件对绵羊的GP5基因进行生物信息学分析。结果表明,绵羊GP5基因序列中包含1个最大长度为1 620 bp的开放阅读框,推测其编码539个氨基酸,其中亮氨酸含量最多,为22.6%。GP5基因所编码的蛋白其相对分子质量约为59 305.38 KDa,理论等电点为9.40;亚细胞定位结果表明其主要位于内质网(44.4%)。GP5蛋白含有信号肽和跨膜螺旋结构,在二级结构预测中,该蛋白以无规卷曲为主,为70.14%。GP5蛋白三级结构主要由无规卷曲折叠缠绕形成,与二级结构预测结构一致。

关键词:绵羊;GP5基因;生物信息学分析

中图分类号:S826       文献标志码:A       文章编号:1001-1463(2020)09-0054-06

doi:10.3969/j.issn.1001-1463.2020.10.012

Abstract:In order to investigate the structure and function of the protein encoded by Glycoprotein V, Platelet (GP5), this paper uses bioinformatics online tools and software to analyze the GP5 gene of sheep based on the GP5 gene sequence of sheep published in GenBank database of NCBI website(registration number: XM_027965957.1). The results showed that GP5 gene sequence of sheep contained an open reading frame with a maximum length of 1 620 bp, and it was speculated that it encoded 539 amino acids, of which leucine content was the largest(22.6%). The relative molecular weight of the protein encoded by GP5 gene is about 59 305.38 KDa, and the theoretical isoelectric point is 9.40. The results of subcellular localization showed that it was mainly located in the endoplasmic reticulum(44.4%). GP5 protein contains signal peptide and transmembrane helix structure. In the prediction of secondary structure, random crimp was dominant, which was 70.14%. The tertiary structure of GP5 protein is mainly formed by random crimp, winding and folding, which is consistent with the predicted structure of the secondary structure.

Key words:Sheep;GP5 gene;Bioinformatics

血小板糖蛋白V(Glycoprotein V,Platelet,GP5)是血小板膜表面含量最丰富的糖蛋白之一,它是血小板vWF和凝血酶受体GPIb-IX-V复合物中的一个亚单位。GP5可以促进GPIb-IX在血小板表面的表达,增强血小板与vWF的结合能力。用凝血酶处理血小板后会导致血小板膜表面GP5的缺乏,而缺乏GP5的血小板可增加血小板对凝血酶的应答反应,从而促进血小板纤维蛋白原结合和血小板聚集。人GP5的分子量为83.3 ku,由469个氨基酸组成,且存在一种由16个氨基酸组成的信号肽。成熟GP5是由544个氨基酸组成的跨膜糖蛋白,包括1个跨膜区,1个胞浆区(16个氨基酸)和1个胞外区(504个氨基酸)。胞外区包含15个富含亮氨酸的重复序列和1个凝血酶水解识别序列和敏感位点[1 ]。人GP5是凝血酶的表面糖蛋白和底物[2 ]。目前,GP5基因在人、豬、鼠等中都有研究,对绵羊GP5基因却鲜有报道。我们利用生物信息学相关软件和在线工具,对绵羊GP5基因及其编码蛋白的理化性质、结构和功能等进行分析,旨在为今后绵羊GP5基因的进一步研究提供信息学参考。

1   材料与方法

1.1   序列来源

基因序列来源于NCBI网站GenBank数据库,包括绵羊(XM_027965957.1)的mRNA序列及8个物种的蛋白质序列:绵羊(XP_ 027821758.1)、人(NP_004479.1)、牛(XP_024 850825.1)、家鼠(NP_036927.1)、猪(XP_020 925727.1)、兔子(XP_008265039.1)、鸡(XP_ 004943385.1)、马(XP_023479286.1)。括号内为GenBank登录号。

1.2   方法

绵羊GP5基因开放阅读框(Open reading frame,ORF)采用NCBI的ORF Finder程序(https://www.ncbi.nlm.nih.gov/orffinder/)分析,参照Kozak法则。绵羊GP5蛋白潜在信号肽剪切位点预测采用在线工具SignalP 3.0(http://www.cbs.dtu.dk/services/SignalP-3.0/)。各物种GP5编码产物序列同源性比对采用DNAMAN软件分析。绵羊GP5蛋白保守结构域分析采用Smart软件(http://smart.embl- heidelberg.de/)[3 ]。采用Bioedit软件及ExPASy的ProtParam(http://www.expasy.org/tools/prot param.html)在线工具对绵羊GP5蛋白理化性质进行分析[4 - 5 ]。采用ExPASy的ProtScale(http://ca.expasy.org/tools/protscale.html)在线工具对绵羊GP5基因编码蛋白的亲疏水性进行预测[5 ]。绵羊GP5基因编码产物亚细胞定位采用在线工具PSORTⅡ(https://psort.hgc.jp/form2.html)預测[4 ]。绵羊GP5蛋白跨膜螺旋结构预测采用TMHMM在线软件(http://www.cbs.dtu.dk/services/TMHMM)。绵羊GP5蛋白二级结构采用Jpred4(http://www.compbio.dundee.ac.uk/jpred4/index.html)分析预测[6 ],三级结构采用Swiss-model(https://www.swissmodel.expasy.org/)在线工具预测[3 ]。

2   结果与分析

2.1   绵羊GP5基因开放阅读框分析

开放阅读框(Open reading frame,ORF)是一段从启动子到终止子,中间无终止序列打断的能编码蛋白质的碱基序列。通过识别ORF可以快速识别基因系列中的编码区域[7 ]。由绵羊GP5基因ORF分析结果(图1)可知,该序列中共识别有6个开放阅读框,其中最大开放阅读框的长度为1 620 bp(起始密码子和终止密码子分别位于1 bp处和1 620 bp处),推测其编码539个氨基酸残基。

2.2   绵羊GP5编码产物理化性质分析

蛋白基本理化性质主要包括相对分子质量、理论等电点(pI)值、氨基酸组成等[3 ]。利用ProtParam在线工具和Bioedit软件对绵羊GP5基因编码产物的理化性质进行分析,结果表明,绵羊GP5基因编码539个氨基酸残基,其分子式为C2681H4320N756O728S16,相对分子质量为59 305.38 KDa,pI为9.40。氨基酸组成如图2所示,其中亮氨酸(Leu)含量最多,所占比例为22.6%;含量最少为酪氨酸(Tyr),所占比例为0.2%。正电荷残基总数(Arg+Lys)和负电荷残基总数(Asp+Glu)分别为52、40。基因编码产物半衰期为30 h。不稳定指数为42.49,大于40.00,由此可知,GP5基因编码的产物属于不稳定蛋白。

2.3   绵羊GP5蛋白亲疏水性分析

利用ExPASy的ProtScale在线工具对绵羊GP5蛋白的亲疏水性分析的结果(图3)表明,绵羊GP5基因编码蛋白疏水性最大值为2.778(509~510位),疏水性最强;最小值为-1.800(394位),亲水性最强。从亲水性/疏水性总体来看,亲水性氨基酸明显多于疏水性氨基酸,由此推断,GP5蛋白属于亲水性蛋白。

2.4   绵羊GP5蛋白潜在信号肽剪切位点预测

通过SignalP 3.0软件对绵羊GP5蛋白潜在信号肽剪切位点进行预测,以此推断绵羊GP5蛋白是否存在信号肽序列及蛋白编码产物是否为分泌蛋白。由图4可知,在16和17位氨基酸之间存在剪切位点的可能性较大,可以推断出GP5蛋白存在信号肽序列,且属于分泌蛋白。绵羊GP5基因编码产物的C值为0.817,Y值为0.790,S值为0.992。

2.5   绵羊GP5基因编码产物亚细胞定位分析

蛋白质参与正常生命活动,必须位于特定的亚细胞区域内(如细胞核、线粒体、细胞质、内质网、高尔基体等)[8 ]。由在线工具PSORTⅡ预测的绵羊GP5基因编码蛋白的亚细胞定位结果见表1。绵羊GP5蛋白在内质网分布的概率为44.4%,在质膜和高尔基体分布的概率分别为22.2%、 33.3%。可以看出,绵羊GP5蛋白存在于内质网的概率最大,由此可推测出绵羊GP5基因编码蛋白主要在内质网中发挥生物学作用,其次在高尔基体和质膜中发挥生物学作用。

2.6   绵羊GP5蛋白跨膜螺旋结构预测

利用TMHMM在线软件对绵羊GP5蛋白跨膜螺旋结构进行分析预测的结果(图5)表明,在494~516位氨基酸之间存在1段跨膜结构,其中第1~493位氨基酸在细胞膜外,第517~539位氨基酸在细胞质内。

2.7   绵羊及其他物种GP5基因编码产物序列同源性比对

通过DNAMAN软件对人、兔子、家鼠、牛、猪、绵羊、马、鸡等8个物种的GP5蛋白进行多序列比对(图6)及同源树分析(图7)的结果表明,该基因在各个物种中都有表达。绵羊与牛、猪等物种同源性较高,其中与牛的同源性高达95%,与鸡同源性较低。

2.8   绵羊GP5蛋白保守结构域分析

保守结构域是在生物进化或一个蛋白家族中具有不变或相同的结构域,而且保守结构域具有重要的功能,不可改变,是基因的核心。通过Smart软件对绵羊GP5基因编码蛋白的保守结构域进行分析,从图8、表2可以看出,绵羊GP5蛋白第494~516位氨基酸残基存在跨膜区,第2~16位氨基酸残基为低复杂性区域,第421~473位氨基酸残基有1个LLRCT的结构域。

2.9   绵羊GP5蛋白二级结构的预测

蛋白质结构分析是蛋白质组学研究的重要组成部分,通过对新发现的蛋白质分子结构等的分析,可为预测新基因的结构和功能提供参照[8 ]。通过在线工具Jpred4分析绵羊GP5蛋白二级结构的结果见图9。绵羊GP5蛋白有45个α螺旋(alphahelix,Hh),所占比例为8.35%;β折叠(extendedstrand, Ee)79个,占14.66%;无规卷曲(Random coil,-)415个,占70.14%。可以看出,绵羊GP5蛋白的二级结构以无规卷曲为主。

2.10   绵羊GP5蛋白三级结构的预测与分析

蛋白质的高级结构的预测和分析对理解蛋白质结构和功能之间的关系有重要意义[8 ]。通过在线工具Swiss-model对绵羊GP5蛋白三级结构的预测和分析(图10)可知,GP5基因编码蛋白的三级结构主要是无规卷曲折叠缠绕形成的,与二级结构的预测结果一致。

3   结论

选取NBCI数据库中人、兔子、家鼠、牛、猪、绵羊、马、鸡等8个物种的GP5基因的蛋白质序列及绵羊GP5基因的mRNA序列,采用生物信息学分析方法对绵羊GP5基因的功能和编码蛋白结构等进行分析。结果表明,绵羊GP5基因包含一个最大的开放阅读框,其长度为1 620 bp;编码539个氨基酸残基,其中,亮氨酸含量最多(22.6%),酪氨酸含量最少(0.2%)。相对分子质量为59 305.38 KDa,理论等电点为9.40。绵羊GP5基因编码产物属不稳定蛋白,其富含亲水氨基酸,属于亲水性蛋白。绵羊GP5基因编码产物中存在信号肽序列,属于分泌蛋白,且存在1段跨膜区,属跨膜蛋白。绵羊GP5基因主要在内质网(44.4%)中发挥生物学作用,其次在高尔基体(33.3%)和质膜(22.2%)中发挥生物学作用,且编码的蛋白有1段跨膜结构。GP5基因在牛、猪、家鼠、马等多个物种中都有表达,其中与牛的同源性高达95%,与鸡的同源性较低。绵羊GP5基因编码产物的二级结构主要为无规则卷曲,三级结构主要由无规卷曲折叠缠绕而成。

参考文献:

[1] 赵益明,阮长耿.  活化血小板分子标志物:P-选择素、糖盏蛋白和糖蛋白V的研究进展[J].  血栓与止血学,2005(2):85-87.

[2] ROTH GERALD J,CHURCH TODD A,MCMULLEN BRAD A,et al.  Human platelet glycoprotein V:A surface leucine-rich glycoprotein related to adhesion[J].  Academic Press,1990,170(1):153-161.

[3] 李   娜,王維民,张德印,等.  绵羊ADRA1B基因生物信息学分析[J].  甘肃农业科技,2019(9):42-48.

[4] 张小雪,潘香羽,李发弟,等.  绵羊GDF9基因生物信息学分析[J].  甘肃农业科技,2014(8):18-21.

[5] 胡   斐,吕慎金,金   一,等.  绵羊FSHR基因生物信息学分析及其器官表达规律研究[J].  黑龙江畜牧兽医,2019(3):24-27;31;177.

[6] 臧胜芹,陈晓勇,杨   凌,等.  绵羊Cytb基因生物信息学分析[J].  江苏农业科学, 2018,46(18):24-27;37.

[7] 隋景巍.  绵羊PTGER3基因生物信息学分析[J].  乡村科技,2017(11):52-55.

[8] 杨   文,沈   文,郭海英,等.  新疆巴什拜羊BPI基因序列的生物信息学分析[J].  畜牧与兽医,2014,46(12):19-24.

(本文责编:杨    杰)

猜你喜欢
生物信息学分析绵羊
在雨中“躲雨”的绵羊
绵羊和牧羊犬
绵羊和小鸟
羊和牧羊犬
斑节对虾金属硫蛋白全基因DNA克隆及生物学信息分析
雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析
西瓜食酸菌CusB蛋白的生物信息学分析
羊种布氏杆菌3型Omp25基因序列及其表达蛋白生物信息学分析
巧计得绵羊
西藏牦牛NGB基因克隆及生物信息学分析