楚秋霞,陈付英,王志方,冯亚杰,徐照学*,王荷香
(1.河南省农业科学院畜牧兽医研究所,河南 郑州 450008;2.河南农业职业学院,河南 郑州 451090)
南阳牛BoLA-DRA基因编码区生物信息学分析
楚秋霞1,陈付英1,王志方1,冯亚杰1,徐照学*1,王荷香2
(1.河南省农业科学院畜牧兽医研究所,河南 郑州 450008;2.河南农业职业学院,河南 郑州 451090)
[目的]预测南阳牛BoLA-DRA编码蛋白区的理化性质和结构特征。[方法]运用生物信息学分析软件。[结果]DRA基因与其它物种核苷酸序列的同源性均在90%以上。进化树分析羊与牛在同一个分支上,亲缘关系最近。BoLA-DRA编码蛋白为疏水性蛋白,1个跨膜螺旋的膜蛋白,7个功能结构域,6个翻译后修饰位点。预测N末端包含信号肽序列,其切割位点位于26~27位的氨基酸之间。亚细胞定位该蛋白定位在细胞膜上,由α螺旋结构,β折叠结构、β转角结构和无规则卷曲结构形成二级结构。[结论]本试验初步获得了BoLA-DRA编码蛋白区生物信息学分析数据。
牛;主要组织相容性复合物;DRA;生物信息学
主要组织相容性复合体(majorhistocompatibility complex,MHC),是由紧密连锁的高度多态基因座所组成的染色体上的一个遗传区域[1]。MHC的发现是在20世纪30年代进行小鼠皮肤移植试验中发现的。MHC在对抗感染和对许多自身免疫性疾病的易感性方面有重要作用。1978年,Amorena首次报道了牛的MHCⅠ抗原并将牛的MHC命名为牛白细胞抗原(Bovine Lymphocyte Antigen,Bo-LA),位于牛的第23号染色体上[2]。牛的 MHC分为Ⅰ类、Ⅱ类和Ⅲ类;MHC的多态性集中在Ⅱ类区域的DR和DQ亚区的基因上,在其免疫系统中发挥着主要的作用[3]。文献报道,MHC基因与生物体的数量性状具有相关性,例如,抗病性、生长率和脂肪酸沉积等,以至于研究人员对MHC进行大量的研究[4]。BoLA-DRA基因位于Ⅱ类区域的DR亚区的基因,DR基因座中包含 DRA、DRB1、DRB2、DRB3四个基因位点,其中DRB3是唯一高度表达的基因,具有高度的多态性,它编码一个功能性限制因子;DRA基因可以表达,但多态性有限。目前,研究人员主要集中在DRB3基因的研究,对DRA基因的研究还不够多。本研究采用生物信息学方法对BoLA-DRA基因及其编码产物的理化性质、序列、蛋白质结构、进化树构建以及生物学功能进行预测和分析,初步从分子水平上了解BoLA-DRA基因基本结构和生物学功能,为进一步研究牛BoLA-DRA基因与疾病的抗病机理提供一定的参考。
将已克隆的BoLA-DRA基因进行测序[5]。同源性分析采用http://www.ncbi.nlm.nih.gov/中BLAST软件;进化树构建采用MEGA5软件;预测蛋白的理化性质采用ExPasyhttp:www.expasy.org/tools;信号肽预测采用http://www.cbs.dtu.dk/services/SignalP/;预测亚细胞定位采用http://psort.nibb.ac.jp/form2.html;预测蛋白质结构域采用http://www.expasy.org/prosite/ 和http://smart.embl-heidelberg.de/;预测二级结构采用DNASTRAR 6.0软件;预测跨膜结构采用http://www.cbs.dtu.dk/services/TMHMM-2.0/。
经测序分析,BoLA-DRA基因CDS区全长762 bp。由A、T、G、C四种碱基组成,分别为24.8%、23.5%、24.9%、26.8%。物种间进行 BLAST 比对,BoLA-DRA核苷酸序列与其他物种间一致性均在90%以上。以上数据显示,该基因具有高度保守性。
BoLA-DRA基因CDS区编码253个氨基酸,该蛋白分子量为28.356kD,理论等电点为5.09。不稳定指数和脂肪系数分别为47.74和24.8,亲水性值为0.852,说明该蛋白是一个疏水蛋白。在该蛋白的20种氨基酸中,碱性氨基酸占30%,酸性氨基酸占49%。表明酸性氨基酸多于碱性氨基酸,该蛋白呈酸性,是一种酸性蛋白,与预测等电点pI=5.09相符。
应用BIOXM软件进行序列比对,结果显示,BoLA-DRA的氨基酸序列与羊的同源性最高为88%;与人、猫、马、野猪、黑猩猩、兔的同源性分别为76%、77%、79%、75%、76%、75%。应 用 MEGA 5.0软件NJ法得出了基于DRA基因氨基酸序列9个物种的系统进化树(图1)。分析可知BoLA-DRA基因与羊在同一个分支上,亲缘关系最近。
通过翻译后修饰位点分析,理论推测该蛋白磷酸化位点有5个(Ser:1,Thr:2,Tyr:2),糖基化位点1个。蛋白质的磷酸化可以调节蛋白质的活性。磷酸化和糖基化是蛋白质翻译后修饰与蛋白质的功能密切相关。
应用 TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)对BoLA-DRA基因推导氨基酸序列进行跨膜结构预测。结果发现,BoLA-DRA蛋白是一种具有1个跨膜螺旋的膜蛋白,由胞外区(1~217位氨基酸)、跨膜区(218~240位氨基酸)和胞内区(241~253位氨基酸)3部分构成的跨膜蛋白,预示着BoLA-DRA蛋白在细胞内作为一种膜受体,胞外区识别外界信号,并通过信号转导途径,引起细胞内生理生化反应。
所谓结构域是指蛋白质序列功能、结构和进化的单元,通常由50~300个氨基酸组成,有空间构象特异性。单条蛋白质序列可以包含一个或多个结构域。利用网上在线工具,分析BoLA-DRA蛋白的结构域,结果表明,此蛋白包含46~54,280~288,431~439 氨基酸区域的 2FE2S(2Fe-2Sferredoxintype iron-sulfur binding region);299~314氨基酸区域的IGFBP (Insulin-like growth factor-binding protein);376~411氨基酸区域的 ANAPHYLATOXIN(Anaphylatoxin domain);452~507氨基酸区域的VWFC(VWFC domain);第628~639氨基酸区域的EGF(Epidermal growth factor-like domain)特征功能结构域(图2)。
图2 牛BoLA-DRA蛋白结构域预测分析结果
预测蛋白质结构的同时,对其进行信号肽分析有助于蛋白质功能域的区分及蛋白质细胞定位。信号肽是指N端起始密码子ATG之后的一组密码子的产物,一般为20~30个氨基酸,其作用是引导蛋白质的分泌。采用SignalP4.0Server prediction软件分析,预测该蛋白1~25个氨基酸是信号肽序列(图3),即其是分泌性蛋白质。可以被分泌至内质网膜,促使蛋白进入细胞外,参与细胞因子作用。
图3 南阳牛BoLA-DRA蛋白的信号肽预测结果
利用亚细胞定位程序(http://psort.nibb.ac.jp/form2.html),预测BoLA-DRA蛋白的亚细胞定位情况,结果发现,该蛋白可能位于四个细胞器中,位于细胞膜的概率为60.9%,内质网概率为30.4%、空泡和高尔基体概率都为4.3%。与该蛋白质的疏水性和跨膜区分析的结果一致,BoLADRA为疏水性的蛋白质,是一种具有跨膜螺旋的膜蛋白。
利用DNASTRAR6.0软件中的Protean程序和在线工具SWISS-MODEL对BoLA-DRA蛋白的二级结构进行了预测,二级结构运用了两种算法,预测得到的α螺旋结构,β折叠结构、β转角结构和无规则卷曲结构(图4)。
图4 牛BoLA-DRA蛋白的二级结构预测结果
MHC分子几乎在所有脊椎动物中都存在高度多态性和连锁不平衡两个显著特点,对MHC遗传变异分析可以提供物种的遗传多样性,因而具有重要的生物学意义。通过序列分析软件对BoLA-DRA基因进行预测,CDS区序列的大小为762bp终止密码子为 TGA。BoLA-DRA基因CDS区核苷酸序列与其他物种间一致性均在90%以上。氨基酸序列与羊、人、猫、马、野猪、黑猩猩、兔7个物种同源性在75%~88%,说明该基因具有稳定的保守区。进化树分析显示,牛和羊聚为一类,BoLADRA基因与羊的亲缘关系最近。核苷酸序列相似性分析和分子进化树结果相符合,这与动物学分类结果一致,这种同源性在一定程度上代表着物种亲缘关系的远近,同时也反映了BoLA-DRA编码产物在不同物种的结构上的稳定性对生物体的功能重要性。
决定蛋白质结构类型和稳定性的一个最重要的因素是氨基酸序列的疏水性。通过预测亲水性值为0.852,说明该蛋白是一个疏水蛋白,易形成跨膜结构。Kyte等的研究表明,通过氨基酸序列的疏水性可以预测膜蛋白的结构。通过对膜蛋白跨膜结构的预测能为该蛋白的功能研究提供重要线索。跨膜结构预测该基因具有1个跨膜螺旋的膜蛋白,这就为配体的特异性结合提供了受体的分子基础,具体生物学功能有待进一步研究。结构域分析预测,该蛋白包含7个特征功能结构域,预测该蛋白具有免疫应答、胁迫应答、信号转导、受体等功能,可能对牛免疫力和抗病性起关键作用。该基因由α螺旋结构,β折叠结构、β转角结构和无规则卷曲结构构成二级结构,主要定位在细胞膜中,属于分泌型蛋白。具有信号肽的分泌蛋白,往往作为重要的细胞因子在生物体的生长、发育以及细胞凋亡过程中发挥重要的作用。信号肽预测N段肽链第26-27bp为剪切位点,因此在剪切位点进行修饰可能会提高该基因的表达。本研究利用生物信息学分析软件对Bo-LAZ-DRA基因和蛋白序列进行初步的预测,研究结果将为进一步研究BoLA-DRA基因与疾病性状相互作用的机制提供参考。
[1]林 剑.免疫遗传学[M].北京:高等教育出版社,1997.
[2]Amorena B,Stone W H.Serologically defined (SD)locus in cattle[J].Science,1978,201(4351):159-161.
[3]金伯泉.细胞和分子免疫学[M].3版.北京:科学出版社,2001.
[4]Renard C,Hart E,Sehra H,et al.The genomic sequence and analysis of the swine major histocompatibility complex[J].Genomics,2006,88:96-110.
[5]楚秋霞,徐照学,施巧婷,等.南阳牛BoLA-DRA基因的克隆及其在大肠埃希菌中的表达[J].动物医学进展,2010,31(6):5-10.
Bioinformatics Analysis on Coding Regions of BoLA-DRA Gene in Nanyang Cattle
CHU Qiu-xia1,CHEN FU-ying1,WANG Zhi-feng1,FENG Ya-jie1,XU Zhao-xue*1,WANG He-xiang2
(1.Institute of Animal Husbandry and Veterinary Medicine,Henan Academy of Agriculture Science,Zhengzhou Henan 450008;2.Henan Vocational College of Agriculture,Zhengzhou Henan,451090)
【Objective】To predict the physicochemical properties and structural characteristics of BoLADRA protein of Nanyang cattle.【Method】The BoLA-DRA gene and its encoding products were analyzed using bioinformatics analysis softwares.【Results】The nucleotide sequence of cording region(CDS)of Bo-LA-DRA gene of Nanyang cattle shared over 90%homology with other species.Phylogenetic tree analysis showed that the cattle had the closest genetic relationship with sheep and they were in same branch.The BoLA-DRA encoding product was a hydrophobic protein,having one membrane protein with one transmembrane helix,seven functional domains,and six post-translational modification sites.Signal peptide sequence of N-terminal was predicted,and the cleavage site was located between 26and 27amino acid.Subcellular localization showed that this protein was located in cell membrane.The secondary structure of the protein was formed by the alpha helical structure,beta-folded structure,beta turn structure and random coil structure.【Conclude】The work had provided the useful bioinformatics date for the bovine BolA-DRA protein.
cattle;MHC;DRA;bioinformatics analysis
S823.2
A
1001-9111(2013)06-0028-04
2013-09-12
2013-10-25
国家肉牛产业技术体系项目(CARS-38)
楚秋霞(1984-),女,河南许昌人,助研,主要从事动物胚胎工程研究。
*通讯作者:徐照学(1961-),男,陕西华县人,研究员,主要从事动物胚胎工程研究。