绵羊Cytb基因生物信息学分析

2018-10-16 07:13臧胜芹陈晓勇孙洪新敦伟涛梁瑞圆
江苏农业科学 2018年18期
关键词:绵羊磷酸化线粒体

臧胜芹,陈晓勇,杨 凌,孙洪新,敦伟涛,梁瑞圆

(1.河北省畜牧兽医研究所,河北保定071000;2.河北工程大学生命科学与食品工程学院,河北邯郸056038)

线粒体DNA(mitochondrial DNA,mtDNA)具有分子量小、进化速度快、母性遗传等特点,因而mtDNA是研究分子进化的重要材料[1-2]。mtDNA的复制、转录及蛋白质合成均依赖于核基因编码的各类蛋白质因子的调控[3]。细胞色素 b(cytochrome b,Cytb)是由mtDNA 13个多肽编码基因之一,编码产物为线粒体氧化磷酸化系统复合体Ⅲ组成之一,也是其中唯一由线粒体基因组编码的蛋白质[4],是线粒体呼吸链上进行电子传递的细胞色素之一。细胞色素b的结构特征是都以血红素b作为辅基而且并不通过卟啉环边基与蛋白链共价结合。研究得比较多的只有细胞色素b5(Cytb5),它是一种膜蛋白质。根据晶体X射线分析推出,肽链组装成一个桶状构象把血红素部分盛在“桶”中:几片β片组成桶底,4个短的α螺旋(α1、α3、α4及 α5)构成四壁[5]。Cytb 基因广泛应用于分子进化和系统发育研究,但有关绵羊Cytb基因编码产物的研究很少。

为此,本研究通过测定湖羊Cytb基因CDS区序列,利用生物信息学方法,进行不同物种Cytb基因系统发育分析,对绵羊Cytb基因CDS区序列蛋白质的理化性质、二级结构及多参数预测、蛋白质跨膜结构和信号肽预测、亚细胞定位和蛋白质磷酸化、功能结构域、三级结构等进行分析,旨在为绵羊Cytb基因结构与功能研究提供参考。

1 材料与方法

1.1 Cytb基因序列来源

采集湖羊血液,提取DNA,参照文献[6]合成引物扩增Cytb基因,将PCR产物测序获得该基因序列。具体如下:上游引物:5'-GTCATCATCATTCTCACATGGAATC-3';下游引物:5'-CTCCTTCTCTGGTTTACAAGACCAG-3'。产物序列长度1 272 bp。由上海生工生物工程有限公司合成。PCR反应体系 30 μL:DNA 2.4 μL,10 × PCR Buffer 3 μL,dNTP(10 mmol/L)0.6 μL,上、下游引物(10 mmol/L)1.2 μL,Taq DNA Polymerase(5 U/μL)0.18 μL,ddH2O 21.42 μL。PCR反应条件:95℃预变性5 min;95℃变性20 s,退火30 s,72℃延伸90 s,35个循环;72℃延伸7 min。将扩增产物使用1.0%的琼脂糖凝胶电泳检测,120 V电泳35 min,使用凝胶成像仪检测结果后,送上海生工生物工程有限公司进行双向测序。并利用DNAman软件对测得的湖羊Cytb基因进行翻译获得氨基酸序列。

此外,从NCBI网站的GenBank下载山羊、家牛、野猪、家犬、家马、小家鼠、家猫、黑猩猩、大猩猩、人、原鸡、斑马鱼等12个物种31条相似度较高的(一般为80%以上)Cytb基因CDS及其对应的氨基酸序列(表1)。

1.2 分析方法

使用 NCBI网站中的(http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi)查找开放阅读框功能,利用 BioEdit Sequence Alignment Editor对32条核苷酸序列和与之对应的32条氨基酸序列进行Fas格式转换,利用NCBI网站Blast软件进行核苷酸和氨基酸的同源性比对分析;利用Clustal X[7]和MEGA 6.0[8]软件的邻接法(neighboe - joiningmethod,NJ)构建系统发育树;利用在线软件(http://web.expasy.org/protparam/)以及DNAStar里的Protean分析蛋白质理化性质;利用JPred4在线软件预测二级结构;利用DNAStar程序包里Protean软件分析亲水性、柔韧性、抗原指数和氨基酸表面可及性等参数;利用 TMHMM 在线软件(http://www.cbs.dtu.dk/services/TMHMM/)进行蛋白质跨膜结构分析;利用SignalP在线软件(http://www.cbs.dtu.dk/services/SignalP - 4.0/)进行蛋白质信号肽分析;利用 PSORT进行亚细胞定位分析;利用NetPhos 2.0 Server(http://www.cbs.dtu.dk/services/NetPhos/)对Cytb基因编码蛋白质进行磷酸化位点预测;利用SWISSMODEL预测蛋白质的三级结构。

表1 12个物种的Cytb基因序列来源

2 结果与分析

2.1 绵羊Cytb基因开放阅读框分析

通过ORF Finder分析表明,绵羊Cytb基因的ORF长度为1 140 bp,编码379个氨基酸。

2.2 绵羊Cytb基因序列同源性及分子进化分析

通过NCBI进行同源性在线分析,湖羊、人、山羊、家牛、斑马鱼、家马、家猫、原鸡、大猩猩、小家鼠、黑猩猩、野猪和家犬的13个物种Cytb基因序列以及氨基酸序列进行比对,结果显示,湖羊与山羊的相似性最高,其次是家牛,最后与原鸡和斑马鱼一致性最低(表2)。系统发育树显示,湖羊和山羊亲缘关系最为接近,其次是家牛,与原鸡、斑马鱼等亲缘关系较远(图1)。这与核苷酸一致性分析一致,符合物种进化规律。

2.3 绵羊Cytb基因编码蛋白质结构分析

2.3.1 理化性质分析 绵羊Cytb基因编码蛋白质由379个氨基酸残基组成,其分子式为C3583H6028N1140O1451S324分子量为98.68 ku,理论等电点(pI)为5.0,说明该蛋白质为酸性蛋白质。其不稳定系数为64.20,说明该蛋白质为不稳定蛋白质,且预计在体外哺乳动物的网织红细胞内半衰期为4.4 h,在酵母体内的半衰期>20 h,在大肠杆菌体内>10 h,脂溶指数为31.49,总平均疏水指数1.035,属于疏水蛋白质。含有20种常见氨基酸残基(图2),其中Leu(13.98%)含量最高,其次Ile(11.87%)含量较高。带负电荷的氨基酸残基(Asp+Glu=0)等于带正电荷的氨基酸残基(Arg+Lys=0)。其摩尔消光系数为 88 850 L/(mol·cm),1A(280)=0.48 mg/mL,等电点是 7.52,pH 值为 7 时,带电量为 1.78。

表2 绵羊Cytb基因核苷酸和氨基酸序列与其他动物的一致性分析

2.3.2 Cytb结构蛋白质二级结构及多参数分析 蛋白质二级结构是指蛋白质分子中多肽链本身的折叠方式,蛋白质分子的多肽链一般是部分卷曲盘旋成螺旋状(α-螺旋结构),或折叠成片层状(β-折叠结构),或以不规则卷曲结构存在于生物体内[9]。

Gamier_Robson方法是通过计算特定氨基酸残基在特定结构内部的可能性来预测蛋白质的二级结构的。用该方法预测Cytb结构蛋白质二级结构,发现它有α螺旋形成,同时有许多β折叠存在,且分布比较均匀,在各β折叠单元之间存在长短不一的转角(图3)。该方法预测的结果还显示,在该蛋白质的跨膜区有一些α螺旋结构形成。

Chou_Fasman方法是通过序列氨基酸残基的晶体结构来预测二级结构,用该方法预测Cytb结构蛋白质二级结构,发现它有α螺旋结构形成,其位置分别在第His 8-Val 14、lys 172-Glu 202、Gln 312-Met 316和 Gly351-Trp379区段(图3)。相应地,用该方法预测的β折叠和转角结构就较少且主要处于该蛋白质的两端。

组成Cytb蛋白质二级结构的α螺旋(HELIX,H)、β折叠(STRAND,E)、无 规 卷 曲 (LOOP,L) 的 比 例 为64.91 ∶0.79 ∶34.30(图4)。

Cytb结构蛋白质的亲水性分析:用Kyte_Doolittle方法对Cytb结构蛋白质的亲水性进行了分析。结果显示该蛋白质存在较少的亲水性区域,但其中亲水性较高的区域主要集中在:Glu 202-Thr 225、Leu 249-Glu 271和 His 308-Arg 318提示该区域暴露于表面的几率较大,作为抗原表位的可能性也最大(图5)。

Cytb结构蛋白质的表面可能性分析:在表面可能性较大的区域主要是 Ile 4-Met 11、His 32-Thr 60、Thr 203-Lys 227、Leu 249-Glu 271和Thr 309-Met 315区段,其他部位展示的可能性较小(图5)。

Cytb结构蛋白质骨架区的柔韧性分析:含有一些的柔韧性区域,且分布比较均匀,提示该蛋白质肽段有一定的柔韧性,可以发生扭曲、折叠,能形成比较丰富的二级结构(图5)。

Cytb结构蛋白质B细胞抗原表位的预测分析:通过联合以上蛋白质结构预测方法分析Cytb结构蛋白质潜在的蛋白质抗原决定簇,结果显示结构蛋白质含有一些抗原指数较高的区域,其中以羟基端的指数性最高,所跨区域也最大(Asp 248-Glu 271),提示该区段含有潜在优势抗原表位,其他一些区段也可能含有一些潜在的抗原表位,如,Thr 203-Lys 227等,这些区域的抗原指数也比较高,蛋白质抗原指数较高的区域与其亲水性较高区域的分布较为一致,这些区域可能包含潜在优势的抗原表位(图5)。

2.3.3 蛋白质跨膜结构和信号肽分析 从图6可以看出,Cytb蛋白质共存在9个典型的跨膜螺旋区,氨基酸序号分别为33 -55、76-98、113-135、140-158、178 -200、229 -251、288-310、323-340和350-372。由此可推测,绵羊Cytb基因CDS区所编码的蛋白质为跨膜蛋白质,提示它可能作为膜受体起作用,也可能是定位在膜上的锚定蛋白质或离子通道蛋白质。

从图7可以看出,Cytb蛋白质的C、Y和S值的计算结果不具备信号肽的要求,表明绵羊Cytb蛋白质不存在信号肽故该蛋白质为非分泌蛋白质。

2.3.4 亚细胞定位和蛋白质磷酸化分析 亚细胞定位可以明确某种蛋白质或表达产物在细胞内的具体存在部位。经亚细胞定位分析表明,该序列主要在内质网(77.8%)、细胞核(11.1%)、线粒体(11.1%)内发挥其生物学作用。蛋白质磷酸化是调节和控制蛋白质活力和功能的重要机制。该蛋白质经磷酸化分析显示(图8),绵羊Cytb蛋白质有较多的苏氨酸(Thr)以及丝氨酸(Ser)磷酸化位点和相对较少的酪氨酸(Tyr)磷酸化位点。

2.3.5 高级结构预测与分析 利用SWISS-MODEL预测蛋白质的三级结构,结果(图9)显示,绵羊Cytb蛋白质序列与Blast数据库中5j4z.53.A模板序列相似性高达61%,该蛋白质存在较多的扭曲,结构较为丰富,该结果同时也表明了绵羊Cytb由α-螺旋、β-折叠和无规则卷曲组成,与二级结构预测一致。而这些结构对其生物学功能的发挥有重要作用。

3 讨论

在线粒体DNA(mtDNA)的13个蛋白质编码基因中,Cytb的结构功能最为清楚[10-11]。Cytb主要存在于内膜磷脂中,在线粒体蛋白质编码基因中有着十分重要的作用,在氧化磷酸化过程中作为电子传递的重要媒介,其自身可以在线粒体内进行转录和翻译。Cytb基因的进化速度相对来说比较适中,通常被人们用来研究种内、近缘种间以及种间亲缘关系,成为一种重要的区分手段[12]。在对不同物种同源性及系统发育分析可知,湖羊与山羊亲缘关系最近,其次是与牛亲缘关系最近,其中偶蹄目最先聚为1支,再与灵长类动物聚在一起,最后与原鸡、斑马鱼等聚在一起。绵羊Cytb基因共编码379个氨基酸。

常见的蛋白质二级结构有α-螺旋、β-折叠、转角和无规则卷曲等。绵羊的Cytb基因编码蛋白质以α-螺旋和无规则卷曲为主。蛋白质分子构象主要靠非共价键维持,蛋白质结构的稳定在很大程度上有赖于分子内的疏水作用,从各种因素的作用来看,疏水作用是非常重要的[13]。经分析绵羊Cytb基因编码蛋白质为酸性、不稳定性疏水蛋白质。一般信号肽位于分泌蛋白的N端,通过判断蛋白质是否含有信号肽部分,可以初步推测该蛋白质是否为分泌蛋白[14],结果分析表明,Cytb蛋白质既不存在信号肽,也不是分泌蛋白质。绵羊Cytb基因编码蛋白质有9个跨膜结构域,这与刘安芳等对家鹅线粒体细胞色素b跨膜螺旋结构分析得出的结果[15]一致。Cytb主要在内质网、细胞核、线粒体内发挥其生物学作用,与线粒体DNA的各种功能和调节有着密切的关系。蛋白质磷酸化的表达直接影响蛋白质活力和功能的调节,是最重要的机制,绵羊Cytb蛋白质的苏氨酸和丝氨酸磷酸化位点比较多,酪氨酸的磷酸化位点相对较少,苏氨酸和丝氨酸磷酸化的主要作用是激活蛋白质的活力,结果表明该蛋白质酶活力较强[16]。

猜你喜欢
绵羊磷酸化线粒体
棘皮动物线粒体基因组研究进展
线粒体自噬与帕金森病的研究进展
ITSN1蛋白磷酸化的研究进展
数绵羊
数绵羊
奔跑的绵羊
磷酸化肽富集新方法研究进展
巧计得绵羊
MAPK抑制因子对HSC中Smad2/3磷酸化及Smad4核转位的影响
NF-κB介导线粒体依赖的神经细胞凋亡途径