牛SCD1基因的生物信息学分析

2017-01-18 01:41周秀敏李强子毕英杰任卫合
现代畜牧兽医 2016年12期
关键词:信息学氨基酸编码

周秀敏,李强子,毕英杰,任卫合,张 丽

(西北民族大学生命科学与工程学院,甘肃 兰州 730030)

牛SCD1基因的生物信息学分析

周秀敏,李强子,毕英杰,任卫合,张 丽⋆

(西北民族大学生命科学与工程学院,甘肃 兰州 730030)

本研究利用生物信息学方法分析和预测牛SCD1基因的理化特性和编码产物的结构。结果表明牛SCD1基因编码359个氨基酸,平均分子质量为41.71 kDa;组成蛋白为不稳定的水溶性蛋白,三级结构由μ-螺旋和无规则卷曲组成,并且牛SCD1基因氨基酸序列和山羊亲缘关系最近。牛SCD1基因的生物信息学分析为进一步研究牛SCD1基因的遗传特性和生理机制奠定了基础。

牛;SCD1基因;生物信息学

硬脂酰辅酶A去饱和酶(Stearoyl-CoA desaturase-1,SCD)是一种合成单不饱和脂肪酸的限速酶,参与细胞的新陈代谢和前体脂肪细胞的分化。SCD基因的表达及其产物的活性决定了脂肪细胞单不饱和脂肪酸的合成及细胞膜憐脂和甘油三酯的组成,不仅与人类相关疾病如肥胖症、糖尿病及高血压等密切相关,也是改善牛奶和牛肉品质的主要候选基因[1]。牛SCD1基因位于26号染色体,由6个外显子和5个内含子组成,在脂肪组织和乳腺组织都有表达[2]。王小龙等[3-4]表明SCD1基因与牛奶中饱和脂肪酸和单不饱和脂肪酸的比例及总不饱和指数有关,并且带基因对牛乳中的乳脂率和乳蛋白率有极大影响。

为深入探讨牛SCD1基因的性质和功能,避免人工选育和该基因演化造成的差异,本研究利用生物信息学方法从分子水平对牛SCD1基因序列结构及相关生物信息学特征进行预测和分析,同时构建系统发育进化树,为揭示该基因理化性质、功能信息、遗传特性及相关生理机制提供理论基础。

1 序列来源与方法

1.1 牛SSCCDD 11基因序列来源 从Gene Bank中查找得牛的SCD1基因的全长编码区序列(Coding sequenc-es,CDS)(Genebank no.AY241932)。

1.2 方法 对牛SCD1基因CDS编码产物的氨基酸序列、其蛋白质特性及功能结构域进行分析与预测所用各种工具软件与网址见表1。

表1 牛SCD1基因进行生物信息学的主要软件Table 1 The main software ofSCD1gene bioinformatics in cattle

2 结果

2.1 牛SSCCDD 11基因编码蛋白质理化特性预测与分析

蛋白质的基本性质包括其相对分子质量、氨基酸组成和等电点等,其预测结果见表2。牛SCD1基因编码359个氨基酸,20种氨基酸所占比例如图1,亮氨酸(Leu)数目最多,为41个,占整个氨基酸组成的11.4%,半胱氨酸(Cys)目最少,为3个,占0.8%。基因编码产物不稳定指数大于40,表明该基因编码产物不稳定[5]。

表2 牛SCD1基因编码蛋白质理化特性Table2 The encoding a protein physicochemical properties ofSCD1gene in cattle

2.2 牛SSCCDD 11基因编码蛋白质疏水性//亲水性预测和分析 牛SCD1基因编码氨基酸序列亲水性/疏水性预测结果如图2所示,其中第64位蛋氨酸(Met)亲水性最强(-2.867);第225位的丙氨酸(Ala)疏水性最强(+3.200)。整个编码产物中,亲水氨基酸占63.23%,疏水氨基酸占 36.74%,总平均数为-0.223,表现为亲水性,由此可推断编牛SCD1基因编码的蛋白质是一种可溶性蛋白。

2.3 牛SSCCDD 11基因编码蛋白质三级结构预测与分析本研究采用SWISS-MODEL同源建模方法对牛SCD1基因编码产物进行分析,并用PyMOL软件进行编辑(图3),结果显示,牛SCD1主要由α-螺旋、无规则卷曲-组成。用Came中的ProSa对SCD1氨基酸序列3D模型中总能量进行评估[6-7],确定此模型的立体构象合理,符合立体化学二面角分布和能量的要求。

2.4 牛SSCCDD 11基因编码蛋白系统发育分析 利用Mega 6.0软件对牛、山羊、小家鼠、大白鼠、绿头鸭、大黄鱼及三角帆蚌SCD1基因编码的氨基酸序列构建系统发育树(图4)。SCD1基因几乎在所有的动物中都有表达,从进化树可看出同为偶蹄目牛和山羊聚为一类,亲缘关系最近,与为软体动物的三角帆蚌亲缘关系最远,啮齿目中鼠类聚为一类,禽类、鱼类以及软体动物各自聚为一类,这与动物分类学基本一致。

3 讨论

硬脂酰辅酶A去饱和酶I是单不饱和脂肪酸生成过程中的关键酶酶,单不饱和脂肪酸能影响牛肉大理石花纹等级、深加工性能、脂肪柔软度以及牛肉的风味等质量[8]。因此对牛SCD1基因的深入研究能对牛的肉质性状提供重要理论基础。

图1 牛SCD1基因编码蛋白氨基酸组成Fig.1 The encoding a protein amino acid composition ofSCD1gene in cattle

图2 牛SCD1基因编码蛋白质的疏水性预测结果Fig.2 The encoding a protein hydrophobic predictions ofSCD1gene in cattle

基因决定生物的性状,但最终是由蛋白质来体现的。目前对SCD基因的生物信息学分析仅见于羊[9-10]、猪[11]、乌贼[12]和鸭[13]。本研究通过SCD1蛋白质的理化性质、疏水性/亲水性、蛋白质三级结构预测牛SCD1蛋白功能。从预测结果来看,牛SCD1蛋白是由359个氨基酸折叠而成的不稳定亲水蛋白,其氨基酸数目与羊[10]和猪[11]相同,但比乌贼[12]的稍长,而猪[11]和乌贼[12]的SCD蛋白是疏水蛋白这可能是物种差异造成的。有研究表明蛋白质半衰期越长则蛋白质稳定性越高[14],而牛SCD1编码蛋白质半衰期为30 h,但其不稳定系数值大于40,与猪[11]的SCD蛋白相同,均是不稳定蛋白,可能是不同基因发挥不同生理功能而出现与其的研究结果相悖。牛SCD1蛋白三级结构主要以α-螺旋和无规则卷曲为主,并未发现猪[11]SCD蛋白所报道的β-叠片。虽然猪和牛同为偶蹄目,但属不同科,因此出现了该差异。从进化树可看出同为偶蹄目牛和山羊聚为一类,亲缘关系最近,与为软体动物的三角帆蚌亲缘关系最远,啮齿目中鼠类聚为一类,禽类、鱼类以及软体动物各自聚为一类,这与动物分类学基本一致。

图3 牛SCD1基因编码蛋白质三级级结构模型预测Fig.3 Putative result ofSCD1protein tertiary structure in cattle

图4 牛SCD1基因编码蛋白质的氨基酸系统进化树(节点处数字表示置信度)Fig.4 Phylogenetic tree with amino acid sequences of SCD1 gene(bootstrap values are in dicated at nodes)

本研究系统地对牛SCD1基因的理化性质和蛋白的结构功能进行了预测,在此基础上将进一步对SCD1基因的表达差异进行探究,以期能更好地为牛的肉质性状提供理论基础,更好地将分子生物学技术应用到生产实践中去。

[1]卢建雄,刘翊中,臧荣鑫,等.鼠脂肪细胞分化过程中脂代谢相关基因转录表达时序的研究[J].中国兽医科学,2006,36(4):306-310.

[2]Myungil Chung,Seckho HA,Soonseog JEONG,et al. Cloning and Characterization of Bovine Stearoyl CoA Deasturasel cDNA from Adipose Tissues[J].Journal of Biosciences,2000,64 (7)∶1526-1530.

[3]王小龙,陈仁金,杨章平,等.中国荷斯坦牛SCD1基因多态性与泌乳性状的关联分析[J].畜牧兽医学报,2011,42(7):1022-1026.

[4]王小龙,常玲玲,陈莹,等.中国荷斯坦牛SCD1外显子5基因多态性及其对乳中脂肪酸组成的影响[J].中国农业科学,2014,47(9):1858-1864.

[5]Guruprasad K,Reddy B V B,Pandit M W.Corre-lation between stability of a protein and its dipeptide composition∶a novel approach for predicting in vivo stability of a protein from its primary sequence[J]. Protein Engineering,1990,4(2)∶155-161.

[6]Wiederstein M,Sippl M J.ProSA-web∶interactive web service for the recognition of errors in three-dimensional structures of proteins[J]. Nucleic acids research, 2007, 35 (suppl 2)∶W407-W410.

[7]Sippl M J.Recognition of errors in three-dimensional structures of proteins[J]. Proteins∶Structure,Function,and Bioinformatics,1993,17(4)∶355-362.

[8]Smith S B,Yang A,Larsen T W,et al.Positional analysis of triacylglycerols from bovine adipose tissue lipids varying in degree of unsaturation[J]. Lipids, 1998, 33(2)∶197-207.

[9]石恒波,罗军,朱越,等.奶山羊SCD基因CDS区的克隆、序列分析及过表达[J].中国农业科学,2012,45(24):5091-5101.

[10]周恒,曹艳红,朱江江,等.隆林山羊SCD基因的克隆及序列分析[J].黑龙江畜牧兽医,2016(1):80-83.

[11]曹威荣.猪硬脂酰辅酶A去饱和酶蛋白生物信息学分析[J].畜牧与饲料科学,2014,35(11):5-7.

[12]夏灵敏,马晟杰,吴常文,等.曼氏无针乌贼SCD蛋白结构和功能预测[J].浙江海洋学院学报(自然科学版),2014(2):161-164.

[13]王健,张军,张蕊,等.番鸭SCD1基因克隆、序列分析及组织表达研究[A].中国畜牧兽医学会家禽学分会第九次代表会议暨第十六次全国家禽学术讨论会论文集[C].2013.

[14]刘丽霞,张丽,赵生国,等.八眉猪DQA基因编码区多态性及生物信息学分析[J].华北农学报,2015,30(1):103-108.

Bioinformatics Analysis of CattleSCD1Gene

Zhou Xiumin,Li Qiangzi,Bi Yingjie,Ren Weihe,Zhang Li*
(College of Life Science and Engineering,Northwest University for Nationalities,Gansu Lanzhou 730030)

This study analyzed the physical and chemical characteristics and the prediction cattleSCD1gene structure and function of the encoded product between homologous bioinformatics methods.The results showed thatSCD1gene encoded 359 amino acids,and had a predicted molecular weight of 41.71 kDa,unstable protein composition soluble proteins,the tertiary structure of the alpha helix,and dandom coil.The amino acid sequence of cattle SCD1 gene was closely related to goat.The result lay a foundation for further studying on the genetic characteristics and physiological mechanisms of SCD1 gene.

Cattle;SCD1 Gene;Bioinformatic

S823

B

1672-9692(2016)12-0030-05

2016-10-15

周秀敏(1996-),女,江苏盐城人,在读本科生,研究方向为动物科学。

张丽(1980-),女,宁夏石嘴山人,博士,主要从事动物遗传育种研究。

西北民族大学引进人才科研项目(xbmuyjrc201316),西北民族大学生命科学与工程学院众创空间扶持项目。

猜你喜欢
信息学氨基酸编码
鸡NRF1基因启动子区生物信息学分析
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
月桂酰丙氨基酸钠的抑菌性能研究
初论博物馆信息学的形成
Genome and healthcare
UFLC-QTRAP-MS/MS法同时测定绞股蓝中11种氨基酸
HPLC法同时测定阿胶强骨口服液中4种氨基酸
miRNA-148a在膀胱癌组织中的表达及生物信息学分析