不同物种CDK5基因编码区生物信息学分析

2014-09-02 00:53张永改李祥龙周荣艳等
江苏农业科学 2014年7期
关键词:生物信息学物种

张永改+李祥龙+周荣艳等

摘要:采用生物信息学方法比较分析了东非狒狒、黑猩猩、裸鼢鼠、牛、欧洲雪貂、人、灰鼠猴、大猩猩、长臂猿、猪 CDK5基因编码区(CDS)的遗传多样性。结果表明,来自10个物种的47条基因序列中检测到个532多态位点,共生成30 种单倍型,物种间及物种内CDK5基因序列编码区存在较丰富的遗传多样性;理论等电点均大于6,N端无信号肽,无跨膜结构域,肽链表现为亲水性;蛋白质二级结构主要结构元件是α-螺旋、无规则卷曲。

关键词:CDK5基因;物种;生物信息学

中图分类号: Q813 文献标志码: A 文章编号:1002-1302(2014)07-0032-03

收稿日期:2013-10-17

作者简介:张永改(1987—),女,河北定州人,硕士研究生,从事动物遗传学研究。E-mail:zhangyonggai1022@126.com。

通信作者:李祥龙,博士,教授,从事动物遗传学研究。E-mail:lixianglongcn@aliyun.com。CDK5主要参与神经元正常功能的维持,但在非神经元的组织或细胞中也广泛表达并发挥作用[1]。研究表明,CDK5可能通过调节黑色素细胞核中MITFmRNA、TYR的表达,从而参与调控羊驼毛色的形成[2]。在羊驼皮肤组织中,Agouti基因、MC1R基因、酪氨酸酶基因家族、KIT基因、CDK5基因都参与了羊驼毛色的形成与调控[3]。本研究利用比较基因组学、生物信息学方法研究了该基因编码区种间、种内变异,以期探明该基因在不同种间及种内的遗传分化,进而为相关黑色素基因的遗传学分析奠定基础。

1材料与方法

1.1序列来源

2.3.3信号肽的预测、分析信号肽位于蛋白质的N端,用于指导分泌性蛋白到内质网膜上合成。利用在线工具 SignalP 3.0 Server分析人CDK5氨基酸序列的信号肽的存在位置及序列,结果显示,人的CDK5氨基酸序列无信号肽[7]。 对其余几个物种CDK5氨基酸序列的信号肽的存在位置及其序列进行相应的分析,也得到了一致的结果。

2.3.4跨膜结构域的预测和分析跨膜结构域通常是由跨膜蛋白的效应区域所显示。利用在线工具TMHMM 2.0 Server预测人CDK5氨基酸序列的跨膜结构域,结果显示,其不具跨膜结构域,在细胞膜外与细胞膜内都有CDK5肽链[8]。对其他物种CDK5氨基酸序列的跨膜结构域进行分析,得到的预测结果与人的相似。结合上述导肽的预测,可以推测CDK5在细胞质基质中合成后,很可能也要转运到膜外,该蛋白可以在细胞质与细胞膜外行使其功能。

2.3.5疏水性/亲水性的预测和分析蛋白质亲/疏水性氨基酸的组成是蛋白质折叠的主要驱动力。蛋白质在折叠时会形成疏水内核、亲水表面,同时在潜在跨膜区会出现高疏水值区域,据此可以测定跨膜螺旋等二级结构及蛋白质表面有氨基酸分布[9]。利用在线工具ProtScale预测人CDK5氨基酸序列的疏水性/亲水性,结果表明,精氨酸(Arg)具有最低分值-4.500,亲水性最强,异亮氨酸(Ile)具有最高分值4.500,疏水性最强[10]。总体来看,亲水区域明显大于疏水区域。因此,整个多肽链表现为亲水性。对其他物种CDK5氨基酸序列的疏水性/亲水性进行预测,其预测结果与人的相似,因此认为CDK5蛋白是亲水性蛋白。

2.3.6二级结构的预测和分析蛋白质的二级结构是指氨基酸残基形成的α-螺旋、β-转角、β-折叠片延伸链、无规则卷曲。用SOPMA对10个物种的CDK5氨基酸序列的二级结构进行预测,结果表明,CDK5蛋白质二级结构的主要结构元件是α-螺旋(39.73%~42.81%)、无规则卷曲(34.93%~38.70%),其次是β折叠延伸链(13.46%~14.73%)、β-转角(6.75%~8.85%)[11-13]。

3结论

本研究表明,不同物种间CDK5基因的核苷酸歧异度、净遗传距离、单倍型间的遗传距离差异都较大,种内及种间遗传分化明显。CDK5基因对密码子有较强的偏爱性,非同义替换位点数均明显高于同义替换位点数,CDK5基因在进化过程中可能受到正向选择的影响。CDK5基因物种间的亲缘关系与动物学分类相符。CDK5蛋白N 端无信号肽、无导肽、无跨膜结构域,整个多肽链表现为亲水性,蛋白质二级结构的主要元件为无规则卷曲、 α-螺旋,除此之外还有少量β 折叠、β 转角。

参考文献:

[1]刘佳,董常生,范瑞文,等. 周期素依赖性蛋白激酶-5在不同毛色羊驼皮肤中的表达[J]. 畜牧兽医学报,2010,41(4):478-483.

[2]张瑞娜,范瑞文,程志学,等. CDK5对羊驼皮肤黑色素细胞TYR和MITF mRNA表达的调节[J]. 畜牧兽医学报,2011,42(12):1712-1717.

[3]邸文达,杨川. 羊驼毛色相关基因研究进展的综述[J]. 畜牧与饲料科学,2012,33(8):84-86.

[4]Smith S D,Kelley P M,Kenyon J B,et al. Tietz syndrome(hypopigmentation/deafness)caused by mutation of MITF[J]. Journal of Medical Genetics,2000,37(6):446-448.

[5]李易. 基因进化的同义与非同义替代计算及统计检验的比较分析[J]. 曲靖师范学院学报,2006,25(6):1-8.

[6]强毅. 植物蔗糖磷酸合成酶的生物信息学分析[J]. 现代生物医学进展,2007,7(4):557-560,570.

[7]Emanuelsson O,Nielsen H,Brunak S,et al. Predicting subcellular localization of proteins based on their N-terminsl smino acid sequence[J]. Molecular Biology,2000,300(4):1005-1016.

[8]Ikeda M,Arai M,Lao D M,et al. Transmembrane topology prediction methods:a re-assessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies[J]. In Silico Biology,2002,2(1):19-33.

[9]薛庆中. DNA和蛋白质序列数据分析工具[M]. 3版.北京:科学出版社,2010.

[10]Kyte J,Doolittle R F. A simple method for displaying the hydropathic character of a protein[J]. Journal of Molecular Biology,1982,157(1):105-132.

[11]Geourjon C,Deléage G. SOPMA:significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Comput Appl Biosci,1995,11(6):681-684.

[12]薛永常,聂会忠,刘长斌. 木质素合成酶 C3H基因的生物信息学分析[J]. 生物信息学,2009,7(1):13-17.

[13]范瑞文,刘佳,张俊珍,等. 黄色羊驼皮肤细胞周期素依赖蛋白激酶5(CDK5)完整CDS区结构域分析[J]. 激光生物学报,2011,20(1):83-86.

摘要:采用生物信息学方法比较分析了东非狒狒、黑猩猩、裸鼢鼠、牛、欧洲雪貂、人、灰鼠猴、大猩猩、长臂猿、猪 CDK5基因编码区(CDS)的遗传多样性。结果表明,来自10个物种的47条基因序列中检测到个532多态位点,共生成30 种单倍型,物种间及物种内CDK5基因序列编码区存在较丰富的遗传多样性;理论等电点均大于6,N端无信号肽,无跨膜结构域,肽链表现为亲水性;蛋白质二级结构主要结构元件是α-螺旋、无规则卷曲。

关键词:CDK5基因;物种;生物信息学

中图分类号: Q813 文献标志码: A 文章编号:1002-1302(2014)07-0032-03

收稿日期:2013-10-17

作者简介:张永改(1987—),女,河北定州人,硕士研究生,从事动物遗传学研究。E-mail:zhangyonggai1022@126.com。

通信作者:李祥龙,博士,教授,从事动物遗传学研究。E-mail:lixianglongcn@aliyun.com。CDK5主要参与神经元正常功能的维持,但在非神经元的组织或细胞中也广泛表达并发挥作用[1]。研究表明,CDK5可能通过调节黑色素细胞核中MITFmRNA、TYR的表达,从而参与调控羊驼毛色的形成[2]。在羊驼皮肤组织中,Agouti基因、MC1R基因、酪氨酸酶基因家族、KIT基因、CDK5基因都参与了羊驼毛色的形成与调控[3]。本研究利用比较基因组学、生物信息学方法研究了该基因编码区种间、种内变异,以期探明该基因在不同种间及种内的遗传分化,进而为相关黑色素基因的遗传学分析奠定基础。

1材料与方法

1.1序列来源

2.3.3信号肽的预测、分析信号肽位于蛋白质的N端,用于指导分泌性蛋白到内质网膜上合成。利用在线工具 SignalP 3.0 Server分析人CDK5氨基酸序列的信号肽的存在位置及序列,结果显示,人的CDK5氨基酸序列无信号肽[7]。 对其余几个物种CDK5氨基酸序列的信号肽的存在位置及其序列进行相应的分析,也得到了一致的结果。

2.3.4跨膜结构域的预测和分析跨膜结构域通常是由跨膜蛋白的效应区域所显示。利用在线工具TMHMM 2.0 Server预测人CDK5氨基酸序列的跨膜结构域,结果显示,其不具跨膜结构域,在细胞膜外与细胞膜内都有CDK5肽链[8]。对其他物种CDK5氨基酸序列的跨膜结构域进行分析,得到的预测结果与人的相似。结合上述导肽的预测,可以推测CDK5在细胞质基质中合成后,很可能也要转运到膜外,该蛋白可以在细胞质与细胞膜外行使其功能。

2.3.5疏水性/亲水性的预测和分析蛋白质亲/疏水性氨基酸的组成是蛋白质折叠的主要驱动力。蛋白质在折叠时会形成疏水内核、亲水表面,同时在潜在跨膜区会出现高疏水值区域,据此可以测定跨膜螺旋等二级结构及蛋白质表面有氨基酸分布[9]。利用在线工具ProtScale预测人CDK5氨基酸序列的疏水性/亲水性,结果表明,精氨酸(Arg)具有最低分值-4.500,亲水性最强,异亮氨酸(Ile)具有最高分值4.500,疏水性最强[10]。总体来看,亲水区域明显大于疏水区域。因此,整个多肽链表现为亲水性。对其他物种CDK5氨基酸序列的疏水性/亲水性进行预测,其预测结果与人的相似,因此认为CDK5蛋白是亲水性蛋白。

2.3.6二级结构的预测和分析蛋白质的二级结构是指氨基酸残基形成的α-螺旋、β-转角、β-折叠片延伸链、无规则卷曲。用SOPMA对10个物种的CDK5氨基酸序列的二级结构进行预测,结果表明,CDK5蛋白质二级结构的主要结构元件是α-螺旋(39.73%~42.81%)、无规则卷曲(34.93%~38.70%),其次是β折叠延伸链(13.46%~14.73%)、β-转角(6.75%~8.85%)[11-13]。

3结论

本研究表明,不同物种间CDK5基因的核苷酸歧异度、净遗传距离、单倍型间的遗传距离差异都较大,种内及种间遗传分化明显。CDK5基因对密码子有较强的偏爱性,非同义替换位点数均明显高于同义替换位点数,CDK5基因在进化过程中可能受到正向选择的影响。CDK5基因物种间的亲缘关系与动物学分类相符。CDK5蛋白N 端无信号肽、无导肽、无跨膜结构域,整个多肽链表现为亲水性,蛋白质二级结构的主要元件为无规则卷曲、 α-螺旋,除此之外还有少量β 折叠、β 转角。

参考文献:

[1]刘佳,董常生,范瑞文,等. 周期素依赖性蛋白激酶-5在不同毛色羊驼皮肤中的表达[J]. 畜牧兽医学报,2010,41(4):478-483.

[2]张瑞娜,范瑞文,程志学,等. CDK5对羊驼皮肤黑色素细胞TYR和MITF mRNA表达的调节[J]. 畜牧兽医学报,2011,42(12):1712-1717.

[3]邸文达,杨川. 羊驼毛色相关基因研究进展的综述[J]. 畜牧与饲料科学,2012,33(8):84-86.

[4]Smith S D,Kelley P M,Kenyon J B,et al. Tietz syndrome(hypopigmentation/deafness)caused by mutation of MITF[J]. Journal of Medical Genetics,2000,37(6):446-448.

[5]李易. 基因进化的同义与非同义替代计算及统计检验的比较分析[J]. 曲靖师范学院学报,2006,25(6):1-8.

[6]强毅. 植物蔗糖磷酸合成酶的生物信息学分析[J]. 现代生物医学进展,2007,7(4):557-560,570.

[7]Emanuelsson O,Nielsen H,Brunak S,et al. Predicting subcellular localization of proteins based on their N-terminsl smino acid sequence[J]. Molecular Biology,2000,300(4):1005-1016.

[8]Ikeda M,Arai M,Lao D M,et al. Transmembrane topology prediction methods:a re-assessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies[J]. In Silico Biology,2002,2(1):19-33.

[9]薛庆中. DNA和蛋白质序列数据分析工具[M]. 3版.北京:科学出版社,2010.

[10]Kyte J,Doolittle R F. A simple method for displaying the hydropathic character of a protein[J]. Journal of Molecular Biology,1982,157(1):105-132.

[11]Geourjon C,Deléage G. SOPMA:significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Comput Appl Biosci,1995,11(6):681-684.

[12]薛永常,聂会忠,刘长斌. 木质素合成酶 C3H基因的生物信息学分析[J]. 生物信息学,2009,7(1):13-17.

[13]范瑞文,刘佳,张俊珍,等. 黄色羊驼皮肤细胞周期素依赖蛋白激酶5(CDK5)完整CDS区结构域分析[J]. 激光生物学报,2011,20(1):83-86.

摘要:采用生物信息学方法比较分析了东非狒狒、黑猩猩、裸鼢鼠、牛、欧洲雪貂、人、灰鼠猴、大猩猩、长臂猿、猪 CDK5基因编码区(CDS)的遗传多样性。结果表明,来自10个物种的47条基因序列中检测到个532多态位点,共生成30 种单倍型,物种间及物种内CDK5基因序列编码区存在较丰富的遗传多样性;理论等电点均大于6,N端无信号肽,无跨膜结构域,肽链表现为亲水性;蛋白质二级结构主要结构元件是α-螺旋、无规则卷曲。

关键词:CDK5基因;物种;生物信息学

中图分类号: Q813 文献标志码: A 文章编号:1002-1302(2014)07-0032-03

收稿日期:2013-10-17

作者简介:张永改(1987—),女,河北定州人,硕士研究生,从事动物遗传学研究。E-mail:zhangyonggai1022@126.com。

通信作者:李祥龙,博士,教授,从事动物遗传学研究。E-mail:lixianglongcn@aliyun.com。CDK5主要参与神经元正常功能的维持,但在非神经元的组织或细胞中也广泛表达并发挥作用[1]。研究表明,CDK5可能通过调节黑色素细胞核中MITFmRNA、TYR的表达,从而参与调控羊驼毛色的形成[2]。在羊驼皮肤组织中,Agouti基因、MC1R基因、酪氨酸酶基因家族、KIT基因、CDK5基因都参与了羊驼毛色的形成与调控[3]。本研究利用比较基因组学、生物信息学方法研究了该基因编码区种间、种内变异,以期探明该基因在不同种间及种内的遗传分化,进而为相关黑色素基因的遗传学分析奠定基础。

1材料与方法

1.1序列来源

2.3.3信号肽的预测、分析信号肽位于蛋白质的N端,用于指导分泌性蛋白到内质网膜上合成。利用在线工具 SignalP 3.0 Server分析人CDK5氨基酸序列的信号肽的存在位置及序列,结果显示,人的CDK5氨基酸序列无信号肽[7]。 对其余几个物种CDK5氨基酸序列的信号肽的存在位置及其序列进行相应的分析,也得到了一致的结果。

2.3.4跨膜结构域的预测和分析跨膜结构域通常是由跨膜蛋白的效应区域所显示。利用在线工具TMHMM 2.0 Server预测人CDK5氨基酸序列的跨膜结构域,结果显示,其不具跨膜结构域,在细胞膜外与细胞膜内都有CDK5肽链[8]。对其他物种CDK5氨基酸序列的跨膜结构域进行分析,得到的预测结果与人的相似。结合上述导肽的预测,可以推测CDK5在细胞质基质中合成后,很可能也要转运到膜外,该蛋白可以在细胞质与细胞膜外行使其功能。

2.3.5疏水性/亲水性的预测和分析蛋白质亲/疏水性氨基酸的组成是蛋白质折叠的主要驱动力。蛋白质在折叠时会形成疏水内核、亲水表面,同时在潜在跨膜区会出现高疏水值区域,据此可以测定跨膜螺旋等二级结构及蛋白质表面有氨基酸分布[9]。利用在线工具ProtScale预测人CDK5氨基酸序列的疏水性/亲水性,结果表明,精氨酸(Arg)具有最低分值-4.500,亲水性最强,异亮氨酸(Ile)具有最高分值4.500,疏水性最强[10]。总体来看,亲水区域明显大于疏水区域。因此,整个多肽链表现为亲水性。对其他物种CDK5氨基酸序列的疏水性/亲水性进行预测,其预测结果与人的相似,因此认为CDK5蛋白是亲水性蛋白。

2.3.6二级结构的预测和分析蛋白质的二级结构是指氨基酸残基形成的α-螺旋、β-转角、β-折叠片延伸链、无规则卷曲。用SOPMA对10个物种的CDK5氨基酸序列的二级结构进行预测,结果表明,CDK5蛋白质二级结构的主要结构元件是α-螺旋(39.73%~42.81%)、无规则卷曲(34.93%~38.70%),其次是β折叠延伸链(13.46%~14.73%)、β-转角(6.75%~8.85%)[11-13]。

3结论

本研究表明,不同物种间CDK5基因的核苷酸歧异度、净遗传距离、单倍型间的遗传距离差异都较大,种内及种间遗传分化明显。CDK5基因对密码子有较强的偏爱性,非同义替换位点数均明显高于同义替换位点数,CDK5基因在进化过程中可能受到正向选择的影响。CDK5基因物种间的亲缘关系与动物学分类相符。CDK5蛋白N 端无信号肽、无导肽、无跨膜结构域,整个多肽链表现为亲水性,蛋白质二级结构的主要元件为无规则卷曲、 α-螺旋,除此之外还有少量β 折叠、β 转角。

参考文献:

[1]刘佳,董常生,范瑞文,等. 周期素依赖性蛋白激酶-5在不同毛色羊驼皮肤中的表达[J]. 畜牧兽医学报,2010,41(4):478-483.

[2]张瑞娜,范瑞文,程志学,等. CDK5对羊驼皮肤黑色素细胞TYR和MITF mRNA表达的调节[J]. 畜牧兽医学报,2011,42(12):1712-1717.

[3]邸文达,杨川. 羊驼毛色相关基因研究进展的综述[J]. 畜牧与饲料科学,2012,33(8):84-86.

[4]Smith S D,Kelley P M,Kenyon J B,et al. Tietz syndrome(hypopigmentation/deafness)caused by mutation of MITF[J]. Journal of Medical Genetics,2000,37(6):446-448.

[5]李易. 基因进化的同义与非同义替代计算及统计检验的比较分析[J]. 曲靖师范学院学报,2006,25(6):1-8.

[6]强毅. 植物蔗糖磷酸合成酶的生物信息学分析[J]. 现代生物医学进展,2007,7(4):557-560,570.

[7]Emanuelsson O,Nielsen H,Brunak S,et al. Predicting subcellular localization of proteins based on their N-terminsl smino acid sequence[J]. Molecular Biology,2000,300(4):1005-1016.

[8]Ikeda M,Arai M,Lao D M,et al. Transmembrane topology prediction methods:a re-assessment and improvement by a consensus method using a dataset of experimentally-characterized transmembrane topologies[J]. In Silico Biology,2002,2(1):19-33.

[9]薛庆中. DNA和蛋白质序列数据分析工具[M]. 3版.北京:科学出版社,2010.

[10]Kyte J,Doolittle R F. A simple method for displaying the hydropathic character of a protein[J]. Journal of Molecular Biology,1982,157(1):105-132.

[11]Geourjon C,Deléage G. SOPMA:significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Comput Appl Biosci,1995,11(6):681-684.

[12]薛永常,聂会忠,刘长斌. 木质素合成酶 C3H基因的生物信息学分析[J]. 生物信息学,2009,7(1):13-17.

[13]范瑞文,刘佳,张俊珍,等. 黄色羊驼皮肤细胞周期素依赖蛋白激酶5(CDK5)完整CDS区结构域分析[J]. 激光生物学报,2011,20(1):83-86.

猜你喜欢
生物信息学物种
吃光入侵物种真的是解决之道吗?
生日礼物种草合集
丽水发现新物种
回首2018,这些新物种值得关注
电咖再造新物种
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用