陈建兴,王银朝,张庆蛟,陈海伟,赵 冰
(1.赤峰学院 生命科学学院,内蒙古 赤峰 024000;2.山东东阿阿胶股份有限公司,山东 聊城 252201)
驴朊蛋白基因序列分析
陈建兴1,王银朝2,张庆蛟2,陈海伟1,赵 冰1
(1.赤峰学院 生命科学学院,内蒙古 赤峰 024000;2.山东东阿阿胶股份有限公司,山东 聊城 252201)
在我国,家驴及驴产品具有很大的市场开发潜力和价值.本研究通过生物信息学技术分析了家驴朊蛋白基因PRNP的序列特征,为家驴向肉用方向进行抗病选育提供一定的分子依据.经分析研究发现家驴PRNP基因CDS区翻译出255个氨基酸构成的多肽.家驴的朊蛋白中的氨基酸以甘氨酸所占的比例最高(18.43%),其次为缬氨酸(8.63%),最低的为半胱氨酸(1.18%).对15条家驴PRNP基因的CDS区序列进行比对时只发现了C153T、T237C和G354C三个突变,并且这三个突变均为沉默突变.家驴朊蛋白的编码存在明显的密码子使用偏好现象.另外,我们重新界定了家驴朊蛋白各区块的具体大小和位置.
驴;朊蛋白;PRNP;序列分析
驴(Equusasinus)驯化成功后,在许多文化体系中,一直作为主要的驮运家畜为人类文明的发展做出了巨大贡献[1].时至今日,在内蒙古的许多地区,如呼和浩特、赤峰等地,仍能见到驴或骡子拉的车作为交通工具拉运重物(如建筑工地使用的钢管)和水果(进行贩卖)等.另外,驴肉因味道鲜美、营养丰富,一直受到广大消费者的厚爱.驴乳因功能独特,也逐渐为人们所认识和接纳[2].驴皮熬制的阿胶,数百年来一直作为补品,深受人们喜爱.我国家驴的养殖数量在全世界范围内一直处于领先地位,驴产品具有很大的市场开发潜力和价值[3,4].
传染性海绵样脑软化病(transmissiblespongiform encephalopathies,TSE)是在人类和哺乳动物中发现的一类中枢神经系统慢性退化性致死性疾病,又称朊病毒(prion)病.朊蛋白基因(PrionProteingene,PRNP)在正常情况下编码一种细胞表面的糖蛋白,通常称其为细胞型朊蛋白(PrPc,thecellularform ofprionprotein),通过构象转变,PrPc可转变为致病性的PrPsc(thescrapieformofprionprotein),而PrPsc在体内(一般是脑部)蓄积可引发朊病毒病[5].朊病毒病在几种草食动物(绵羊、山羊、牛、马鹿、麂、大角羚)和杂食动物(人、猫、水貂)中有过报道,但在马属动物中未见有感染此病的报道,估计一般情况下,该病毒在各物种间的种属屏障和潜伏期会有很大不同.朊蛋白的RNA并非由一个外显子构成,但整个开放阅读框(ORF)包含在一个单一的外显子中[5].张太翔和赵德明对德州驴与其余7种动物朊病毒基因核苷酸和氨基酸序列进行比较,发现有三个区域变异较大,认为与种属屏障和朊病毒的潜伏期有关[6].Zhang等[7]克隆测序并分析了西吉驴的PRNP基因,并将西吉驴该序列与其余物种进行了比对分析.
对于家驴朊蛋白基因的研究,只有赵德明进行了一些研究[6~8].为此,本研究通过生物信息学技术初步分析家驴朊蛋白基因的序列特征,可以更好地了解朊病毒病的发病机理,朊病毒病的传递机制和种间屏障等,可为家驴的抗病育种提供分子依据,也可为朊病毒病制定相关预防控制措施提供一些理论依据.
1.1 数据来源
所使用的家驴和仓鼠朊蛋白基因序列,全部来自GenBank,其GenBank登录号分别为:EF127815、KC845010-KC845023和K02234.
1.2 分析方法
多重序列比对采用DNAMAN7.0软件进行,家驴PRNP基因的密码子使用情况分析也采用DNAMAN7.0来完成.家驴朊蛋白氨基酸组成分析通过MEGA6.0来完成.
2.1 家驴朊蛋白基因的比对分析
家驴朊蛋白基因的比对结果,见图1.从图中可见,家驴朊蛋白基因间共发现三处核苷酸的改变,分别为C153T、T237C和G354C.由此三处核苷酸的改变,可将家驴朊蛋白基因分为CTG(6个)、TCC(4个)和TTG(5个)三种单倍型.这三个突变中,前二者为嘧啶之间的替换,只有354处为鸟嘌呤和胞嘧啶之间的颠换.对这些基因序列对应的氨基酸序列进行比对发现,这三个突变均为沉默突变,亦即突变未引起氨基酸的改变.
图1 家驴朊蛋白基因比对结果图
2.2 家驴朊蛋白基因PRNP的密码子使用情况分析
通过对家驴的朊蛋白基因PRNP进行密码子使用情况分析发现,家驴PRNP基因CDS区共翻译出255个氨基酸构成多肽,见图2(图中显示256个密码子,包含一个终止密码子).家驴的朊蛋白中的氨基酸以甘氨酸所占的比例最高(18.43%,共出现47次),其次为缬氨酸(8.63%,共出现22次),最低的为半胱氨酸(1.18%,共出现3次).
从图2还可以看出,除了UAA、UAG两个终止密码子未被使用外,亮氨酸的四个密码子(UUA、UUG、CUU和CUA)、丝氨酸的两个密码子(UCA和UCG)、半胱氨酸的一个密码子(UGU)、精氨酸的一个密码子(CGG)、天冬氨酸的一个密码子(GAU)也未被使用.而这几种氨基酸都由其它密码子进行编码,说明家驴朊蛋白的编码存在明显的密码子使用偏好.除这几种明显的密码子使用偏好外,其余氨基酸的编码也存在着较明显的偏好,见图2.
另外,图2中也可看出,密码子三个位置各个核苷酸所占的比例差异较大,密码子第一位以G所占比例最大,最小为U;密码子第二位以G所占比例最大,最小为C;密码子第三位以C所占比例最大,最小为A.
框左边和右边分别表示密码子第一位和第三位的四种核苷酸,框内表示的该密码子翻译的氨基酸.第一个数字表示该密码子出现的次数,第二个数字表示该密码子出现次数占总256个密码子的千分率,第三个数字表示该密码子占同类氨基酸密码子的百分率.框下面显示的是密码子三个位置上各核苷酸所占的比例.
2.3 家驴朊蛋白的基本结构
图2 家驴朊蛋白基因的密码子使用情况分析
图3 家驴朊蛋白的结构示意图
图的上方为密码子数列.SP为信号肽序列;G-PREPEATS是富含Gly-Pro的重复序列区;STE是控制朊蛋白拓补结构的区域;TM是一段跨膜的α螺旋;AH编码一个两性螺旋;SS编码一个疏水信号序列.
通过将家驴朊蛋白与金仓鼠的相应氨基酸序列进行比对,界定好各区域的大体位置,并通过DNANMAN7.0内置的部分功能预测了信号肽和跨膜区的区域,综合起来做出了家驴朊蛋白的基本结构,结果见图3.图3中,上方数列为密码子的大体位置,SP为N端含24个氨基酸残基组成的信号肽序列;G-PREPEATS是富含Gly-Pro的重复序列区,53-61氨基酸残基位置处为1个PQGGGGWGQ的九肽区,62-85氨基酸残基位置处为3个PHGGGWGQ的八肽区,86-94氨基酸残基位置处为1个PHGGGGWGQ的九肽区;STE是控制朊蛋白拓补结构的区域;TM是一段跨膜的α螺旋;AH编码一个两性螺旋;SS编码一个疏水信号序列.
在人和一些易感朊病毒病的哺乳动物中,尤其是在一些经济地位比较突出的家畜,对于朊蛋白基因的研究比较多见[9~12].而对于家驴,只是偶见赵德明等对德州驴和西吉驴的朊蛋白基因的CDS区进行了扩增和简单的序列分析[6~8],并未见到更进一步的研究报道.虽然朊蛋白基因是在哺乳动物体内非常保守的一个基因,但其具体功能还不是很清楚[13].对于家驴来说,该基因编码蛋白有无变异,变异对朊病毒病的发病有无影响,都还是未知的.可见,未来对此基因的研究具有很大的意义,有可能找到哺乳动物朊病毒病的发病机制和马属动物不患朊病毒病的分子机制,对家驴产品的进一步扩大开发利用提供研究基础.因此,本研究通过生物信息学技术初步分析家驴朊蛋白基因的序列特征,为将来探寻该基因的变异和作用机制打下基础.
在已研究的哺乳动物中,PRNP是一个高度保守的基因,所有动物的编码框都编码一个约250个氨基酸的蛋白,编码朊蛋白的CDS中的DNA和氨基酸序列的相似性分别达到90%和95%以上[11,14],据此推测该基因在维持动物生理功能和内环境稳定性方面可能具有重要作用.从图1中也可看出,15条家驴朊蛋白基因比对时只发现了C153T、T237C和G354C三个突变,并且这三个突变均为沉默突变.这一结果说明家驴朊蛋白基因非常保守,当然,这也与所使用的序列较少有关,有待进一步扩大样本量进行下一步研究.
通过对家驴的朊蛋白基因PRNP进行密码子使用情况分析发现,家驴朊蛋白的编码存在明显的密码子使用偏好,见图2.通过家驴PRNP密码子使用偏好性的研究,可以判定最优密码子,并针对最优密码子设计相应的基因工程表达载体,以提高朊蛋白基因的表达量,这对于进一步研究朊蛋白的生物功能和朊蛋白病的发病机制将具有很大的意义.
图3中,我们通过将家驴朊蛋白与金仓鼠的相应氨基酸序列进行比对,界定了各区域的大体位置,并通过DNANMAN7.0内置的部分功能预测了信号肽和跨膜区的区域,综合起来才做出了家驴朊蛋白的基本结构.这就与张太翔和赵德明的研究结果[6]有些不相符.其中,我们认为SP为N端含24个氨基酸残基组成的信号肽序列,而他们认为是前23个氨基酸残基构成[6],这在比对和信号肽预测时能够看出的确是24个氨基酸残基而非23个;G-P REPEATS中62-85氨基酸残基位置处为3个PHGGGWGQ的八肽区,这通过检测和计算就可得知,而在他们的研究中认为是4个八肽区[6],推测可能是笔误;SS编码一个疏水信号序列,因为SS前面的序列的最后一个氨基酸在下一步多肽链成熟修饰时会锚定一个GPI(糖基磷酸肌醇)[5],所以,SS前那段氨基酸序列最后一个氨基酸必须是丝氨酸,这就很好地界定了该处的位置.
〔1〕A.Beja-Pereira,P.R.England,N.Ferrand, etal.Africanoriginsofthedomesticdonkey [J].Science,2004,304(5678):1781.
〔2〕张晓莹,赵亮,郑倩,等.新疆疆岳驴乳理化和微生物指标分析[J].食品科学,2008,29(01):303-305.
〔3〕http://dad.fao.org.
〔4〕J.X.Chen,Y.J.Sun,D.Manglai,etal.Maternalgeneticdiversityandpopulationstructure offourChinesedonkeybreeds[J].Livestock Science,2010,131:272-280.
〔5〕李振刚.分子遗传学(第三版)[M].北京:科学出版社,2008.
〔6〕张太翔,赵德明.德州驴朊病毒基因克隆与序列分析[J].中国兽医杂志,2007,43(3):3–5.
〔7〕Z.Zhang,R.Wang,L.Xu,etal.Molecular cloningandsequenceanalysisofprionprotein geneinXijidonkeyinChina[J].Gene,2013, 529:345-350.
〔8〕T.Zhang,H.Liu,X.Zhou,etal.Molecular cloningandsequenceanalysisofprionprotein geneofDezhoudonkeyinChina[J].Asian JournalofAnimaland Veterinary Advances, 2006,1(1):23-32.
〔9〕陈芯,贺三刚,刘明军.新疆地区绵羊品种朊蛋白基因136、154和171位点的多态性 [J].遗传, 2010,32(11):1159-1165.
〔10〕PrusinerS.PriondiseasesandtheBSEcrisis [J].Science,1997,278:245~251.
〔11〕管峰,潘磊,石国庆,等.绵羊PRNP遗传多样性与抗病育种研究进展[J].遗传,2009,31(2):137-141.
〔12〕杨建民,赵德明,郝永新,等.奶牛朊病毒基因克隆与序列分析 [J].畜牧兽医学报,2004,35(6): 685-688.
〔13〕DambergerF.F.,ChristenB.,PérezD.R.,et al.Cellularprion protein conformation and function[J].ProcNatlAcadSciUSA,108(42): 17309-17313.
〔14〕LeeIY,WestawayD,SmitAF,etal.Completegenomicsequenceandanalysisofthe prionproteingeneregionfromthreemammalianspecies[J].GenomeRes,1998,8(10): 1022-1037.
S588.9
A
1673-260X(2014)12-0014-03
2013年度内蒙古自治区高等学校科学研究项目(NJZC13306)研究成果