孙虎芝,任慧英,张 灿(青岛农业大学动物科技学院,山东青岛266109)
噬菌体Bp7尾丝蛋白gp38密码子用法及偏性分析
孙虎芝,任慧英,张灿*
(青岛农业大学动物科技学院,山东青岛266109)
摘 要:为了解噬菌体Bp7尾丝蛋白gp38的密码子使用特征,利用生物信息学方法对1株临床分离的多价烈性噬菌体Bp7尾丝蛋白gp38与其他5株T4类噬菌体进行密码子用法的分析比较。结果发现,Bp7尾丝蛋白gp38与其他5株T4类噬菌体密码子的使用模式差别大,Bp7尾丝蛋白gp38偏好于以C结尾的密码子,而其余5株噬菌体偏好A或U结尾;除了AUG(Met)和UGG(Trp)外,还确定了Bp7尾丝蛋白gp38使用的25种高频密码子;通过6株噬菌体gp38的密码子偏性比较发现,Bp7与任何一株噬菌体都存在较大差异;聚类分析的结果也表明,Bp7尾丝蛋白gp38与其余5株噬菌体不属于一类。总体上,噬菌体Bp7尾丝蛋白gp38在密码子使用上比较特殊,gp38基因密码子的分析将为进一步研究噬菌体Bp7的感染机制及扩宽其裂解谱奠定基础。
关键词:噬菌体;Bp7;尾丝蛋白gp38;密码子
自然界中编码氨基酸的密码子有61种,每一种氨基酸至少对应1种密码子,最多对应6种密码子,说明密码子存在简并性。对于不同的生物来说,当多种密码子对应同一种氨基酸时,编码同一种氨基酸的密码子的使用频率也不同,从而造成密码子的偏性[1-2]。密码子的偏性在一定程度上与物种有关,有时候还能反映出物种间基因进化的规律。
T4类噬菌体通过其尾丝吸附到宿主菌表面受体,进而侵染宿主,尾丝蛋白gp37以三聚体形式吸附到宿主表面受体是侵染宿主的第1步,gp38作为伴侣分子,在gp37蛋白形成三聚体过程中起作用[3]。噬菌体Bp7是一株多价烈性噬菌体,属于T4类噬菌体,能够侵染大肠埃希菌,对鸡致病性大肠埃希菌的宽噬率达46%[4-5]。前期研究发现,噬菌体Bp7尾丝蛋白gp38多克隆抗体也能明显抑制噬菌体的增殖,说明gp38与gp37一样,也参与宿主菌受体的结合,表明gp38不仅仅是gp37的伴侣分子,还参与Bp7的宿主识别过程,这与T4噬菌体gp38的作用不同[6]。鉴于噬菌体Bp7与T4噬菌体的尾丝蛋白gp38功能的差异,本文选择5株T4类噬菌体,对Bp7尾丝蛋白gp38的密码子使用偏性进行分析,以期为gp38的分子改造并进一步拓宽噬菌体Bp7的宿主谱提供依据。
1.1材料
多价噬菌体Bp7(HQ829472)由青岛农业大学兽医微生物实验室分离并保存,T4类噬菌体JS98 (NC-010105)、JS10(NC-012741)、IME08(NC-014260)、T4(NC-000866)及RB51(FJ-839693.1)的全基因序列从NCBI中获得,各株噬菌体尾丝蛋白gp38基因序列从全序列中获得。
1.2方法
利用软件Codonw1.4.4以及cusp来对密码子的各项指标进行分析,对于密码子的偏性来说一般需要对密码子的适应指数(CAI)、偏爱指数(CBI)、有效的密码子数(ENC)以及使用的相对频率(RSCU)进行分析[7-8]。利用软件cusp分析gp38基因序列中的GC含量、密码子中第3位碱基的GC含量(GC3s)以及密码子第1、2位上G+C%含量(GC12),对于分析的数据运用Excel进行作图分析。
应用MegAlign软件进行6株噬菌体gp38基因进行氨基酸序列分析,构建系统发育树。同时运用SPSS软件进行密码子偏性的聚类分析,对两个结果进行比较。
2.1噬菌体尾丝蛋白gp38基因密码子偏性指标确定
通过RSCU值确定密码子偏性[9-10]。RSCU值代表了密码子的使用频率偏性,偏性较高的密码子RSCU>1,偏性低的密码子RSCU<1。通过计算RSCU值,分析噬菌体Bp7与其余5株T4类噬菌体的尾丝蛋白gp38基因的密码子用法(图1)。6株噬菌体gp38密码子使用情况相差较大,且所偏爱的密码子也不相同。Bp7尾丝蛋白gp38中28个密码子RSCU值大于1,多以C结尾,而其余5株噬菌体中,多以A或U结尾。Bp7尾丝蛋白gp38以UAA,UAG和UGA作为终止密码子,而其余5株噬菌体只使用终止密码子UAA或UAG。
通过密码子使用频率(Fraction)反映密码子使用的高频与低频。根据得到的Fraction值,利用高频密码子分析法进行分析[11]。通过密码子使用频率分析发现,除AUG(M)和UGG(W)外,确定了25种密码子为高频密码子。此外,gp38基因中GGG、CUA、UCA、ACU、ACA、GCU、GCA、GUG的使用频率极低,其中CUA、UCA、GCA和GGG更是未被使用(图1)。将Bp7与其他5株噬菌体比较,CCU(P)使用频率明显低于其他5株噬菌体,UGC(C)使用频率明显高于JS10、JS98、T4和RB51,与IME08基本一致。
2.26株噬菌体gp38基因密码子频率比较
图1 噬菌体尾丝蛋白gp38基因密码子使用模式分析Fig.1 Analysis of condon usage model of gp38between 6T4-like phages
分别对Bp7-gp38(264codons)、IME08-gp38 (264codons)、JS10-gp38(258codons)、JS98-gp38 (263codons)、T4-gp38(138codons)和IME08-gp38(258codons)密码子的Frequency(1/1 000)值进行统计并进行比较(图2)。密码子频率的比值在0.5 ~2.0之间时,密码子偏性相近。Bp7-gp38基因与其他5株噬菌体gp38基因密码子频率比较结果显示,噬菌体Bp7-gp38基因与其余5株噬菌体密码子使用偏性相差甚远,并且Bp7与其余5株噬菌体的比值小于0.5或大于2.0的有许多种,而剩余的5株噬菌体中除T4外,其余4株噬菌体密码子使用偏性基本一致,可见噬菌体Bp7尾丝蛋白gp38比较特殊。
图2 噬菌体gp38基因密码子频率比较Fig.2 Frequency comparison of codons in gp38gene of phage Bp7
2.3CAI、CBI、ENC、GC3s、GC、GC12计算及相关性分析
通过Codonw 1.4.4分析6株噬菌体gp38基因的CAI、CBI、ENC、GC3s及GC数值,结果见表1。CAI、CBI值均偏小,表明6株噬菌体gp38基因在密码子的使用特性上并不存在显著的偏爱性。由图3可见,6株噬菌体ENC值均较高(均大于45),表明gp38基因密码子的偏爱性较低。6株噬菌体gp38基因GC含量在34.1%以上,而第3位碱基中G+ C%含量大部分低于基因的GC含量,但是Bp7的gp38基因却相反,第3位碱基中G+C%(58.2%)的含量却高于基因的GC(50.4%)含量。
各指数之间相关性分析结果见图3。图3A为6株噬菌体gp38基因密码子ENC-GC3s相关分析。由图3可见,6株噬菌体与趋势线之间的关系,虽然Bp7尾丝蛋白gp38的GC3s值稍大(0.504),ENC值也相对稍高(49.52),但仍靠近于趋势线,说明gp38基因密码子的偏好可能受碱基组成的影响。图3B为gp38基因中性绘图分析(GC12-GC3s)。GC12和GC3s的变化范围均很小,回归系数为负值,表明GC12和GC3s的变异模式不同。由图3可知,5株噬菌体IME08、JS10、T4、RB51和JS98相近,与Bp7有差异。
表1 六株噬菌体gp38基因密码子CAI、CBI、ENC、GC3s、GC及GC12Table 1 CAI,CBI,ENC,GC3s,GC and GC12of gp38codon of 6phages
2.46株噬菌体gp38基因进化树的构建及其密码子聚类分析
利用MegAlign对6株噬菌体gp38氨基酸序列分析,构建系统发生树(图4)。进化树分析结果显示Bp7与RB51亲缘关系最近,与其他噬菌体亲缘关系远,二者单独一个分支;Bp7与T4亲缘关系最远。对6株噬菌体gp38基因根据RSCU值进行聚类分析(图5)。聚类分析结果显示JS10与JS98聚成一类,而IME08与T4聚成一类,Bp7单独一类。密码子聚类分析针对的是密码子,采用的是层次聚类算法决定集群组之间的距离,而系统发育树分析针对的是单个碱基,采用邻接法构建进化树。从整体上看,噬菌体Bp7尾丝蛋白gp38进化分析和聚类分析结果基本一致,与其他5株噬菌体差异较大。
图3 六株噬菌体gp38基因密码子ENC、GC3s及GC12数据相关性分析Fig.3 Analysis of ENC,GC3sand GC12of gp38codon of 6phages
图4 六株噬菌体gp38基因核苷酸序列系统进化树Fig.4 Polygenetic tree of gene gp38of six phages
图5 六株噬菌体gp38基因密码子聚类分析Fig.5 Cluster analysis of gp38codons of six phages
T4类噬菌体吸附宿主菌的特异性由靠近尾部的长尾丝蛋白序列决定,长尾丝纤维与宿主菌表面受体之间特定的相互作用,导致噬菌体吸附的快速与高效。研究发现T4噬菌体尾丝蛋白gp37位于噬菌体长尾丝末端,以三聚体形式识别宿主菌表面受体;而gp38在不同的噬菌体中有不同的功能:在T4噬菌体中,gp38作为伴侣分子,能够帮助尾丝形成正确的空间结构从而识别靶位点,它是gp37能形成三聚体的前提;而在T2噬菌体中gp38作为长尾丝的组成部分,参与宿主菌的识别过程[12]。本实验室分离得到噬菌体Bp7,经鉴定为T4类噬菌体,但是其尾丝蛋白gp38与T4噬菌体进化关系较远[13]。试验证明噬菌体Bp7尾丝蛋白gp38参与宿主识别过程[14],因此推测其具有类似T2噬菌体gp38的作用,在噬菌体Bp7中位于长尾丝蛋白的末端,参与受体的识别[15]。为进一步研究噬菌体侵染细菌的机制,对Bp7尾丝蛋白gp38进行密码子用法分析。
相对同义密码子用法(RSCU)能比较直观的反映出密码子的使用偏性[16]。通过分析发现Bp7尾丝蛋白gp38密码子CUG为一种高频密码子,除了IME08外,其余4株噬菌体未曾使用过密码子CUG。密码子AGG在Bp7和JS10中为一种高频密码子,而在其余4株噬菌体中曾未使用。噬菌体Bp7尾丝蛋白gp38基因有18种高频密码子,其中编码疏水性氨基酸的密码子相对较多。Bp7尾丝蛋白gp38基因中有13种密码子的使用频率极低(图1),其中TCA、GCA、CTA和GGG更是未被使用。通过对终止密码子的分析发现,噬菌体Bp7尾丝蛋白对终止密码子UAA、UAG和UGA都使用过,而其余5株噬菌体只是用终止密码子UAA或UAG。密码子的使用偏性是指一种密码子的使用频率明显高于编码同一种氨基酸的其他密码子。对于不同的生物来说,密码子的偏性也是有所差异的,对于同源性很高的物种来说,其密码子的偏性也不尽相同。密码子的偏好性在一定程度上能够揭示有关物种间或某一物种的基因家族间的基因进化规律[17]。目前对密码子的偏性分析,在分子进化、翻译调控等研究领域,对不同物种的密码子使用偏性有大量研究[18]。噬菌体Bp7尾丝蛋白gp37偏爱以A或U结尾[19],本文分析结果表明,Bp7尾丝蛋白gp38基因偏爱C结尾,对A、G和U结尾的密码子使用频率差不多,而其余5株噬菌体偏爱A或U结尾。总之,Bp7尾丝蛋白gp38密码子特征与其他噬菌体密码子差异大,有必要进一步深入研究gp38在噬菌体Bp7中的作用。
对于同一密码子的使用频率的影响因素有许多,例如GC的含量及施加于基因序列上的突变的压力[20]。病毒侵染宿主也与其两者之间的密码子有关,密码子的偏性也与二者之间的进化有关。噬菌体侵染宿主菌时,其转录及翻译系统的适应程度也与这种差异有关,病毒密码子使用频率和宿主之间的差异是病毒在宿主中生存的重要调控机制之一[21],差异越小,病毒对其宿主的适应性就越好。评价密码子偏性的指标包括许多种,本文利用了CAI、CBI、ENC、GC3s和GC含量来反映密码子的偏性,由结果可以看出,这些指标的变化范围都比较小。CAI和CBI是两项重要的检测指标,可以直接反映密码子的偏性情况,也与外源基因的表达水平有一定的相关性[22-23]。ENC值也可以反映基因密码子的偏性,ENC值越大,其偏性越低,对应的内源基因往往表达量也越低[24-25],结果发现Bp7尾丝蛋白gp38的ENC值最大,因此可以看出Bp7尾丝蛋白gp38的偏性比较低,可以推断其内源基因的表达可能也比较低。
噬菌体Bp7与另外5株T4类噬菌体gp38基因密码子进行偏爱性比较发现差异性较大。同时对噬菌体Bp7尾丝蛋白gp38进化分析显示,Bp7与RB51亲缘关系最高,与其余4株噬菌体分属2个分支;聚类分析的结果显示Bp7独立于其他5株噬菌体,单独一类,这说明Bp7在进化上和密码子使用上都比较特殊。通过进化树与聚类分析,说明物种间的亲缘关系越近,密码子的偏爱性差异越小;亲缘关系越远,密码子偏爱性的差异越大。总之,噬菌体Bp7尾丝蛋白gp38密码子的偏性比较特殊,这可能与gp38自身的作用有一定联系,想充分确定这一现象,需要进一步进行侵菌试验研究。
通过对Bp7尾丝蛋白gp38密码子的分析,发现Bp7尾丝蛋白gp38在密码子使用及密码子偏性中与其余5株T4类噬菌体都存在较大的差异,并且这一点在进化树与聚类分析中也很明确,可见噬菌体Bp7尾丝蛋白gp38是比较特殊,分析结果为探讨Bp7尾丝蛋白gp38在宿主菌侵染过程中的作用提供帮助。
参考文献:
[1] Grantham R,Gautier C,Gouy M,et al.Codon catalog usage and the genome hypothesis[J].Nucleic Acids Res,1980,8(1):49-62.
[2] 杨金梁.分子生物学基因表达相关过程的建模与控制研究[D].山东济南:山东大学,2013.
[3] Marti R,Zurfluh K,Hagens S,et al.Long tail fibres of the novel broad-host-range T-even bacteriophage S16specifically recognize Salmonella OmpC[J].Mol Microbiol,2013,87(4):818-834.
[4] Zhang C,Liu W H,Ren H.Complete genome sequence of Bp7,an Escherichia coli bacteriophage with a wide host range [J].J Virol,2012,86(24):13832.
[5] Zhang C,Li W,Liu W,et al.T4-like phage Bp7,apotential antimicrobial agent for controlling dug-resistant Escherichia coli in chickens[J].Appl Environ Microbiol,2013,79(18):5559-5565.
[6] 吴德芹.多价噬菌体Bp7全基因组测序及尾丝蛋白gp37在宿主识别中的作用[D].山东青岛:青岛农业大学,2011.
[7] Fuglsang A.The effective number of codons'revisited[J].Biochem Biophys Res Commun,2004,317(3):957-964.
[8] Liu W Q,Zhang J,Zhang Y Q.Compare the differences of synonymous codon usage between the two species within cardiovirus[J].J Virol,2011,27(8):325.
[9] Yadav M K,Swati D.Comparative genome analysis of six malarial parasites using codon usage bias based tools[J].Bioinformation,2012,8(24):1230.
[10] Ahmad T,Sablok G,Tatarinova T V,et al.Evaluation of codon biology in citrus and Poncirus trifoliata based on genomic features and frame corrected expressed sequence tags [J].DNA Res,2013,20(2):135-150.
[11] 谷 丰,朱国东,张 琦,等.嗜酸热古菌病毒STSV2密码子偏嗜性及其对dUTPase外源表达的影响[J].生命科学研究,2014(1):33-38.
[12] Tetart F,Desplats C,Krisch H M.Genome plasticity in the distal tail fiber locus of theT-even bacteriophage:recombination between conserved motifs swaps adhesin specificity[J].J Mol Biol,1998,28(2):543-556.
[13] 颜 晨.多价噬菌体Bp7尾丝蛋白gp35、gp38在宿主识别中的作用以及噬菌体消毒试验[D].山东青岛:青岛农业大学.2012.
[14] 颜 晨,逯 凯,张 灿,等.噬菌体Bp7尾丝蛋白gp35、gp38对噬菌体增殖的影响[J].中国兽医学报,2013(5):722-726.
[15] Sabrina N T,Caumont-Sarcos A,Perrody E,et al.The gp38 adhesins of the T4superfamily:a complex modular determinant of the phage's host specificity[J].Genome Biol Evol,20113674-686.
[16] 唐晓芬,陈 莉,马玉韬.密码子使用偏性量化方法研究综述[J].基因组学与应用生物学,2013(5):660-666.
[17] Chiapello H,Lisacek F,Caboche M,et al.Codon usage and gene function are related in sequences of Arbidopsis thaliana [J].Gene,1997,20(9):1-38.
[18] 吴宪明,吴松锋,任大明,等.密码子偏性的分析方法及相关研究进展[J].遗传,2007,29:420-426.
[19] 逯 凯.多价噬菌体Bp7生物学特性及其尾丝蛋白gp37生物信息学分析[D].山东青岛:青岛农业大学,2013.
[20] 赵兴华.微生物基因组序列分析及相关网络资源的整合[D].天津:河北工业大学,2012.
[21] Sharp P M,LI W H.The codon adaptation index-a measure of directional synonymous codon usage bias,and its potential applicationsJ.Nucleic Acids Res19871531281-1295.
[22] Jesse M F,Ivan E.Relative codon adaptation:ageneric codon bias index for prediction of gene expression[J].DNA Res,2010,17(3):185-196.
[23] Tao Louis,Cai David.Computational modeling of the dynamics of simple and complex cells in primary visual cortex[J]. Shengli Xuebao,2011,63(5):401-411.
[24] 吴正常,王 靖,赵乔辉,等.猪脂多糖结合蛋白基因(LBP)的密码子偏好性分析[J].农业生物技术学报,2013,21(10):1135-1144.
[25] Sahoo S,Das S.Analyzing gene expression and codon usage bias in diverse genomes using a variety of models[J].Current Bioinformatics,2014,9(2):102-112.
Analysis of Codon Usage and Bias in Tail Fiber gp38 of Phage Bp7
SUN Hu-zhi,REN Hui-ying,ZHANG Can
(College of Animal Science and Technology,Qingdao Agricultural University,Qingdao,Shangdong,266109,China)
Abstract:In order to understand the characters of code usage in gene gp38of phage Bp7,polyvalent coliphage Bp7was isolated and identified as T4-like phage,the codon usage in gene gp38of phage Bp7was analyzed by bioinformatics softwares.The results showed as follows,the patterns of codon usage in gene gp38 of phage Bp7and other 5T4-like phages were obviously different.In gene gp38of phage Bp7,C end codon was commonly used,and A or U end codons were used in remaining 5phage strains;25kinds of high-frequency codons were identified except AUG(Met)and UGG(Trp).The bias comparison among gp38of phage Bp7and other 5phages showed that Bp7was different with other phage strains;Cluster analysis results showed that gene gp38of phage Bp7and the rest 5phage strains do not belong to same cluster.Gene gp38of phage Bp7on codon usage was special,the results of analysis of gp38codons will benefit to understand the invasion mechanism of phage Bp7and broaden the host range of phage Bp7.
Key words:phage;Bp7;tail fiber gp38;codon
作者简介:孙虎芝(1991-),男,山东乳山人,硕士研究生,主要从事兽医微生物与免疫学研究。*通讯作者
基金项目:山东省自然科学基金项目(ZR2013CQ024,ZR2009DM009)
收稿日期:2015-01-11
中图分类号:Q78;S854.5
文献标识码:A
文章编号:1007-5038(2015)07-0037-06