噬菌体vB-EcoP-Bp4尾部蛋白基因的密码子使用偏性分析

2016-08-15 07:51孙蓉蓉孙虎芝任慧英
动物医学进展 2016年7期
关键词:噬菌体

孙蓉蓉,孙虎芝,张 灿,任慧英

(青岛农业大学动物科技学院,山东青岛 266109)



噬菌体vB-EcoP-Bp4尾部蛋白基因的密码子使用偏性分析

孙蓉蓉,孙虎芝,张灿,任慧英*

(青岛农业大学动物科技学院,山东青岛 266109)

摘要:为了解噬菌体vB-EcoP-Bp4(简称Bp4)尾部蛋白基因的密码子使用特性,利用生物信息学方法对N4类噬菌体Bp4的3个尾部蛋白基因 gp10、gp11、gp13与其他5株同源性较高的噬菌体进行密码子偏性分析。结果表明,噬菌体Bp4尾部蛋白基因与其他5株噬菌体尾部蛋白基因密码子使用模式基本一致,偏爱以A或U的密码子结尾;除了AUG(M)和UGG(W)外,针对Bp4的3个尾部蛋白基因gp10、gp11、gp13分别确定了14种、17种及16种高频密码子。通过6株噬菌体尾部蛋白基因密码子偏性比较和聚类分析发现,Bp4可预测蛋白gp10与ECBP1最相近,尾丝蛋白gp11与EC1-UPM、PhAPEC5较相近,而尾刺蛋白gp13与ECBP1、EC1-UPM最相近。本研究发现噬菌体Bp4尾部蛋白基因密码子使用的偏性结果与同源性高低相一致,将为进一步研究噬菌体Bp4提供依据。

关键词:噬菌体;尾部蛋白;密码子偏性

生物体中编码20种氨基酸的密码子有61种,每种氨基酸至少由1种密码子编码。编码同种氨基酸的各同义密码子存在使用偏性[1-2],即同种密码子在不同物种中具有不同的使用频率,而且其密码子的使用方式也存在差别[3]。密码子的偏好性主要是由于基因突变和自然选择的结果,密码子使用偏性的研究有助于了解物种的起源与进化、基因的表达调控机制,并且能够提高转录及翻译的效率[1]。通过分析同义密码子的使用频率,可以推测出未知基因的表达水平,从而了解基因的表达调控机制;可以根据密码子使用的偏好性,对密码子进行改造,选择合适的密码子,可以提高转录、翻译效率,从而提高基因的表达量[4]。

噬菌体vB-EcoP-Bp4(以下简称Bp4)是一种烈性大肠埃希菌噬菌体,为短尾噬菌体科N4类噬菌体,分离自鸡场,具有宽宿主谱。噬菌体Bp4感染宿主菌的潜伏期为13 min,暴发量为32,宽噬率为33.3%[5],在预防和治疗大肠埃希菌感染方面具有开发前景。由于密码子使用偏性与噬菌体增殖效率及噬菌体蛋白的基因表达关系密切,而关于N4类噬菌体密码子偏性的报道很少,本文选择与噬菌体Bp4同源性较高并同时为肠杆菌科的5株噬菌体,分别对Bp4尾部蛋白基因进行密码子偏性分析,以了解尾部蛋白基因的密码子使用特点,为进一步开发利用噬菌体奠定基础。

1 材料与方法

1.1材料

多价噬菌体Bp4(GenBank:KJ135004.2)由青岛农业大学兽医微生物实验室分离并保存,Bp4的3个尾部蛋白分别是可预测尾部蛋白gp10(putative tail protein,237codons)、尾丝蛋白gp11(tail fiber protein,601 codons)和尾刺蛋白gp13(tail spike protein,705 codons)。与3个尾部蛋白基因有同源性的N4类肠杆菌科噬菌体分别是ECBP1(GenBank:JX415535.1)、EC1-UPM(GenBank:KC206276.2)、pSb-1(GenBank:KF620435.1)、PhAPEC5(GenBank:KF192075.1)及vB-Ecop-G7C(GenBank:HQ259105.1)。各个噬菌体尾部蛋白的基因序列均从NCBI下载获得。

ECBP1(GenBank:JX415535.1)、EC1-UPM(GenBank:KC206276.2)、pSb-1(GenBank:KF620435.1)、PhAPEC5(GenBank:KF192075.1)、vB-Ecop-G7C(GenBank:HQ259105.1)

1.2方法

利用Mobyle中的Codonw 1.4.4及Cusp程序计算密码子偏性的各种指标进行分析,包括相对同义密码子相对使用频率(RSCU)、密码子使用频率(Fraction)及高频密码子(HFC)、密码子适应指数 (CAI)、密码子偏爱指数(CBI)、有效密码子数(ENC)[6-7]。分别对6个噬菌体各个尾部蛋白基因序列中的总GC含量、密码子第1、2位GC含量平均值和第3位的GC含量进行分析,分别以GC、GC12和GC3表示,对分析的数据运用Excel进行做图分析。

利用MegAlign软件对6株噬菌体各个尾部蛋白基因进行氨基酸序列分析,构建系统发育树。运用SPSS软件对密码子偏性进行聚类分析[8],对2个结果进行比较。

2 结果

2.1噬菌体Bp4与其同源性噬菌体尾部蛋白基因密码子偏好性指标确定

2.1.1RSCU值分析RSCU值是指氨基酸的某一密码子的使用频次与其在同义密码子家族中的期望频次的比值。当RSCU>1时,该密码子使用频率高;RSCU<1时,则密码子使用频率低[9]。通过计算RSCU值,分别分析噬菌体Bp4的3个尾部蛋白与其余5株噬菌体的尾部蛋白基因的密码子用法(图1)。gp10基因的密码子使用情况和其他5株噬菌体尾部蛋白使用情况基本一致(图1),且所偏爱的密码子基本相同,其偏爱的共同密码子有CUU、AUU、AUG、CUU、UCA、AGU、CCU、ACU、GCU、GCA、UAU、CAU、AAU、GAU、GAA、UGU、UGG、CGU、CGA及GGU。gp10中有35个密码子RSCU值大于1,多以A和U结尾,而整个基因中以C和G结尾的密码子使用显著偏低。除噬菌体pSb-1的尾部蛋白基因以UGA或UAG为终止密码子外,gp10和其他4株噬菌体尾部蛋白基因都以UGA作为终止密码子。

gp11基因的密码子使用与其他5株噬菌体尾部蛋白基因类似(图2),gp11中有28个密码子RSCU值大于1,多以U结尾,而以C结尾的密码子显著偏低。gp11基因密码子偏性与vB-Ecop-G7C最相近,都以UGA为终止密码子。而PhAPEC5、EC1-UPM及ECBP1尾部蛋白基因终止密码子都是UAA,pSb-1则以UAG或UGA为终止密码子。

gp13基因的偏爱密码子与其他5株噬菌体尾部蛋白基本相同(图3),gp13中有30个密码子RSCU值大于1,多以A和U结尾,而以C和G结尾的密码子较低。除了噬菌体pSb-1尾部蛋白基因以UAG为终止密码子外,gp13与其他4株噬菌体尾部蛋白基因都以UAA为终止密码子。

3个尾部蛋白基因RSCU值都大于1的共同密码子有UUA、AUU、AUG、GUU、GUA、UCA、CCU、CCA、ACU、GCU、GCA、CAU、AAU、GAU、GAA、UGG、CGU及GGU;而3个尾部蛋白基因的终止密码子是不同的,分别是UGA、UAG、UAA。

2.1.2密码子使用频率分析通过密码子使用频率(Fraction)反映密码子使用的高频与低频。根据得到的Fraction值,利用高频密码子分析法进行分析。通过密码子使用频率分析发现,除AUG(M)和UGG(W)外,gp10基因确定了14种高频密码子:GCA、GCU、UGU、GAA、UUC、GGU、AUU、CUU、AAU、CCU、CGA、CGU、AGU及ACU。此外,GCC、GCG、GGC、AUA、CUC、CCC、CCG、AGG、CGC、CGG、UCU、ACG及GUC使用频率极低,其中GCC、GCG、CUC、CCC、AGG及UCU更是未被使用(图1)。将gp10基因与其他5株噬菌体比较,GAU(D)使用频率明显低于其他5株噬菌体,UUC(F)使用频率明显高于ECBP1和EC1-UPM,与pSb-1、PhAPEC5和vB-Ecop-G7C一致。

图1 6株噬菌体gp10基因密码子使用模式分析

图2 6株噬菌体gp11基因密码子使用模式分析

图3 6株噬菌体gp13基因密码子使用模式分析

gp11基因确定了17种高频密码子:GCU、UGC、GAA、UUU、GGU、AUU、AAA、CUG、CUU、AAU、CCU、CAG、CGU、UCA、UCU、ACU及GUA。此外,GCC、GCG、GGA、GGC、CUA、CUC、AGA、AGG、CGA、CGC、CGG、AGC、UCG、ACG及GUC使用频率极低,其中AGG未被使用(图2)。将Bp4尾丝蛋白基因与其他5株噬菌体相比,AGA(R)使用频率明显低于其他5株噬菌体,而CUG(L)和UCA(S)使用频率明显高于其他。

gp13基因确定了16种高频密码子:GCU、UGC、GAU、GAA、UUU、GGU、CAU、AUU、UUA、UUG、AAU、CGU、AGU、UCU、ACU及GUA。此外,GCG、GAC、CUA、CUC、CCG、AGG、CGG、AGC、UCC、UCG、GUC及GUG使用频率极低,其中AGG和CGG未被使用(图3)。将gp13基因与其他5株噬菌体比较,CUA(L)与PhAPEC5基本一致,但明显低于其他4株噬菌体。而UUG(L)明显高于其他。

2.2噬菌体Bp4与其同源性噬菌体尾部蛋白基因密码子频率比较

分别对Bp4、ECBP1、EC1-UPM、pSb-1、PhAPEC5及vB-Ecop-G7C的尾部蛋白基因密码子的Frequency(1/1 000)值进行统计并进行比较(图4~图6)。Bp4尾部蛋白基因的密码子频率与其他5株噬菌体的比值在0.5~2.0,说明密码子偏好性相近,若比值大于2.0或小于0.5,说明密码子偏好性较远。结果显示gp10基因大部分密码子使用偏好性与其他5株噬菌体相近(图4),gp10与ECBP1、EC1-UPM、PhAPEC5及vB-Ecop-G7C的比值小于0.5或大于2.0的密码子数都有3种,而与pSb-1、相比有18种(CUU、CUC、CUA等),这表明gp10基因密码子使用和pSb-1偏好性较远,而与其他4株噬菌体偏好性相近。

在gp11基因中(图5),gp11与PhAPEC5的比值小于0.5或大于2.0的密码子数有6种,分别是CUC、AUA、UCA、CCC、AGA及GGG,与EC1-UPM、pSb-1、PhAPEC5和vB-Ecop-G7C相比分别有12种(UUC、AGU、CCC等)、9种(UUC、GUC、ACG等)、10种(CUU、AUA、AGC等)和12种(UUU、UUC、CUC等), 这表明gp10基因密码子使用和PhAPEC5相对较近,与其他的4株相对较远。

gp13与ECBP1、EC1-UPM、PhAPEC5、pSb-1及vB-Ecop-G7C的比值小于0.5或大于2.0的密码子分别有1种(CCC)、2种(UCG、AGG)、9种(GUG、CCG、ACC等)、15种(UUU、CUU、CUA等)、14种(UUG、AUU、CCG等)(图6),表明gp13密码子使用和ECBP1、EC1-UPM最相近, 与PhAPEC5、pSb-1及vB-Ecop-G7C相对较远。

2.3CAI、CBI、ENC、GC3s、GC、GC12计算及相关性分析

利用Codonw 1.4.4软件分析6株噬菌体3个尾部蛋白基因的CAI、CBI、ENC、GC3s及GC数值(表1)。由表1可见,gp10基因的CAI(0.187~0.259)、CBI(0.007~0.112),gp11基因的CAI(0.249~0.327)、CBI(0.016~0.133),gp13基因的CAI(0.245~0.351)、CBI(0.013~0.168)均偏小,Bp4和其他5株噬菌体3个尾部蛋白基因的ENC值均较高(均大于42),说明Bp4尾部蛋白基因密码子的偏好性较低。软件分析Bp4的3个尾部蛋白基因的第3位碱基中G+C含量均明显低于基因中的G+C含量,gp10、gp11、gp13第3位碱基中G+C含量(0.320、0.319、0.301)均小于基因中G+C含量(0.424、0.433、0.420),表明Bp4与其他5株噬菌体尾部蛋白基因在密码子的使用特性上并不存在显著的偏好性。

图4 噬菌体Bp4 gp10基因密码子频率比较

图5 噬菌体Bp4 gp11基因密码子频率比较

图6 噬菌体Bp4 gp13基因密码子频率比较

蛋白Protein毒株StrainCAICBIENCGC3sGCGC12Bp4-gp100.2550.02253.230.3200.4240.464ECBP10.248-0.00753.280.3110.4220.466gp10EC1-UPM0.243-0.02947.820.2850.4150.468pSb-10.187-0.11251.160.3370.4120.448PhAPEC50.2590.02252.670.3510.4380.470vB-Ecop-G7C0.2520.01453.780.3380.4320.468Bp4-gp110.3050.10944.980.3190.4330.482PhAPEC50.3270.13342.140.3020.4200.467gp11EC1-UPM0.2940.09752.190.3460.4430.483vB-Ecop-G7C0.3050.13352.220.4010.4600.479pSb-10.2960.07746.040.2920.4220.475ECBP10.2490.01647.890.3200.3960.426Bp4-gp130.2450.04549.390.3010.4200.470ECBP10.2560.01949.320.3100.4230.472gp13EC1-UPM0.2620.01348.530.3020.4220.474PhAPEC50.2550.02551.580.3570.4310.462pSb-10.2560.09744.670.2140.4090.496vB-Ecop-G7C0.3510.16843.460.3130.4350.479

注:CAI:密码子适应指数;CBI:密码子偏爱指数;ENC:有效密码子数;GC3s为密码子第3位上G+C含量;GC:尾部基因中的G+C含量;GC12:密码子第一、二位上G+C含量。

Note:CAI,Codon adaptation index; CBI,Codon preference index; ENC,Effective number of codon; GC3s,G+C content in third position of codon; GC,tail protein gene G+C content; GC12,G+C content in first and second position of codon.

图7A和图7B分别为gp10基因中性绘图分析(GC12-GC3s)、ENC-GC3s相关分析。由图7A可知GC12和GC3s的变化范围均很小,回归系数为负值,表明GC12和GC3s的变异模式不同。由图7B可见6株噬菌体均靠近于趋势线,噬菌体尾部蛋白基因密码子的偏性可能受突变的影响较大。

图8A和图8B分别为gp11基因中性绘图分析(GC12-GC3s)、ENC-GC3s相关分析。由图8A可知除ECBP1外, gp11与其他4株噬菌体较为相近。由图8B可见6株噬菌体也均靠近于趋势线,说明噬菌体尾部蛋白基因密码子的偏性可能受突变和碱基组成的影响。

图9A和图9B分别为gp13基因中性绘图分析(GC12-GC3s)、ENC-GC3s相关分析。由图9A可知Bp4、ECBP1、EC1-UPM、vB-Ecop-G7C 4株噬菌体相近,与pSb-1和PhAPEC5有少许差异。由图9B可见GC3s与ENC相关性较好,除了PhAPEC5在趋势线的下方,但仍靠近于趋势线,说明其基因密码子的偏好可能受碱基组成的影响。

图7 gp10基因密码子GC3s、GC12及ENC相关性分析

图8 gp11基因密码子GC3s、GC12及ENC相关性分析

图9 gp13基因密码子GC3s、GC12及ENC相关性分析

2.46株噬菌体尾部蛋白基因进化树的构建及其密码子聚类分析

利用MegAlign对6株噬菌体3个尾部蛋白全基因核苷酸序列分析,构建系统发生树(图10)。分别对6株噬菌体尾部蛋白基因根据RSCU值进行聚类分析(图11)

A.gp10基因核苷酸序列系统进化树;B.gp11基因核苷酸序列系统进化树;C.gp13基因核苷酸序列系统进化树

A.gp10与其他5株噬菌体基因密码子聚类分析;B.gp11与其他5株噬菌体基因密码子聚类分析;C.gp13与其他5株噬菌体基因密码子聚类分析A.Cluster analysis of gp10 codons of six phages;B.Cluster analysis of gp11 codons of six phages;C.Cluster analysis of gp13 codons of six phages

图116株噬菌体尾部蛋白基因密码子聚类分析

Fig.11Cluster analysis of tail protein gene codons of six phages

3 讨论

噬菌体根据外壳结构,可分为无尾部结构的二十面体、有尾部结构的二十面体及丝状噬菌体。不同形态噬菌体之间亲缘关系相距较远。有尾噬菌体通过其尾部结构吸附到宿主细胞表面,进一步介导噬菌体基因组的注入及噬菌体的增殖,最终导致细菌细胞裂解。N4类噬菌体的尾鞘蛋白gp65通过与宿主菌的外膜蛋白发生直接相互作用,是噬菌体N4吸附到宿主细胞表面所必需的蛋白[10],但该蛋白在噬菌体Bp4中不存在,表明噬菌体Bp4虽然为N4类噬菌体,但其感染过程中的吸附机制明显不同于N4类噬菌体。所以对Bp4的3个尾部蛋白基因进行密码子偏性分析,为更好地研究噬菌体Bp4与宿主菌之间的相互关系奠定了基础。

密码子使用的相对概率(relative synonymous codon usage,RSCU)能比较直观地反映密码子使用的偏好性。密码子偏性可以揭示相关物种之间或同一物种基因家族间的进化规律,密码子的偏性主要体现在第3位碱基上,Bp4尾部蛋白基因第3位碱基上的GC含量不超过40%,含量较低,说明噬菌体Bp4尾部蛋白基因偏爱以A或U结尾的密码子,而使用以C或G结尾的密码子相对较少,这与噬菌体Bp4尾部蛋白基因相对较低的GC含量基本一致,这与王世峰等[11]对痘苗病毒基因组密码使用频率的分析结果相类似。Levin D B等[12]对NPVs基因密码子偏性研究认为病毒之间密码子的偏好性非常保守,与系统发生的关系也很接近,编码基因的GC含量直接由密码子使用的种类来体现。这一论断符合Grantham R等提出的基因组假说,即密码子应用的偏好性具有物种特异性。噬菌体Bp4的3个尾部蛋白基因的高频密码子比较多,而密码子AGG等未被使用,可能是因为这些密码子与宿主细胞中丰富的tRNA有关或与tRNA存在某种不利于翻译的关系,所以噬菌体尽量避免使用这些密码子。

无论是真核生物还是原核生物,其基因编码序列中的密码子用法在分子进化过程中是一种重要的进化现象。对于密码子使用偏好性的产生,Kimura M[13]的中性理论和Sueoka N[14-15]的选择学说是两种主要的理论模型。同一密码子的使用频率的影响因素有许多,例如GC的含量及施加于基因序列上的突变的压力[16]。评价密码子偏性的指标包括许多种,本文利用了CAI、CBI、ENC、GC3s和GC含量反映密码子的偏好性,由结果可看出,这些指标的变化范围都比较小,CAI和CBI可以直接反映密码子的偏性情况,也与外源基因的表达水平有一定的相关性。ENC值可以反映密码子家族中同义密码子使用不均的偏好程度,ENC值越大,其偏性越低,对应的内源基因表达量越低[17-18]。从6株噬菌体尾部蛋白基因的ENC值可看出,Bp4的3个尾部蛋白基因的ENC值大小居于中等位置,可以推断出其内源基因的表达较正常。

利用6株噬菌体的3个尾部蛋白基因的进化树分析,其同源性结果基本一致,说明亲缘关系较近的噬菌体常表现出相似的密码子使用频率[19]。gp10基因与ECBP1的同源性最近, gp13基因与EC1-UPM最近,说明不同噬菌体编码蛋白的基因亲缘关系越近,密码子的偏好性越小,反之则越大。密码子使用频率的聚类树状图常可用于推测不同物种、不同基因以及物种和基因之间在密码子使用方面的相似度或亲缘性,也可推测不同物种之间的进化关系。由聚类结果(图11)可看出,gp11基因单独聚成一类,这可能与两者分析的对象及所用的算法不同有关,原因也有待于进一步研究。

噬菌体一方面能够杀死宿主菌,另一方面还需要依赖宿主菌来增殖。对于病毒而言,由于它的蛋白质合成过程依赖宿主,宿主tRNA丰富的变化在理论上会影响着病毒的有效感染和复制,对病毒密码子的偏性起着决定性的作用。目前对噬菌体与其宿主菌之间密码子的相关性研究报道不多,江月[19]在杆状病毒的分子进化及密码子偏性研究中,在总G+C%上,杆状病毒(BmNPV)为41%,其昆虫宿主(家蚕)为48.3%,这个结果显示杆状病毒与其宿主昆虫在密码子使用上,在总编码序列的水平存在着对应性。我们从Codon Usage Bias Database(CUBDB)数据库中查到大肠埃希菌基因的G+C%含量都在50%左右,而本文分析的Bp4的3个尾部蛋白基因密码子的G+C%含量都在42%~44%之间,说明噬菌体Bp4与其宿主菌在密码子使用上也存在着对应性,这一结果与江月的研究结果相似,这也可能对以后研究噬菌体与宿主菌之间的进化关系提供依据。

本文分别比较了噬菌体Bp4的3个尾部蛋白基因与其他5株噬菌体尾部蛋白基因的密码子偏好性,噬菌体Bp4尾部蛋白基因与其他5株噬菌体尾部蛋白基因密码子使用模式基本一致,除了AUG(M)和UGG(W)外,Bp4的3个尾部蛋白gp10、gp11、gp13分别确定了14、17、16种高频密码子,6株噬菌体尾部蛋白基因密码子偏性比较和聚类分析发现,Bp4可预测蛋白gp10与ECBP1最相近,尾丝蛋白gp11与EC1-UPM、PhAPEC5较相近,而尾刺蛋白gp13与ECBP1、EC1-UPM最相近。通过对尾部蛋白基因密码子偏好性的分析,我们能更好了解噬菌体Bp4尾部蛋白基因密码子的使用与噬菌体增殖效率及噬菌体蛋白的基因表达等方面的关系,为开发利用该噬菌体奠定了基础。

参考文献:

[1]吴宪明,吴松锋,任大明,等.密码子偏性的分析方法及相关研究进展[J].遗传,2007(4):420-426.

[2]尚明照,刘方,华金平, 等.陆地棉叶绿体基因组密码子使用偏性的分析 [J].中国农业科学,2011,44(2):245-253.

[3]武志娟,钟金城.密码子偏性及其应用[J].生物学通报,2012(4):9-11.

[4]黄赛花,袁瑗,王成坤,等.大豆花叶病毒CP基因密码子使用偏性分析[J].中国油料作物学报,2015,37(2):148-153.

[5]马艳香.多价噬菌体Bp4生物学特性及全基因组测序分析[D].山东青岛:青岛农业大学,2014

[6]Fualsang A.The ‘effective number of codons’ revisited [J].Biochem Biophys Res Commun,2004,317(3):957-964.

[7]Grantham R,Gautier C,Gouy M,et al.Codon catalog usage and the genome hypothesis[J].Nucl Acids Res,1980,8(1):49-62.

[8]Weinstein J N,Myers T G,Oconnor P M,et al.An information-intensive approach to the molecular pharmacology of cancer [J].Science,1997,275(5298):343-349.

[9]唐晓芬,陈莉,马玉韬.密码子使用偏性量化方法研究综述[J].基因组学与应用生物学,2013(5):660-666.

[10]McPartland J,Rothman-Denes L B.The tail sheath of bacteriophage N4 interacts with theEscherichiacolireceptor.[J].Bacteriology,2009,191(2):525-532.

[11]王世峰,许洪林,陆柔剑,等.痘苗病毒基因组密码子使用频率分析[J].病毒学报,2002,18(3):227-234.

[12]Levin D B,Whittome B.Codon usage in nucleopolyhedroviruses[J].J Gen Virol,2000,81(9):2313-2325.

[13]Kimura M.The neutral theory of molecular evolution[J].Sci Am,1979,241(5):98-100,102,108.

[14]Sueoka N.On the genetic basis of variation and heterogeneity of DNA base composition [J].Proc Natl Acad Sci USA,1962,48:582-592

[15]Sueoka N.Directional mutation pressure and neutral molecular evolution [J].Proc Natl Acad Sci USA,1988,85(8):2653-2657.

[16]赵兴华.微生物基因组序列分析及相关网络资源的整合[D].天津:河北工业大学,2012

[17]吴正常,王靖,赵乔辉,等.猪脂多糖结合蛋白基因(LBP)的密码子偏好性分析[J].农业生物技术学报,2013,21(10):1135-1144

[18]Sahoo S,Das S.Analyzing gene expression and codon usage bias in diverse genomes using variety of models [J].Current Bioinformatics,2014,9(2):102-112.

[19]江月.杆状病毒的分子进化及密码子偏性研究[D].北京:中国科学院研究生院,2007.

收稿日期:2016-02-24

基金项目:山东省自然科学基金项目(ZR2015CM020,ZR2013CQ024)

作者简介:孙蓉蓉(1991-),女,山东威海人,硕士研究生,主要从事兽医微生物学与免疫学研究。*通讯作者

中图分类号:S855.3

文献标识码:A

文章编号:1007-5038(2016)07-0021-09

Analysis of Codon Bias on Tail Protein Genes of Phage vB-EcoP-Bp4

SUN Rong-rong,SUN Hu-zhi,ZHANG Can,REN Hui-ying

(CollegeofAnimalScienceandTechnology,QingdaoAgriculturalUniversity,Qingdao,Shandong,266109,China)

Abstract:To understand the characteristics of codon usage in tail protein genes of phage vB-EcoP-Bp4 (i.e.Bp4).Genes gp10,gp11 and gp13 were analyzed for the codon usages among N4-like phage Bp4 and other five phages by bioinformatics softwares.The results showed that the patterns of codon usage in tail protein genes of phage Bp4 were substantially consistent with other 5 phages,A or U- ended codons were prefered.In the genes gp10,gp11 and gp13 of phage Bp4,14,17,and 16 kinds of high-frequency codons were identified respectively except AUG(M) and UGG(W).The bias comparison and cluster analysis on tail protein genes among phage Bp4 and other 5 phages demonstrated that putative tail protein gene gp10 of Bp4 was most similar to ECBP1,tail fiber protein gene gp11 was most similar to EC1-UPM and PhAPEC5,while tail spike protein gp13 was most similar to ECBP1 and EC1-UPM.The codon usages of tail proteins were substantially consistent with the levels of homology,and the results will provide further guidance for the study of phage Bp4.

Key words:phage;tail protein;codon bias

猜你喜欢
噬菌体
微囊化噬菌体治疗细菌感染的研究
一株鸡白痢沙门菌噬菌体的发酵及后处理工艺研究
不同富集培养方法对噬菌体PEf771的滴度影响
1株感染多种致病性大肠杆菌噬菌体的生物学特性研究
噬菌体药代动力学研究进展
植物青枯菌噬菌体保存方法的研究
科学家发现最大噬菌体
有害细菌终结者:噬菌体
1 株貂源绿脓杆菌噬菌体的分离与鉴定
噬菌体疗法有望对付“超级细菌”