[摘要]编码氨基酸的密码子具有简并性,而每种生物对同义密码子的选择都有自己偏好性。大肠杆菌作为一个原核表达系统,经常被用来表达外源蛋白,从大肠杆菌密码子的使用,经典蛋白的氨基酸组成,邻近序列效应,相似终止密码子等方面阐述大肠杆菌密码子偏好情况,为实现外源蛋白在大肠杆菌中的高效表达提供参考数据。
[关键词]大肠杆菌 密码子偏好性 邻近序列效应 相似终止密码子
中图分类号:Q50 文献标识码:A 文章编号:1671-7597(2009)0110003-01
目前生物医药研究和生物技术生产的主要方法是利用外源表达系统来表达目的蛋白,常用的外源表达系统有大肠杆菌表达系统,酵母表达系统,哺乳动物表达系统等。要实现目的基因在外源表达系统中的成功表达和尽可能地提高其表达量,可以通过增加目的基因剂量,目的基因密码子优化,改善培养条件等方法实现,其中目的基因密码子优化起到关键的作用。如果目的基因的密码子与表达宿主不匹配,则会降低mRNA的翻译效率和稳定性,甚至会造成mRNA翻译的提前终止。[1]目前可以通过两个途径来解决这个问题:①提高宿主表达系统中底丰度的tRNA;②对目的基因进行密码子改造,使它的密码子是宿主表达系统的高频密码子,也就是通常所说的密码子优化。[2]
编码氨基酸的密码子一共有64个,其中一个是起始密码,两个终止密码,而氨基酸的种类有20种,所以说氨基酸的密码子存在简并性。真核生物和原核生物所偏好的密码子不一样,高效表达和低效表达在同义密码的选择上也有所不同,[3][4]甚至同一个基因的不同区域也存在这种现象[5],也就是说不同生物根据情况对同义密码的选择有偏好性。高效表达的基因具有密码子偏好性是因为对翻译效率和准确性的要求更高,[6]同一个基因中保守序列比非保守序列对密码子更具偏好性,分析其原因也是为了提高翻译的准确性。
在自然选择过程中,对翻译效率最大化的需要引起对同义密码不同程度的选择。蛋白的翻译包括起始,延伸和终止三个过程,有证据证明蛋白合成过程中起始阶段是蛋白质合成效率的限制因素,[7]而蛋白合成的起始速率取决于核糖体和mRNA二者结合的速率,随着mRNA浓度的提高可以有效地提高蛋白的合成速率,同时mRAN中含有高频密码子的翻译效率高于低频密码子。最优密码子与高丰度的同功tRNA呈正相关的关系。
一、密码子优化的网站、软件
密码子优化可以通过一些网站在线软件来实现,例如Gene Design[8]、Optimizer[9]、Synthetic Gene Designer [10]、Gene Dsigner[11]。
二、大肠杆菌密码子使用和经典蛋白的氨基酸组成
大肠杆菌表达系统被广泛地应用于外源蛋白的表达,通过诱导,目的蛋白的表达量可以达到总蛋白的60%-70%。[12]近年来有很多文章报道通过改造目的基因中稀有密码子而变成大肠杆菌中高频密码子。从而大大地提高其表达量,如David.LAKEY等人通过改造85B抗原的5个稀有密码子使表达量提高到原来的54倍。他们用Northen blotting分析发现目的基因的mRNA的量只增加1.7-2.5倍,所以说表达量的提高是由于翻译效率的提高。[13]因此如果需要在大肠杆菌中表达外源蛋白是需要考虑大肠杆菌中稀有密码子和高频密码子使用情况。[14][15]另外,有文献报道如果需要表达的目的蛋白的氨基酸组成不是大肠杆菌“典型”蛋白氨基酸组成,[16]那目的蛋白的表达量也会受到影响。
三、低频密码子子簇的影响
同义密码子中的一些稀有密码子簇会抑制目的蛋白的表达量或引起移码突变。如AGG/AGA,AUA,CUA,CUA和CCC,[16][17]出现这种现象的原因是当mRNA在翻译的时候遇到稀有密码子时,翻译复合物就会暂停下来等待Lys-tRANAuuu,于是在这个停顿的位点就会发生+1或是-1移码突变。[19]当通过共表达arg U(dnaY)基因时,可以实现稀有密码子簇的高效表达。[17]Rosenber[19]等构建了一个稀有密码子簇作用检验系统。这个系统的基本原理是把目的基因和对照基因置于同一个启动子即T7启动子下,对照基因来自T7噬菌体的基因9。作者用这个系统检测了一个具有312个氨基酸的蛋白。他们发现当AGG在N端时对目的蛋白表达量的影响比在C端大,而且稀有密码子簇的数量于对照基因的表达量呈负相关。即使目的蛋白中只含有单个的AGG/AGA稀有密码子,也会引起翻译问题,如在E.coli K-12中表达bovine placental lactogen(BPL),含有9个单个的AGG,BPL的蛋白表达量底于总蛋白的10%,[20]而且出现目的蛋白分子量不均一意想不到的结果。[21]进一步研究发现是由于翻译过程多肽链中6位的精氨酸和87位的leu异亮氨酸的错失。
四、邻近序列效应,相似终止密码子和错义翻译
为了尽最大可能提高目的蛋白在大肠杆菌中的表达量,不仅要考虑将目的蛋白的稀有密码子改造成大肠杆菌中的高频密码子,而且还要考虑同义密码子的邻近序列效应(context effect),[22]OttoG.Bery和PedroJ.N. Silva [23]研究了大肠杆菌中具有2个简并密码子的氨基酸邻近6个碱基的影响,如谷氨酸的临近序列是CCAGG,因为在这个序列中如果发生突变更容易被修复系统所修复。[24]所以大肠杆菌内密码子如果以C/T为结尾,那它所偏好的临近序列是密码子后的第二位是G,而其中对NACNG的选择大于NATNG。一些密码子如果在特定的临近序列内,这个序列会较为容易发生移码突变,如编码Phe的TTT在C或是T之前,编码Lys的AAA在A或是G之前,所以对Phe的偏好密码子是TTC而不是TTT,是为了尽可能地减少移码突变。TTTN和AAAA/AAN应该避免,尤其是高效表达的基因。而TTTR(Leu)和AAAY(Asn)会同时引起移码突变和错误翻译,而且这个序列对合成持续性错误敏感。 [23]
有些密码子如(TAT)和大肠杆菌中终止密码子(TAA)很相似,翻译时特别是当TAT在序列的+4位置时能够被强烈地错认为终止密码子而使翻译提前终止。[25]Precup等发现在大肠杆菌中TTC和TTT错误翻译概率很高,例如在argⅠ基因编码区中,第3个和第8个密码子分别是TTT和TTC,所编码的氨基酸是Phe,而它们的邻近序列分别是GTTTT和TTTCC,即使把第8个密码子换成大肠杆菌中的同义高频密码子也不能降低其错误翻译的几率。[26]在富含T的序列里(TTGT/TGTT),TGT(Cys)会被错误地翻译成Trp。[27]
在大肠杆菌表达系统中,无论是高、中、低偏好性的基因在前20个密码子中都偏好以密码子第三位是A而G是尽量避免的。[28]而高效表达的基因在前100150个密码子中以G和C为密码子的第三个碱基的比例逐渐上升。[29]
参考文献:
[1]Gustafsson,C.,et al.(2004) Trends Biotechnol.,22,346-353.
[2]Hernan,R.A., et al.(1992) Biochemistry, 31, 8619-8628.
[3]Coghlan, A., and K. H. Wolfe, 2000 16: 1131-1145.
[4]Akashi, H., 2003 164: 1291-1303.
[5]AKASHI, H., 1994. Genetics 136:927-935.
[6]Carlini, D. B.,2003. Genetics 163: 239-243.
[7]BUI.MERM, ., 1991 Genetics 129: 897-907.
[8]Richardson,S.M., (2006) Genome Res., 16,550-556.
[9]Pere Puigbo` 1, Eduard Guzma´ n1,2, et al,(2007) Nucleic Acids Research,Vol. 35, W126-W131.
[10]Wu,G., et al. (2006) Protein Expr. Purif., 47, 441-445.
[11]Villalobos,A., et al. (2006) BMC Bioinformatics, 7, 285.
[12]S. Jana . J. K. Deb,2005 Appl Microbiol Biotechnol67: 289-298.
[13]DAVID L. LAKEY, et al, 2000 INFECTION AND IMMUNITY, 0019-9567/00/$04.0010 Jan.p. 233-238.
[14]Saier MH Jr (1995) FEBS Lett 362:14.
[15]孙乃恩,et al.1990 《分子遗传学》 南京大学出版社. 255.
[16]Wada K, et al.T: Nucleic Acid Res 1992, 20:2111-2118.
[17]Chen GFT, Inouye M (1994) Genes Dev 8:2641-2652.
[18]Lindsley D, Gallant J (1993)Proc Natl Acad Sci USA 90:5469-5473.
[19]Rosenberg AH, et al.1993 G: J Bacteriol, 175:716-722.
[20]Brinkmann U, et al. P: Gene 1989, 85:109-114.
[21]Kane JF, Violand BN, Curran DF, Staten NR, Duffin KL, Bogosian G: Nucleic Acids Res 1993, 20:6707-6712.
[22]Bulmer, M. (1990) Nucleic Acids Res., 18, 2869-2873.
[23]Otto G. Berg* et al.1997 Nucleic Acids Research, Vol. 25, No. 7 1397-1404.
[24]Lieb, M. and Bhagwat, A.S. (1996) Mol. Microbiol., 20,467-473.
[25]Pavlov,M.Y.,et al,1998 J.Mol.Biol.,284,579-590.
[26]Precup,J.Ulrich,et al 1989 Mol Gen. Gener.,218,397-401.
[27]Carrier,M.Jand Buckingham,R.H1984 J.Mol.Biol.,175,29-38.
[28]Andersson,S.G.E and Sharp,P.M 1996L.Mol.Evol.,42,525-536.
[29]Sean D.Hooper,Otto G.Berg 2000 Nucleic Acids Reseadrch,VOL.28,No.18 3517-3527.
作者简介:
郑彬琼,女,福建莆田,福建师范大学生命科学学院,研究方向:发育生物学。