■文/马晓颦
在自然界中,大部分生命都使用64个密码子进行编码。这64个密码子中,61个密码子编码天然的20种氨基酸。这些氨基酸通过首尾相连、脱水缩合而形成不同长度的共价多肽链——不同分子量大小的蛋白质。剩下的3个密码子则起到终止翻译蛋白质的作用。
研究人员发现,这20种天然氨基酸中的18种存在同义密码子(1种氨基酸有1个或多个密码子)编码。但实际上,这些同义密码子有着相似的功能,其原因尚不明确。2013年,美国哈佛大学学者大胆地做了改造尝试。他认为,TAA、TAG、TGA都是执行终止蛋白翻译的命令,没有必要用3个终止密码子。于是,他将大肠杆菌基因组上的终止密码子TAG替换成TAA,成功实现了同义密码子的替换。
不仅终止密码子存在冗余性,编码20种天然氨基酸的61个密码子也存在同样的重复问题。2016年,研究人员将大肠杆菌中含有靶标密码子的20千碱基对(Kbp)基因组进行替换,实现了重新编写密码子的人工改造。然而,这一技术仅限于基因组小范围内的同义密码子替换。那么,我们是否可以将这项技术应用于整个基因组内的同义密码子替换之中呢?
不难想象,实现整个基因组内的同义密码子替换,其难度相当大。正如DNA化学结构的共同发现者弗朗西斯·克里克(Francis Crick)提出的“冰冻事故”理论:一旦基本生活形式发生变化,三重密码就会被锁定,因为任何偏离通用程序的做法都将是一个巨大的劣势。
最近,英国剑桥大学医学研究委员会分子生物学实验室的研究团队成功地为大肠杆菌完整基因组重新编写了一套遗传密码子,实现了合成生物学家合成全基因的梦想。
研究人员首先设计了开放阅读框(Open Reading Frame,ORF)内基因序列TCG、TCA、TAG替换为AGC、AGT、TAA的基因组序列。考虑到这些被替换的密码子会出现在两个相同或者相反方向的ORF重叠区域,研究人员对其进行了相应处理。当重叠区域所属的ORF方向相反时,研究人员将重叠区复制成两份,分别连接到两个ORF的3’端;当所属ORF的方向相同时,将重叠区域复制并在之间插入重叠区域上游20个碱基对(bp)的序列。最终,研究人员设计了3 978 937bp的大肠杆菌基因组序列。
为把大肠杆菌基因组替换为设计的基因组序列,研究人员将设计的基因组分成8个部分,每个部分约0.5兆碱基对(Mbp)。然后,他们再将每个部分划分为4~5个片段(Fragment),划分过程中尽量避开必需基因,最后得到37个片段。每个片段再被进一步分成9~14个小片段(Stretch),每个小片段长度在10 Kbp左右。为了将这些合成的片段拼接起来,研究人员在酵母中利用同源重组的方法将其分步组装至细菌人工染色体中,然后重组替换至大肠杆菌基因组中对应的部分。这个过程迭代使用5次,就能让大肠杆菌基因组多个DNA节段被合成DNA取代。
接下来,研究人员对构建的部分基因组进行测序,发现仍有部分同义密码子未被替换。针对这一问题,研究人员及时进行优化并将全部的TCG、TCA、TAG替换为人工设计的同义密码子AGC、AGT、TAA。最后,研究人员使用细菌接合的方法,获得新型的大肠杆菌,其被命名为Syn61。该菌株可存活,但生长速度比天然大肠杆菌较慢,形状有些稍长。
遗传密码的改写正是解冻代码、开启生命基本公式改写的新篇章,是迄今为止全球最庞大的DNA编码替换研究。
这一研究正是解冻代码、开启生命基本公式改写的新篇章,是迄今为止全球最庞大的DNA编码替换研究,实现了合成生物学家合成完整人类基因组的初步梦想。
研究人员表示,他们试图在今后的研究中将转运氨基酸的tRNA改去接附其他的非天然氨基酸,进而在细胞或生物体内合成新的多肽或蛋白质。当然,在未来的研究中,他们还想尝试合成更多种的非天然氨基酸及氨基酸聚合物。通过非标准氨基酸的掺入,蛋白质能够被多种标记探针修饰。例如,用于研究电子传递的氧化还原探针,适用于核磁共振分析的同位素探针和适用于X射线衍射的重原子标记探针等。此外,非标准氨基酸侧链标记芳基叠氮、苯甲酮或双吖丙啶可在光诱导下发生交联反应,从而检测到免疫沉淀可能检测不到的体内蛋白相互作用。交联氨基酸还能被特异地化学断裂,从而简化质谱分析过程。此外,非标准氨基酸修饰的细胞因子、生长因子和抗体能延长半衰期并增强治疗效果。例如,将CD3抗体标记上能特异结合肿瘤表面抗原的小分子,从而可以帮助细胞毒性T细胞识别癌细胞,这会在前列腺癌移植性小鼠模型及其他疾病模型中发挥良好的治疗作用。此外,将琥珀密码子TAG掺入丁型肝炎病毒、艾滋病病毒或甲型流感病毒的基因组中,使病毒只能在琥珀抑制的宿主中进行复制,从而使得改造后的病毒复制受限,进而降低病毒感染的风险。
研究人员还指出,大肠杆菌在癌症、多发性硬化症、心脏病和糖尿病的药剂生产和治疗中得以广泛应用。但是,当遭到病毒或其他微生物入侵时,整个生产过程都会被破坏。此研究的主要负责人认为,此次重新编码的密码子与通用的密码子不同,对应合成的大肠杆菌比天然的大肠杆菌具有一定的防御性,使得入侵的病毒在体内很难传播,这样可以保护整个生产过程免受病毒的攻击。
从低等到高等的生命世界,基本采用一套固有的遗传密码,也就是说该套遗传密码在很长的进化过程中是保持不变的。因此,这套遗传密码在生物界是普遍通用的。目前,研究发现,人线粒体中的密码子与通用密码子有些不同。例如,人线粒体中共有4个终止密码子(AGA、AGG、TAA和TAG),与通用的3个(TAA、TAG和TGA)终止密码子不同。但是,从整体密码子的使用来看,类别差异不是很大,说明生物界中密码子较为保守。
在通常情况下,1个密码子的第3个碱基是没有特异性的,当密码子的第3个碱基改变时,也会合成原来的氨基酸——密码子的简并性。密码子简并性的出现对于降低细胞内有害突变有着重要意义。即使当DNA碱基出现突变时,对应的密码子还是可以编译成原有的氨基酸的,不会影响相应蛋白质的翻译。因此,密码子的简并性可以抵御有害突变。此外,编译同一种氨基酸的多个密码子能够大大提高肽链合成的速率和延长效率。在某种程度上,密码子简并性的存在可阻止因单一密码子剂量不足或者突变引发的肽链合成提前终止的现象发生。倘若我们人工替换靶标密码子,那么天然存在的64个密码子中仅有部分密码子发挥作用。这在一定程度上不仅减少编译氨基酸所需的密码子,还会增加肽链合成提前终止的概率。
此外,在这项研究中,我们发现Syn61菌株生长速度和形态发生了改变。那么,密码子的删减或替换会不会对整个基因网络结构和生物本身产生影响呢?已有的研究结果表明,编码1种氨基酸的多个密码子的存在有一定的必要性。例如,转运氨基酸的tRNA不同,与之对应的编译密码子也会不同。倘若实行不同密码子的替换,那么tRNA转运和蛋白翻译的效率也许会受到影响,最终影响肽链的合成和蛋白质的表达。mRNA的稳定性又是分子作用力的体现之一。同义密码子间进行互换,原有密码子的分子量发生变化,分子作用力也会变化。随之,mRNA的稳定性可能会受到影响,最终影响蛋白质的表达或后续的功能。密码子除了参与翻译氨基酸外,还会充当一些转录识别因子,拼接调控因子的识别对象。密码子间进行互换,也许会影响细胞内的转录水平。
从生物进化的角度而言,密码子的简并性在物种的稳定上起着重要的作用。对同一种氨基酸而言,每个物种的基因组里使用的编译密码子有时是不同的。进化上越接近的物种,这种密码子的偏好性就会越接近。倘若实行人工替换密码子,是否会影响物种间的进化研究,我们未能知晓。
总之,在这一研究中,人工替换的编译密码子仅有3处。是否会出现上述的担忧?也许会有,也许根本没有,我们无从谈起。如果针对基因组内多处的密码子进行同义替换和删减,大大颠覆原有生物基因编码的固有模式,是否会有不可预测的变化?我们也未知。我们只希望这一技术能够不断地被挖掘并优化,为合成生物学家在人类基因组的改造上提供更有利的帮助。