DNA、RNA与蛋白质到底是什么关系?

2021-05-27 11:21汤波
南方周末 2021-05-27
关键词:信使氨基酸遗传

南方周末特约撰稿 汤波

遗传密码与氨基酸的对应关系,每三个核苷酸组合对应一个氨基酸。

1968年,罗伯特·霍利(Robert Holley)、马歇尔·尼伦伯格(Marshall Niren-berg)和哈尔·葛宾·霍拉纳(Har Gobind Khorana)获得诺贝尔生理学或医学奖。

★在RNA病毒以及mRNA疫苗备受关注的今天,了解一下那个时代的顶尖科学家是如何厘清DNA与RNA以及蛋白质之间的复杂关系是很有必要的。

1953年DNA双螺旋结构公布不久,著名的俄罗斯裔美国物理学家乔治·伽莫夫(George Gamow)将一份手稿交到DNA双螺旋结构发现之一的弗朗西斯·克里克(Fran-cis Crick)的手中,他在手稿中首次提出了DNA的A、T、C、G这4种碱基与蛋白质的20种氨基酸的对应关系,给了克里克很大的启发。

物理学家加盟

乔治·伽莫夫1904年出生于俄国,毕业于列宁格勒大学,28岁就入选了苏联科学院院士,成为最年轻的院士。1934年伽莫夫移居美国,在乔治·华盛顿大学等学校担任物理学教授。伽莫夫的研究领域极广,包括原子衰变、宇宙起源和遗传密码等,在这些领域提出了一系列开创性的理论,如倡导和发展了宇宙大爆炸理论,并预言了宇宙微波背景辐射。后来美国两位年轻的工程师阿诺·彭齐亚斯和罗伯特·威尔逊观测到这种源自宇宙起源之初的辐射,1978年获得诺贝尔物理学奖。遗憾的是,此时伽莫夫已过世10年。

不过,伽莫夫最为世人所熟知的,是他在科普领域的成就。伽莫夫一生共出版了25部著作,其中18部都是科普图书,包括《物理世界奇遇记》和《从一到无穷大》等。至今,这些通俗易懂、风趣幽默的科普名著仍然在全世界范围内畅销,影响了一代又一代的年轻人。

虽然1944年薛定谔在《生命是什么》一书中提到过“遗传密码本”这个概念,但是包括薛定谔本人,当时很少有科学家关注DNA与蛋白质的对应关系。读过沃森和克里克发表在《自然》杂志的文章之后,伽莫夫将目光从自己擅长的量子力学和宇宙学研究领域转向生命的遗传密码,开始思考DNA与蛋白质到底有什么关系。

伽莫夫以一名理论物理学家化繁为简的直觉,大胆断定组成蛋白质的氨基酸只有20种,并推测DNA链相连的3个核苷酸(三联体)编码一种氨基酸,因为如果是1个核苷酸对应一种氨基酸,则只能编码4种氨基酸,如果相连的2个核苷酸对应一种氨基酸,也只能编码16种氨基酸,都少于组成蛋白质的20种氨基酸,如果相连的4个核苷酸组合对应一种氨基酸,则会出现44个四联体核苷酸组合,即编码256种氨基酸,又远远多于已知的氨基酸数,只有当相连的3个核苷酸对应一种氨基酸,则只有64个三联体组合,更接近20种氨基酸。1954年10月,伽莫夫将自己的见解发表在《自然》杂志上,在文章中他提出每4个核苷酸形成一个空穴,氨基酸镶嵌其中,就像“钥匙和锁”一样。同时,他将文章副本给了克里克,激起了克里克研究遗传密码的兴趣。

此时,伽莫夫和另一位DNA双螺旋结构发现者之一的詹姆斯·沃森(James Watson)发起成立了一个RNA领带俱乐部,成员包括20位著名的科学家,每人代表一种氨基酸,并佩戴一个专属领带。其中伽莫夫代表丙氨酸,沃森代表脯氨酸,克拉克代表酪氨酸,发现DNA碱基组成的欧文·查伽夫代表赖氨酸。在这个俱乐部里,科学家们经常就各自尚未公开发表的观点或研究内容进行讨论。受到伽莫夫的启发,克里克开始认真研究遗传密码,并在1955年向俱乐部提交了一篇论文手稿。克里克肯定了伽莫夫关于三联体密码子和多个密码子编码同一种氨基酸等理论贡献,同时指出DNA的密码子并非与蛋白质的氨基酸直接对应,而是需要有中间物质RNA的帮助。

中心法则

沃森这时早已认识到RNA在蛋白质合成中所起的重要作用,并将研究重心重新转向他博士后时的研究对象——病毒RNA。沃森在1953年就提出,DNA必须先将信息传递给RNA,通过RNA才能指导合成蛋白质,因为DNA在细胞核中,而蛋白质合成的场所是细胞质中的核糖体。沃森和克里克都意识到这种RNA就像“信使”,专门用来传递DNA上的遗传信息,这种信使具体是什么样的RNA呢?

刚开始,克里克并不确定信使RNA是什么,他还一度认为核糖体RNA(rRNA)就是信使RNA,每个核糖体以rRNA为模板合成一种蛋白质,但是这与当时的一些科学发现相矛盾,因为不管是什么细胞,rRNA的序列基本都是一样的,却能合成氨基酸序列完全不同的蛋白质。

1959年,来自法国巴斯德研究所的亚瑟·帕迪(Arthur Pardee)、弗朗索瓦·雅各布(Francois Jacob)和雅克·莫诺(Jacques Monod)通过乳糖操纵子实验,推测可能存在一种容易降解、不稳定的信使分子。一般情况下,大肠杆菌需要在含有乳糖的培养基中生长,大肠杆菌需要在体内合成β-半乳糖苷酶来分解乳糖,以获得能量。帕迪等人发现了一种β-半乳糖苷酶基因突变的大肠杆菌,因为缺乏β-半乳糖苷酶而无法分解乳糖,这种突变体无法在含有乳糖的培养基中生长,但是如果将正常的β-半乳糖苷酶基因加入到培养基中,这些突变的大肠杆菌几分钟内又能合成大量的β-半乳糖苷酶,并在乳糖培养基中开始生长。帕迪等人推测,正常的β-半乳糖苷酶基因的加入并不能产生新的核糖体RNA,必然存在一种可以迅速分解的信使分子,β-半乳糖苷酶才得以合成,但是他们还说不清这种信使分子是什么。

在英国剑桥大学国王学院举行的一次小型研讨会上,当克里克看到帕迪等人的研究报告时,兴奋不已,马上意识到信使RNA并非核糖体RNA。克里克的同事兼合作伙伴、南非生物学家悉尼·布伦纳(Sydney Brenner)也参加了这次会议,决定分离出这种信使RNA。1961年,布伦纳与雅各布及来自加州理工学院的马修·梅塞尔森(Matthew Meselson)合作,经过反复实验,最终捕获到了这种稍瞬即逝的信使分子,原来是一条与DNA互补的RNA分子,被称为信使RNA。

这时候,克里克意识到,细胞核中的DNA遗传信息有两个流向,一个是DNA的自我复制,即细胞在一分为二的分裂过程中,会将双链DNA打开形成单链DNA,再以每条DNA单链为模板,复制另一条互补的DNA单链,形成两条新的双链DNA,各自随机进入一个子代细胞,每条双链DNA都含有一条原有的DNA单链。另一个流向则是DNA指导蛋白质合成的过程,即信使RNA将DNA的遗传信息刻录下来,从细胞核转运至细胞质中的核糖体,核糖体再以信使RNA为模板,将各种氨基酸按顺序组装成长链,最终形成独特的空间结构,即蛋白质。

这正是克里克1958年提出的一项影响深远的遗传信息传递规律——中心法则的主要内容,即遗传信息从DNA传递给RNA(转录),再从RNA传递给蛋白质(翻译),还包括DNA的自我复制,并指出“信息一旦传递给了蛋白质就不能再传出”。不过,后来其他科学家又相继发现,不仅DNA可以自我复制,有些RNA也可以自我复制,而且在逆转录酶的作用下,RNA还可以逆向转录成DNA。1970年,克里克根据这些新的发现,对中心法则进行了修正,之后一直沿用至今。

但是,游荡在细胞质中的各种氨基酸如何有序地集中到核糖体进行组装的呢?

早在1955年,克里克在他向RNA领带俱乐部提交的论文中,提出了一种连接体假说,即细胞质中存在一种连接氨基酸和RNA模板的连接体,主要功能是在细胞质中寻找并抓取氨基酸,并将这些氨基酸运送到核糖体进行组装。不久,其他科学家发现的确存在一种具有连接体功能的RNA,即转运RNA,以十字“发卡”结构形式在细胞质中游弋,一端可以识别信使RNA上的遗传密码,另一端则用来结合对应的氨基酸,这一发现反映出克里克超人的智慧和洞察力。

在1961年12月发表于《自然》杂志上的一篇论文中,克里克总结道:遗传密码是由三联体碱基构成,每个三联体依次排列、不重叠,遗传密码是从固定起始位点开始读取,而且多个三联体可以对应同一种氨基酸。这时,克里克无疑已经成为遗传密码研究领域最活跃的科学家,他的研究热情也感召了很多年轻科学家投身到遗传密码的破译工作中,马歇尔·尼伦伯格(Marshall Nirenberg)正是其中的佼佼者。

破解遗传密码

尼伦伯格1927年4月出生于纽约市的一个犹太家庭,从小就对生物学感兴趣,1952年在佛罗里达大学获得动物学硕士学位,之后转到生物化学专业,于1957年获得密歇根大学的博士学位。同一年,尼伦伯格进入美国国立卫生研究院从事博士后研究,并于1959年正式进入美国国立卫生研究院工作,直到2010年1月过世。

1959年之前,尼伦伯格主要研究糖分子如何在体内运输和代谢,以及酶的纯化等工作,基本没有基因调控和蛋白合成方面的经验,但是当他看到帕迪、雅各布和莫诺的乳糖操纵子研究成果之后,突然对分子遗传学产生极大兴趣,经过一番深思熟虑之后,决定加入到破解遗传密码的研究队伍中,他认为这是“生物化学最令人兴奋的研究领域之一”。当他把这一决定告诉同事时,有同事告诫他说,一个新入职的研究人员需要尽快做出研究成果,以保住饭碗,贸然进入自己不熟悉的领域,一旦不能有所建树,有可能很快被研究所解聘,要找到新的研究职位,那就更难了。尼伦伯格自己也清楚,这是非常冒险的一个决定,面临世界各国优秀科学家的激烈竞争,自己也害怕失败,但是探索未知世界、取得非凡突破的愿望占了上风。

很快,尼伦伯格单枪匹马地投入到了研究工作中。他首先试图重复帕迪、雅各布和莫诺的方法,但是效果并不理想。这时,尼伦伯格偶然注意到哈佛大学两位科学家发明了一种无细胞蛋白合成系统,这让他喜出望外。无细胞蛋白合成系统是用酶将细菌的细胞壁破坏,保留细菌的其他成分,通过添加有碳-14同位素标记的氨基酸,可以在体外观察蛋白质是如何合成的。尼伦伯格敏锐地意识到这种方法在遗传密码研究中的重要用途,他设想,如果将内源的DNA或RNA破坏掉,再加入一些已知序列的外源DNA或RNA片段,就可能观察到这些DNA和RNA在蛋白质合成中的作用。

尼伦伯格计划用两年时间建立这一系统,因为这一实验过程非常繁琐,需要开展大量实验摸索条件,而且只有他一个人,什么都需要从头学起。大约经过一年半的努力,尼伦伯格终于将这一系统初步建立起来,这时候来自德国的博士后海因里希·马特伊(Heinrich Mat-thaei)加入到尼伦伯格的实验室。马特伊原本主要从事植物学研究,有同位素研究经验,也对在试管内进行蛋白质合成的研究非常感兴趣,于是找到尼伦伯格。孤军奋战的尼伦伯格当然非常乐意,很快组建了师徒二人组。

1961年初,尼伦伯格让马特伊将一段多聚尿苷酸(…UUUUUU…)加入到无细胞蛋白合成系统的20个试管中,同时向每个试管中加入所有的20种氨基酸,每个试管中分别有一种氨基酸用碳-14同位素标记。他们要看看到底能合成什么样的多肽链。之所以选择尿苷酸,是因为尿苷酸是RNA特有的核苷酸,这样可以区别到底是DNA还是RNA直接指导蛋白质合成。

有一天,马特伊兴奋地给正在外地出差的尼伦伯格打电话,他发现只有一个试管中合成了多肽链,而这个试管中加入了标记有碳-14同位素的苯丙氨酸。尼伦伯格听完马特伊的电话后喜出望外,提前赶了回来,见证了这一重要时刻。师徒二人发现,要合成这个苯丙氨酸多肽链,多聚尿苷酸RNA链和核糖体RNA缺一不可,DNA酶不能影响这一系统中多肽链的合成,加入RNA酶后,蛋白合成即告终止,这进一步证明信使RNA的存在。不过,尼伦伯格和马特伊似乎并没有意识到自己研究成果的重大意义。1961年5月,他们将主要研究成果提前发表在一本刚刚创刊不久、名不见经传的杂志《生物化学和生物物理研究通讯》上,没有引起太多关注,而且他们也没有在论文中提及该研究最关键的发现——多聚尿苷酸RNA链可能携带编码苯丙氨酸的遗传密码。

3个月后,尼伦伯格参加了在莫斯科举办的第五届国际生物化学大会,在一个分会场向大约35位参会的科学家报告了他们师徒的研究成果,他几乎不认识参会的这些科学家,其他人也大多不认识他。幸运的是,这个会场的主持人正是弗朗西斯·克里克。听完尼伦伯格的报告,克里克难掩激动,他邀请尼伦伯格第二天在更大型的研讨会上重复他的报告,这次引起了轰动。尼伦伯格对这一场景记忆深刻,他后来回忆说,“真是难以置信! 大家都为我起立鼓掌,之后5年,大家简直把我当成了科学摇滚巨星”。同月,他的这项研究成果重新发表在影响力更大的杂志《美国科学院院刊》上。的确,尼伦伯格凭借自己的胆识和努力,从一名蛋白质合成领域的门外汉,变成了万众瞩目的伟大科学家,在基因世界里留下了浓墨重彩的一笔。

克里克结合尼伦伯格和自己的研究,推断三联体“UUU”就是编码苯丙氨酸的密码子,得到与会者的赞同。就这样,第一个密码子正式诞生了。在克里克的启发下,尼伦伯格希望破解其他63种氨基酸的密码子,吸引一大批年轻人参加其中,最多时有20人。很快,尼伦伯格按照之前的方法,破译了三联体“AAA”“CCC”和“GGG”分别编码赖氨酸、脯氨酸和甘氨酸。其他氨基酸的破译则没有这么容易,不过通过不断的技术改进,到1966年,其他氨基酸的密码子也相继被破解,包括3个不编码任何氨基酸的终止密码子。

值得一提的是,受到尼伦伯格研究的激励,出生于英属印度旁遮普省(现今巴基斯坦)的美国生物学家哈尔·葛宾·霍拉纳(Har Gobind Khorana)发明了一种化学合成的方法,为破解遗传密码提供另一个有效的途径。后来这一方法也被用于合成第一个人工基因,并首次在大肠杆菌中实现了表达,从而开启了基因工程技术的新时代。

1965年,美国生化学家罗伯特·霍利(Robert Holley)解析了转运RNA的一级结构和二级结构,证明克里克所推测的“连接体”在蛋白质合成中发挥着重要作用。3年后,尼伦伯格、霍拉纳和霍利因为“破解遗传密码及其在蛋白质合成上的作用”,一起分享了当年的诺贝尔奖生理学或医学奖。

至此,信使RNA的遗传密码已被全部破解,但是生命密码的破解还只是刚刚开始。生命如何从结构单一的、呈线性排列的DNA开始,借助信使RNA和其他RNA的帮助,合成出结构和功能各异的蛋白质,演化出缤纷复杂的生命世界? 我们能否改变这些生命密码,修正人类的遗传病基因,甚至创造出新的生命?这些问题的答案已初现端倪,但是未解的生命之谜仍然很多,吸引着一批又一批的科学家前仆后继。

猜你喜欢
信使氨基酸遗传
月光信使
月光信使
来自天空的信使
科学解读食物中的蛋白质如何分“优劣”
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
补氨基酸不如吃鸡蛋
为什么他们这么会唱?别闹!音乐细胞需要遗传的!
复方氨基酸注射液不合理应用分析