10月9日,瑞典皇家科学院宣布了2024年诺贝尔化学奖的获奖者,该奖项由三位科学家共享。美国华盛顿大学的大卫·贝克因其在蛋白质设计领域的杰出贡献而荣获半数奖金;另一半奖金则由英国人工智能公司深度思维(DeepMind)的创始人丹米斯·哈萨比斯和该公司高级研究员约翰·乔普共同获得,以表彰他们在蛋白质结构预测领域的重大突破。
蛋白质是生命的基石,也是维系生命活动的化学工具。多年来,化学家们一直渴望完全理解和掌握蛋白质的奥秘。如今,这一梦想已近在咫尺。贝克教授通过其研发的人工智能软件创造出前所未有的蛋白质,让这些蛋白质具备全新的功能。哈萨比斯和乔普则利用人工智能技术成功攻克了化学家们50多年来一直努力解决的难题—根据氨基酸序列预测蛋白质的三维结构。
探索和创造全新的蛋白质,必须深入理解其结构。贝克、哈萨比斯和乔普的研究历程、原理和成果,为我们揭开了这一科学领域的新篇章。
自19世纪以来,科学家已认识到蛋白质在生命过程中扮演着关键角色,而其功能多样性源于其独特的三维结构。蛋白质通常由数十至数千个氨基酸组成,这些氨基酸链的折叠方式赋予蛋白质多样化的形态和功能。
20世纪50年代,英国剑桥大学的约翰·肯德鲁和马克斯·佩鲁茨利用X射线晶体学技术,成功揭示了世界上首个蛋白质的三维结构,并因此荣获1962年的诺贝尔化学奖。随后,美国科学家克里斯蒂安·安芬森通过化学方法使蛋白质展开后再重新折叠,发现蛋白质总能恢复到相同的结构。1961年,他得出结论:蛋白质的三维结构完全由其氨基酸序列决定,这一发现为他赢得了1972年的诺贝尔化学奖。
然而,安芬森的结论也遭遇了挑战。1969年,美国分子生物学家利文索尔提出了著名的利文索尔悖论,指出由于蛋白质氨基酸链在未折叠状态下具有极大的自由度,理论上一个仅由100个氨基酸组成的蛋白质就可能拥有至少1047种不同的三维结构。如果氨基酸链是随机折叠的,找到正确结构的时间将远超宇宙的年龄。
这一系列科学成就和理论探讨,为今年诺贝尔化学奖的获奖研究奠定了坚实的基础。科学家沿着氨基酸链折叠的线索不断探索,旨在实现仅通过已知的蛋白质氨基酸序列就能预测其三维结构的目标。如果该目标变为现实,科学家将不再依赖于复杂的X射线晶体学技术,可以大幅节省时间,并能根据已测定的蛋白质结构设计出全新的蛋白质。
为了激励科研人员开发能够迅速且精确地预测蛋白质结构的新方法,由美国马里兰大学的约翰·莫尔特领导的科学家团队在1994年发起了蛋白质结构预测关键评估项目(CASP),该项目后来演变成两年一次的CASP国际竞赛。每两年,世界各地的科学家会通过CASP国际竞赛获得一批新近解析的蛋白质的氨基酸序列,如何根据已知的氨基酸序列迅速而精确地预测蛋白质结构是该竞赛中最大的挑战。
2018年,哈萨比斯的加入为蛋白质结构预测带来了新的希望。他不仅是国际象棋大师、神经科学专家,还是人工智能(AI)领域的先驱,曾设计出著名的人工智能模型(AI模型)—阿尔法围棋(AlphaGo)。哈萨比斯从4岁起开始学习国际象棋,13岁时就达到了大师水平。从十几岁开始,他踏上了程序员和游戏开发者的道路,并取得了成功。随后,哈萨比斯开始深入研究人工智能,并涉足神经科学,利用人类对大脑的理解来开发更先进的人工神经网络。
2010年,哈萨比斯创立了深度思维公司,专注于为棋盘游戏开发高级AI模型。2014年,该公司被美国谷歌公司收购。2016年3月,哈萨比斯带领深度思维团队开发的阿尔法围棋在围棋人机大战中以4比1的比分战胜了围棋世界冠军、职业九段棋手李世石,成为世界上首个战胜围棋世界冠军的AI模型。
随后,哈萨比斯将注意力转到了对人类科技发展更为重要的问题上。2018年,他参加了第13届CASP国际竞赛,并带来了新的AI模型—阿尔法折叠(AlphaFold)。此前,研究人员在该竞赛中预测蛋白质结构的准确率最高只能达到40%。然而,阿尔法折叠在此次竞赛中将预测的准确率提升至60%,这一成果标志着蛋白质结构预测领域的巨大突破。
虽然这是一个令人瞩目的成就,但还未能令科学家完全满意。因为只有当预测的准确率超过90%,我们才能真正理解蛋白质的精确功能和作用。当时,32岁的乔普刚刚加入哈萨比斯的团队,不久之后,他带来了对阿尔法折叠至关重要的改进想法。
2008年,刚取得物理学和数学学士学位的乔普曾在一家利用超级计算机模拟蛋白质结构的公司工作,这段经历让他意识到,物理学原理可以帮助人们解决生物医学领域的难题。2011年,乔普带着对蛋白质结构的浓厚兴趣,投身于理论物理学博士学位的学习。面对大学里计算机资源紧张的问题,乔普研发了更简洁、更高效的模拟蛋白质动力学的方法。2017年,在乔普刚刚完成博士学位时,得知深度思维公司已经启动了蛋白质结构预测项目,他向该公司提交了工作申请。凭借在蛋白质结构模拟方面的丰富经验,乔普针对阿尔法折叠提出了创造性的改进方案,从而被深度思维公司录用。之后,他与哈萨比斯共同研发了阿尔法折叠-2。
2020年,哈萨比斯和乔普带着阿尔法折叠-2参加了第14届CASP国际竞赛,他们展示的预测结果震惊了世界。阿尔法折叠-2预测蛋白质结构的准确率达到92.4%,这表明阿尔法折叠-2能够迅速而精确地预测出已知的约2亿种蛋白质的结构,为蛋白质结构预测领域带来了革命性的进展。
阿尔法折叠-2在蛋白质结构预测方面的突破性进展,得益于其核心组件—一种名为“转换器”的人工神经网络。“转换器”能够以前所未有的灵活性在海量数据中精准识别模式。阿尔法折叠-2的训练基于两个庞大的数据集:一个是包含了实验室解析出的所有已知蛋白质结构的数据库;另一个是包含了所有已知蛋白质的氨基酸序列的数据库。通过这些数据,阿尔法折叠-2能够提炼出氨基酸之间的相互作用规律,并识别出在进化上相关的蛋白质,进而预测它们可能形成的各种结构。
如今,阿尔法折叠已经迭代到了阿尔法折叠-3,这一版本在预测蛋白质结构的速度和准确性上都有了显著提升。同时,深度思维公司也公开了阿尔法折叠-2的代码,只要你能连接互联网就可以访问和使用这一强大的工具。截至2024年10月,已有来自190个国家和地区的超过200万人使用过阿尔法折叠-2。在过去,测定蛋白质结构通常需要耗费数年时间,如今,借助阿尔法折叠-2,这一过程仅需几分钟即可完成,极大地加速了生物医学研究的进程。
大卫·贝克在哈佛大学的求学之路始于哲学和社会科学。然而,一门演化生物学课程彻底改变了他的职业轨迹。当时颇具影响力的教科书《细胞分子生物学》不仅点燃了他对细胞生物学的热情,更进一步激发了他对蛋白质结构的深厚兴趣。
1993年,贝克正式成为华盛顿大学蛋白质结构研究小组负责人,通过一系列巧妙的实验,探索蛋白质结构的奥秘。在这一过程中,贝克意识到,仅凭人工实验无法揭示数以亿计的蛋白质结构,必须借助计算能力更强、速度更快的人工智能技术。
1998年,贝克领导的团队开发了一款名为罗塞塔(Rosetta)的软件,用于预测和设计蛋白质结构。该软件能够通过调整氨基酸序列来设计具有特定功能或特性的蛋白质,如增强蛋白质的稳定性或改变其结合亲和力。
同年,贝克带领团队携罗塞塔参加了CASP国际竞赛,并在众多参与者中脱颖而出,表现卓越。这一成就激发了贝克的新想法:他开始考虑反向使用罗塞塔软件,即输入所需的蛋白质结构,并让软件提供实现这一结构的氨基酸序列建议,从而创造出全新的蛋白质。这种方法颠覆了以往向罗塞塔输入氨基酸序列以预测蛋白质结构的传统做法。
天然蛋白质虽然种类繁多,但其数量和功能终究有限。为了拓展具有全新功能的蛋白质库,贝克致力于从零开始设计蛋白质。贝克曾表示:“如果你想建造一架飞机,你不能从改造一只鸟开始;相反,你需要理解空气动力学的基本原理,并基于这些原理来制造飞行器。”
贝克带领团队首先构思了一种全新的蛋白质结构,然后利用罗塞塔计算出能够形成这种新结构的氨基酸序列。在研究团队的引导下,罗塞塔搜索了包含所有已知蛋白质结构的数据库,寻找与所需结构相似的蛋白质片段。接着,罗塞塔利用其对蛋白质结构的“深刻理解”,优化这些片段,最终创造了一个名为Top7的氨基酸序列,这是世界上第一种与所有已知蛋白质完全不同的蛋白质。
随后,贝克团队使用X射线晶体学技术确定了Top7的结构,证实了罗塞塔确实能够创造全新的蛋白质。利用罗塞塔研发的Top7几乎与贝克团队最初设计的结构完全一致。这一成果标志着人们不再局限于模仿自然界中存在的蛋白质,而是能够创造出具有独特结构、自然界中不存在的蛋白质。Top7拥有93个氨基酸,是迄今为止科学家设计创造的最大的蛋白质之一。
与自然界随机创造蛋白质不同,科学家的设计是有目的的。利用人工设计的蛋白质可以研发出特殊且有效的药物,如能够克服细菌耐药性的抗生素及治疗癌症和艾滋病的药物。此外,科学家还可以利用人工设计的蛋白质研发出能分解塑料的酶(酶也是蛋白质),且使其在分解过程中效率更高、速度更快。
无论是贝克的蛋白质设计创新,还是哈萨比斯和乔普在蛋白质结构预测领域的突破,都极大地拓展了人类对蛋白质的认知。蛋白质不仅是生命的基本物质,还扮演着激素、信号分子、抗体等角色,深入探索蛋白质的奥秘将为人类带来更多、更大的益处。
随着2024年诺贝尔化学奖的揭晓,我们见证了人工智能与蛋白质结构研究的交汇点,这不仅是科技进步的胜利,更是人类智慧的体现。大卫·贝克、丹米斯·哈萨比斯和约翰·乔普不仅解锁了蛋白质的神秘结构,更开启了生命科学新纪元的大门。他们的成就提醒我们,科学探索永无止境,每一次突破都是对生命奥秘的致敬,每一次创新都是对未来可能性的拓展。让我们以这些科学巨匠为灯塔,继续在未知的领域中勇敢前行、探索新知、创造奇迹。
大卫·贝克
大卫·贝克(David Baker),1962年10月6日出生于美国华盛顿州西雅图市。他曾经在哈佛大学学习哲学和社会科学专业,后进入加利福尼亚大学伯克利分校学习,研究酵母中的蛋白质运输,1989年获得博士学位。他是一名生物化学家和计算生物学家,现为华盛顿大学西雅图分校教授、蛋白质设计研究所所长。
丹米斯·哈萨比斯
丹米斯·哈萨比斯(Demis Hassabis),1976年7月27日出生于英国伦敦。1997年,他获得剑桥大学计算机科学学士学位。由于哈萨比斯希望了解真正的大脑究竟是如何工作的,于是在2005年进入伦敦大学学院,攻读神经科学博士学位。2010年,他在伦敦成立了深度思维公司;2014年,该公司被谷歌公司收购。
约翰·乔普
约翰·乔普(John Jumper),1985年出生于美国阿肯色州小石城。2007年,乔普获得范德比尔特大学数学与物理学学士学位;2011年,进入芝加哥大学,攻读理论化学,并将机器学习策略用于蛋白质动力学研究;2017年,获得芝加哥大学理论化学博士学位,从事机器学习模拟蛋白质折叠和动力学研究;2018年,进入谷歌深度思维公司,任高级研究员。
【责任编辑】张小萌