微型机器人、生物计算机、抗癌药物、气候危机……“从头设计”的新型蛋白质能解决人类面临的重大难题吗?
阿莱克西斯·库尔贝特是一名机械工程师。然而,他制造的机器微小至极,比盐粒还要小十万倍。他用少数几个分子巧妙组装出发动机、转子、绞车、泵等机械装置。
他说,这一过程有点像30年前玩乐高积木,只不过如今的“积木”是分子,操作平台则是电脑屏幕。他的屏幕上展示着各种分子零件:杆、销、活塞、叶片、环、漏斗……他可以用鼠标轻松地在所有空间方向上旋转它们。
不久前,库尔贝特用八个扭曲的单链编织出一个辫子状的轴,轴被一个可旋转的环包围,环上伸出四个旋转叶片。这种结构最初由这位生化学家在计算机上设计,然后通过生物技术制造出来。这些蛋白质在结合力的作用下自行组装成转子。最后,库尔贝特用电子显微镜验证其构造是否与计算机上的设计方案一致。
他相信,不久,他将能够为他的转子安装驱动装置,可以用光或有机燃料来驱动。这位发明者说,它总会有用的,比如用它将抗癌药物直接输送到体内的肿瘤处。他相信,这一切都只是个开始,未来他能构建出更复杂的装置,因为“即便是最复杂的机械,也不过是简单组件的精妙组合”。
| 用蛋白质设计解决人类问题 |
库尔贝特在位于西雅图的华盛顿大学蛋白质设计研究所工作。那里汇聚了100多位科研精英,他们的共同梦想是将蛋白质变成未来的材料。
科研人员紧挨着坐在电脑前。透过玻璃,可以看到实验室的工作台、抽风罩和培养箱,那里正是虚幻的设计转化为现实的地方。一个小个子男人通过耳机热烈地与人交谈着,他邋遢的发型和宽松的衬衫可能会让人误以为他是被叫来修理咖啡机的维修师。
他便是实验室的负责人大卫·贝克。在全世界,他的名字就等同于“用蛋白质创造出的新世界”。贝克表示,通过蛋白质设计革命,人类将学会用前所未有的方式来操控生物分子,用蛋白质来制造很多东西,比如新的药物、疫苗甚至材料。
蛋白质是生命的真正主体。如果说自然界有“主演”,那么非它们莫属。尽管在公众看来,脱氧核糖核酸作为基因的载体通常扮演着超级明星的角色,但与蛋白质的多样性相比,脱氧核糖核酸就显得单调乏味了。
无论是人类、植物、真菌还是细菌,生物体的几乎一切特征都归功于蛋白质的作用。它们使人体组织柔韧,赋予蜘蛛丝弹性,在视网膜中捕捉光线,驱动精子游动,消化食物,为组织供氧。没有蛋白质,生命将不可能存在。
自然界的创造力似乎无穷无尽,在进化过程中产生了数亿种蛋白质,每一种都独具特色。然而,与理论上可能存在的蛋白质多样性相比,自然界的这些创造微不足道。地球上任何生物体产生的每种蛋白质,都对应着无数还未进化出来的蛋白质。可能存在的蛋白质的数量之巨,甚至远超宇宙中原子的总数。
长期以来,生物学家们一直梦想着利用自然界无穷的创新力,但他们大多只局限于微调自然界已有的蛋白质:在长长的分子链中交换某个链环,以期按需改变蛋白质特性。例如,赖脯胰岛素就是经过基因工程技术修改的胰岛素分子,这种结构的改变使其能够更迅速地被身体吸收,从而更好地控制餐后血糖水平。
贝克并不满足于这种微调。他不想局限于修改进化赋予我们的蛋白质,而是想在设计图纸上创造全新的蛋白质。在他的实验室里,会产生自然界中从未存在过的分子。他自信地宣布:“如今,我们已能构建出完全符合预期功能的蛋白质。”
贝克有两大得力助手:一支无与伦比的研究团队和最新一代的人工智能技术。
贝克的团队闻名世界:总计120名蛋白质化学家、分子生物学家、免疫学家、生物物理学家、计算机科学家和人工智能专家在他的带领下工作,这样的组合在全世界都独一无二。他们成功教会了人工智能理解蛋白质的语言。就像聊天生成式预训练转换器(ChatGPT)能够生成新文本一样,贝克实验室的人工智能也能创造出新的蛋白质。计算机的创造力呈爆炸式增长,人们制造和测试这些新蛋白质的速度已经远远跟不上。
就像自然界用新型蛋白质应对新挑战一样,贝克的团队也希望用他们合成的蛋白质解决人类面临的种种问题。每位研究人员都肩负着自己的使命:有人致力于开发能分解持久性环境毒素的酶,有人计划制造环保型水泥,还有人试图将细菌细胞转变为生物计算机。
内森·恩尼斯特正努力用实验室培养出的燃料为世界供能。他的目标是创造出比所有植物都能更高效地将光转化为燃料的蛋白质。“潜力无限。”他满怀信心地说。自然界的光合作用是一个复杂的过程,涉及两个大型分子复合体,每个复合体都由数十个蛋白质、很多叶绿素分子、质子泵和一个复杂的电子传递链构成。尽管如此,光转化为化学能的效率却非常低。
“如果仅仅是要利用光将二氧化碳转化为糖,过程可以大大简化。”恩尼斯特说。他希望通过少量人造蛋白质实现植物需要借助许多天然蛋白质才能完成的光合作用效果。他已经开发出一个简单的光合作用系统,并希望在计算机的辅助下对其进行优化。“我们正在取得进展。”他满意地说。
在贝克实验室的另一个角落,哈利·派尔斯坐在电脑前,思考着如何对抗气候变化。他电脑屏幕旁的公告板上挂着一张电子显微镜照片,上面是一个规则的蜂窝状图案。它是由碳酸钙分子构成的。“这一结构的形成方式与贝壳上的图案相似。”派尔斯解释道。
派尔斯指出,海洋生物钙质外壳的生长是由壳内的蛋白质控制的。他现在借助人工智能的帮助,在计算机上设计蛋白质分子,以类似的方式促进钙的沉积。如果大量生产这种蛋白质,可以提供一种从大气中捕获温室气体二氧化碳,并将其以石灰石形式存储起来的绝佳方案。
然而,贝克实验室的大多数研究人员都将目光聚焦于医学应用。在医学领域,蛋白质及蛋白质缺陷至关重要:它们介导感染,引发癌症,在几乎所有疾病发展过程中都扮演着关键角色。也因此,蛋白质可能指明通往有效治疗方法的正确道路。
| 人工智能带来的蛋白质设计革命 |
自2012年西雅图研究所成立以来,贝克在仍然年轻的蛋白质设计领域大展身手,是科学界的一位“超级巨星”。贝克实验室开发的《罗塞塔》软件能以相当高的精准度预测蛋白质的三维结构,尽管预测并非尽善尽美,但其卓越的表现依然超越了其他竞争对手。“罗塞塔”社区论坛迅速成为蛋白质设计者们交流的热门平台,规模日益扩大,贝克成为这一平台的引领者。
然而,2020年11月,一切都发生了翻天覆地的变化。在一场国际结构生物学竞赛中,《阿尔法折叠》横空出世,这款由谷歌子公司“深度思考”开发的人工智能应用,由戴密斯·哈萨比斯和约翰·江珀领导的团队打造,以其惊人的表现震撼了全场。2024年,《阿尔法折叠3》的问世更是将生物学研究推向了一个全新的高度。它不仅在预测单个蛋白质的三维结构方面达到了前所未有的精确度,还能预测蛋白质与其他生物分子形成的复合体结构,以及它们之间的相互作用。
对贝克来说,这是一段苦涩的经历。2020年,一群计算机“呆子”——他们中的大多数还是蛋白质结构领域的新手——从他和他的世界级团队手中夺走了风头。一夜之间,人们突然意识到,未来的蛋白质设计世界不是由人类,而是由人工智能主导。
但贝克绝非轻易言败之人。他深知,虽然《阿尔法折叠》在预测自然界已存在的蛋白质结构方面无与伦比,但在设计新型分子方面却显露出短板。而在这一点上,贝克决心要比谷歌团队做得更好。
人工智能的发展为贝克提供了有力的支持。在设计图纸上生成分子的挑战,简直就是为最新一代生成式人工智能量身定制的。它不仅能像传统人工智能那样在庞大的数据集中识别规则和模式,还能利用这些规则生成新的数据,创造出自然界中从未存在过的蛋白质。
生成式人工智能迅速且完美地掌握了蛋白质的“语法”。就像ChatGPT能够创作文章一样,贝克团队于2022年12月推出的“罗塞塔折叠扩散”蛋白质设计模型也创造出了新的蛋白质分子。贝克的团队对此深深着迷,有时甚至会感到一丝恐惧。如今,对于蛋白质折叠的许多规则,模型的理解似乎已经超越了最优秀的人类专家。
贝克的实验室不仅是科学研究的殿堂,也是企业的孵化器。每个博士生都可以自由选择是继续学术生涯还是创办自己的公司。几乎每个学生的项目中都蕴含着巨大的商业潜力。截至2023年9月,已经有18家公司从西雅图的实验室中孵化而出,共筹集了超过10亿美元(约合人民币72亿元)的资金。
2024年10月,哈萨比斯和江珀因在蛋白质结构预测方面的贡献,贝克因在计算蛋白质设计方面的贡献,获得诺贝尔化学奖。贝克坚信,这一切还只是开始。他意识到自己正处于一场持续革命的震中:“《罗塞塔》掀起了一场革命,人工智能给我们带来了另一场。而下一场革命,正在悄然酝酿之中。”与此同时,人工智能的快速发展引发了人们对生物恐怖主义风险加剧的担忧。作为回应,贝克促成了一项协议,由该领域的90多名科学家签署,承诺负责任地开发和使用人工智能蛋白质设计工具。
编辑:周丹丹