霍尔顿•索普
1957年,约翰•肯德鲁(John C. Kendrew)和马克斯•佩鲁茨(Max F. Perutz)通过X射线晶体学方法揭示了第一个蛋白质结构——肌红蛋白的三级结构。之后,他们又确定了血红蛋白结构。作为一名生物无机化学家,我对此深感欣喜——观察着过去只能想象的东西,必定是一种非凡的体验。
不久后,克里斯蒂安•安芬森(Christian B. An fi nsen Jr.)提出蛋白质的结构是热力学稳定的。我们似乎可以根据蛋白质的氨基酸序列来预测其三维结构。这一众所周知的“蛋白质折叠问题”始终困扰着科学家,直到2021年,AI预测蛋白质三维结构的成果发表,毫无疑问地成为我们心中的2021年度科学突破之一。
我成为一名生物化学家的时候,科学界还只能描述却无法解决蛋白质折叠问题,化学力场和分子动力学建模尚不足以帮助我们解决问题。从头合成蛋白质是令人兴奋的工作,但组装复杂结构和多蛋白质却显得遥不可及。2006年,我离开实验室,转向了行政工作,当时的我认为蛋白质折叠问题永远得不到解决。
此后的15年间发生了很多事情。在冷冻电子显微镜技术发展起来后,蛋白质结构的揭示工作越发高效快速——天价的冷冻电镜能在无结晶样品的情况下确定蛋白质三维结构。另一方面,CASP竞赛(蛋白质结构预测的关键评估竞赛,被誉为蛋白质结构预测的奥林匹克竞赛,每两年举办一次)在全球科学界掀起风潮。参赛科学家借助算法工具来“预测”已知蛋白质结构,结果的匹配程度可显示预测算法的精确性。
Alphabet公司的英国子公司 DeepMind通过CASP竞赛展示了人工智能的惊人潜力。他们的AlphaFold算法在2020年秋季的CASP 会议上给华盛顿大学研究员白敏京(Minkyung Baek)留下了深刻印象。白敏京和同事设计了 RoseTTAFold算法,能以较少的计算能力预测蛋白质复合物的结构。DeepMind和白敏京等人的方法分别在《自然》和《科学》上同时发表。AlphaFold和RoseTTAFold都可供研究者免费使用(就像蛋白质结构预测数据库一样),于是科学家立即开始借助这些算法获得蛋白质结构。
现在,我们可以得到不符合实验方法的蛋白质样品的结构,也能在不满足实验方法要求的实验室里获得蛋白质结构。这是两个维度的突破。一方面,它解决了一个困扰学界50年的科学问题,正如费马大定理的证明或引力波的发现。另一方面,它是一项改变游戏规则的技术,就像CRISPR或冷冻电镜,将大大加速科学发现。无论出于何种理由,AI预测蛋白质结构这一研究进展必成为《科学》2021年度突破。
科学在取得突破的同时,也遭遇 “损害”。神经病学教授乔尔•珀尔马特(Joel Perlmutter)在一篇社论中讨论了美国食品药品管理局(FDA)对阿尔茨海默病新药阿杜那单抗的极为糟糕的批准。珀尔马特辞职以抗议为FDA提供药物建议的委员会。在气候问题方面的持续不作为使得 1.5℃目标不太可能实现。一些国家的政府官员以新的方式攻击科学家,并利用社交媒体等破坏科学在很多方面的权威,例如新冠疫苗问题和气候问题。
就科学成就而言,蛋白质折叠方面的突破是有史以来最伟大的一项里程碑事件。与此同时,人们失去对科学权威的尊重是令人沮丧的悲剧,而且这种趋势很难短期被逆转。
2021年是最好的时代,也是最坏的时代。科学的“两极”还将持续一段时间。