人工智能(AI)再度发威,攻克了生物学领域一项重大难题:预测蛋白质如何从线性氨基酸链卷曲成3D形状以执行任务。据美国媒体2020年11月30日报道,“蛋白质结构预测关键评估”(CASP)竞赛传来喜讯:英国“深度学习”(DeepMind)称其AI实现了上述成就,他们的方法将极大加快新药研发进程。
人体拥有成千上万种不同的蛋白质,每一种蛋白质都包含几十到几百种氨基酸,这些氨基酸的顺序决定了它们之间的作用,赋予蛋白质复杂的三维形状,进而决定了蛋白质的功能。了解这些三维形状有助于研究人员设计出能在蛋白质缝隙内滞留的药物。此外,合成出拥有所需结构的蛋白质,还可以加快酶的研制进程,让生物燃料领域受益。
几十年来,研究人员利用X射线晶体学或低温电子显微镜(cryo-EM)等实验技术来破译蛋白质的三维结构,但这种方法可能需要数月甚至数年,且未必见效。目前,在生命体内发现的2亿多个蛋白质中,只有17万个蛋白质的结构被破解。
1994年,为更好预测和破解蛋白质三维结构,马里兰大学结构生物学家约翰·穆尔特等人发起了CASP竞赛,每两年举行一次。在2020年的比赛中,“深度学习”团队的“阿尔法折叠”(AlphaFold)方法的中位分数为92.4(满分100分,90分以上被认为预测方法可与实验方法相媲美),预测最具挑战性的蛋白质的平均得分为87,比次优预测高出25分。它甚至擅长预测嵌入细胞膜的蛋白质结构——细胞膜是许多人类疾病的核心,但很难用X射线晶体学研究。
欧洲生物信息学研究所名誉主任珍妮特·桑顿说:“‘深度学习团队所取得的成就是惊人的,将改变结构生物学和蛋白质研究的未来。”
穆尔特则表示,这是一个有50年历史的问题,“阿尔法折叠”改变了游戏规则,实验学家将能使用精确的结构预测来理解不透明的X射线和低温电磁数据;药物设计者也可借此迅速厘清新冠病毒等新冒出的危险病原体中每种蛋白质的结构,从而更快研制出相关药物。
蛋白质的形状决定了其功能。知道蛋白质如何折叠,我们才能知晓蛋白质的作用。但光是解析蛋白质折叠后的结构,就已经非常困难。常用的方法是冷冻电镜、核磁共振或者X射线等。结构要看得精细,耗时长且成本不菲。預测蛋白质折叠后的形状,则是“地狱难度”。它可以在极短时间内把自己折叠成令人难以想象的形状,预测所需要的算力可谓惊人。在人工智能帮助下,曾经的天方夜谭成为事实。这或许是一项革命性成果,为人类探索药物分子世界提供了强大工具。