Fiona
由于细菌正不断地进化出抗药性,曾经功效强大的抗生素正在快速失效。目前,全球每年至少有70万人,死于原本用抗生素就能治愈的细菌感染。
2019年,联合国“抗菌药物耐药性”跨机构协调小组发表的一份报告称:如果该领域的研究没有取得新的突破性进展,那么到2050年,死于细菌感染的人数可能会跃升至每年1000万人。
让这一预测显得更为可怕的是,传统抗生素“后继无人”。
过去的20年间,只有少数新抗生素在用新手段杀死细菌,而细菌不断增强的耐药性,让所有抗生素都备受挑战。同时,通过筛选天然化合物来寻找新抗生素的传统方法,也显露弊端。
因此,一些研究人员正从传统生物实验室转向计算机,希望从中找到答案。
在2020年2月20日的《细胞》期刊上,一个科学家小组宣布,他们通过强大的深度学习算法,发现了一种全新的抗生素。该抗生素具有非常规作用机制,可以治愈多种对传统抗生素有耐药性的感染。
其实,该抗生素并不陌生,它是一种糖尿病治疗药物,只是在此之前,人类不知道要寻找的新型抗生素就是它,但计算机做到了。
用计算机和机器学习来理解大量的生物医学数据,这并不是什么新鲜事。但是,由詹姆斯·柯林斯(James Collins)和雷吉娜·巴齐莱(Regina Barzilay)领导的麻省理工学院的团队,开发了一个“神经网络”,让研究取得了成功。
柯林斯研究“系统生物学”在抗生素耐药性方面的应用,而巴齐莱则是一名人工智能研究员。他们研发的网络,规避了科学家们在“寻找什么”的问题上所存在的可能成见与预判,让计算机构建“兼容并包”的备选答案。
“你可以认出那些你之前觉得不太像抗生素的分子,”柯林斯说,“这个平台展示了我们可以如何创新地利用新兴的深度学习技术,来发现新的化学物质。”
1928年,亚历山大·弗莱明提取出第一种抗生素—青霉素
制药公司基本上放弃了新抗生素开发,转而投入开发更有利可图的慢性病药物。
自亚历山大·弗莱明(Alexander Fleming)从真菌中提取出第一种抗生素以来,抗菌药物一直都是与大自然同源的。但是,分离、筛选和合成数千种天然化合物用于实验室测试,则极为昂贵和耗时。
为了缩小搜寻范围,研究人员试图了解细菌如何生存和繁殖,然后去寻找能攻击该生命过程的化合物,以破坏细菌细胞壁、阻止细胞繁殖,或者是抑制细菌蛋白质生成。“先从细菌的生物机制开始,然后反向设计抗生素分子。”巴齐莱说。
即便早在20世纪80年代,计算机辅助高通量筛选方法就被引入抗生素的发现研究,但是,在随后的几十年间,该领域几乎没有进展。偶尔筛选出的能对细菌构成攻击的候选抗生素,与现有抗生素过于相似,都无法解决细菌耐药性的问题。此后,尽管市场有需要,制药公司基本上放弃了新抗生素开发,转而投入开发更有利可图的慢性病药物。
巴齐莱、柯林斯和他们的同事,采取了一种全新的、几乎是自相矛盾的方法来发现药物:它直接忽略药物的作用机制。该方法只有在极其强大的计算能力支持下,才可能获得成功。
新抗生素的发现,有赖于其背后的深层神经网络。该网络学习结构的节点与联结,是受大脑互相交错的神经元的启发。在多种产业与应用技术中,具有识别模式的神经网络都有所运用,如用于图像和语音的识别。
传统的计算机程序的操作方法,是筛选一个分子库来找到特定的化学结构,但是,神经网络通过训练可以自我学习,它们会熟记哪些结构特征可能是有用的,然后找到相应的东西。
柯林斯、巴齐莱和他们的团队,通过训练神经网络,寻找能抑制大肠杆菌生长的化合物。他们向网络系统提供一个数据库,这个数据库包含有2300多个已知分子结构的化合物,通过测试其抑制大肠杆菌生长的能力,将化合物标记为“命中”或“未命中”。从这些数据中,神经网络学会了那些被标记为“命中”的分子所具有的原子排列和化学键结构。
因为这个训练数据库中只有10%的化合物是已知抗生素,所以,關于“抗生素分子应该如何工作”或“它们应该是什么样子”的假设,神经网络并没有受到束缚。正因为如此,神经网络能发现与当前抗生素药物差异显著的化合物。
当然,抑制细菌的能力并不是唯一重要的标准:氰化物和砷也能杀死一些细菌,但这并不能使它们成为有用的抗生素。因此,研究人员还需要让算法具有预测化合物毒性的能力,并在此基础上排除错误的候选分子。
然后,他们把经过训练的网络转移到“药物再利用中心”,这是一个由6000多个化合物组成的分子库,这些化合物已经过审批,被用于应对多种人类疾病。
宾夕法尼亚大学佩雷尔曼医学院教授塞萨尔·德拉·富恩特(Cesar de la Fuente),尝试使用人工智能设计新抗生素,他表示:“使用这种算法,我们可以在本被用作治疗其他疾病的药物中,找到分子的新特性。因为这些药物已经被美国食品药品监督管理局(FDA)批准,我们只是为它们提供了一种新用途,所以,这将大大加快成为临床使用药物的过程。”
由詹姆斯·柯林斯(左图)和雷吉娜·巴齐莱领导的麻省理工学院的团队所开发的“神经网络”,让新型抗生素研究取得了成功
氰化物和砷也能杀死一些细菌,但这并不能使它们成为有用的抗生素。
研究团队将筛选抗菌性能的智能神经网络,与毒性筛选机制结合起来,然后排除那些他们认为与现有抗生素过于相似的化合物—因为细菌可能已经对它们产生了抗药性。然后,一种新的候选药物出现了:c-Jun氨基末端激酶抑制剂SU3327,它是一种被认为用于治疗糖尿病的药物。研究人员将这种化合物命名为“halicin”。
实验室测试表明,“halicin”不仅能有效地阻止大肠杆菌生长,还能杀死其他细菌,包括结核杆菌(会导致结核病)、艰难梭菌(会导致胃肠道疾病),以及其他多种抗药性细菌—这些细菌会导致脓毒症、肺炎、伤口感染和其他常见的难以治愈的感染。
与此同时,虽然大多数抗生素在经过几天的实验室测试后会导致细菌抗药性,但在经过一个月的反复暴露后,“halicin” 未产生耐药的大肠杆菌变体。
在实验室测试了“halicin”,并看到它作为抗生素的普遍功效之后,研究人员才开始探索它的作用机制。通过RNA测序和其他实验,他们发现它干扰了细菌细胞膜的质子运动和电化学能。
使用经过同样学习过程的神经网络,对更大量化合物(超过1.07亿个)进行筛选,研究人员获得了第二个候选抗生素。
一般来说,筛选如此数量庞大的分子库,并不是明智的做法。“对1亿多个抗生素化合物的活性进行物理测试是不现实的。”匹兹堡大学生物科学助理教授雅各布·达兰特说。他开展了众多通过机器学习来解决抗生素耐药性的研究。
该算法能够在短短四天内,对所有这些分子进行评估和排序,将目标范围缩小到仅23个可能的化合物,用于接下来的物理测试。
其中,有一种新抗生素(尚未命名)脱颖而出。柯林斯实验室的博士后研究员和该研究论文的第一作者乔纳森·斯托克斯(Jonathan Stokes)表示,当测试结果表明这种化合物具有抗菌能力的时候,“halicin”的论文正处于修订阶段,因此,科学家们决定将它与“halicin”的发现一起公布。
他在一封电子邮件中解释说:“我们正处于阐明其作用机制的早期阶段,随后将探究它对哪些病原体会产生影响,以及它对哺乳动物细胞的安全性如何。”
柯林斯说,他们现在正在努力加强神经网络对某些病原体的关注,着重发展那些对体内微生物群影响较小的那部分抗生素。
德拉·富恩特正在他的实验室中,寻找加速抗生素发现过程的方法。他将能生产新分子的机器学习平台,与能打印这些新分子的合成器结合起来,让计算机生成的新分子可直接用于后续的实验测试,然后再将实验结果反馈到计算机中,使其不断学习和改进。
他和他的同事也有兴趣将机器学习应用于药物设计,而不是简单地使用它来筛选现有的化合物。德拉·富恩特说:“大自然在为人类提供新抗生素方面,可能已经失去了灵感。这就是为什么我们认为机器可以让天然分子更具多样化,将它们转化为合成版本,使得效用更加显著。”
为此,他们使用计算机模型快速模拟细菌的进化过程,包括变异、选择和基因重组。他说,使用计算机,就可能推断出具有新序列的蛋白质的特性,而这些序列尚未通过当前的进化过程看到。这可能会产生新的分子,其功能也是人们从未见过的。
达兰特同意这种说法。他表示:“同样的方法也可以应用于针对其他疾病的药物发现工作,如癌症和神经退行性疾病。”
德拉·富恩特说,这些计算机神经网络也许有一天,能提供一个更全面的关于细菌活动的图谱,帮助科学家了解环境影响如何改变抗生素的療效。研究中大量关于营养水平、pH值、氧浓度和其他因素的数据,有助于为今后更有效的治疗方案指明方向。
新算法的成功应用,促使一些标题党作者宣称,人工智能发明抗生素的新时代已现曙光。但作为一名机器学习专家,巴齐莱不以为然:如果没有严谨缜密的人类工作,这一发现是不可能的。“并不是机器发现了分子,而是机器帮助人类扫描巨大的可能性空间,聚焦富有成果的假设。”
此外,不止一位研究人员警告说,目前用来培训网络以寻找新抗生素的高质量数据,成果有限,过于依赖机器学习,将给今后的工作带来阻碍。
计算机工作尽管颇有成效,但终究不能取代生物实验。尽管柯林斯预测他们总有一天会在预测精度上从现在的51%达到90%,但随后的实验仍然必不可少。
利用计算机技术探索分子性能,其终极成功在于,人工智能发现或设计出真正的“防止抗药性”(resistance-proof)抗生素。虽然这是德拉·富恩特目前正在进行的项目之一,但他认为,“防抗性”是一个遥远的目标。
他说:“作为一名微生物学家,我非常尊重细菌。我们在这场博弈中,所能做的是跟上它们进化的步伐,而不是认为我们已经战胜了它们。”