文/Melanie Weber
本文作者系德国微软化学、制药和生命科学行业总经理。
德国微软化学、制药和生命科学行业总经理Melanie Weber在本文中讲解了机器学习和人工智能在制药行业的应用
药物研发的过程正越发精简——然而,要想找到正确的“先导化合物”仍如大海捞针。如今,人们发现人工智能(AI)不仅能够加速先导化合物的优化过程,还可以帮助研究人员掌握和分析海量的数据。 来自微软的Melanie Weber在本文中解释了它的工作原理。
过去,寻找活性成分(API)通常基于偶然。幸运的巧合与机智的推理往往会产生意想不到的发现。例如,1928年,一个被人遗忘的培养皿促使英国细菌学家亚历山大·弗莱明发现了人类历史上的第一种抗生素——青霉素。这种抗生素至今仍被用于对抗细菌感染。
每一种药物的核心成分都是活性成分。换言之,在人体内真正起到治疗或缓解作用的正是这种分子化合物。在进行药物研发时,需要检测的有机分子估计有100万的10次方(1060)个,由此可以想象出要准确找到对疾病治疗进程有积极作用的化合物有多难——如此多的分子,足以用来制造数十亿个地球;要从其中找到正确的化合物,远比大海捞针更困难。
随着现代化学和分子生物学的不断进步,制药行业已经逐渐发展成为一个高科技行业。人们做了很多新的尝试与试验,药物的发现已不再基于偶然,活性成分的开发往往基于合理的多阶段过程,且愈发需要现代技术的支持。
近年来,人们发现数字技术可以用于先导化合物的优化过程。在药物研发阶段,研究人员会在实验室对活性成分进行测试。很多活性成分会被认为是潜在的适合候选物,但也可能会由于具有不良副作用而被淘汰。在先导化合物优化过程中,经验丰富的药物化学家会致力于改进这些“命中”分子。
专家们会通过测试调整这些分子的结构,以提高它们的生物有效性并减少产生副作用的可能性。先导化合物的优化是一个迭代过程。在此过程中需要找出新化合物并在体外对其进行测试。然而,这一过程由于需要在实验室中合成很多新化合物,因此非常昂贵且耗时,并且还非常依赖研究人员的经验、知识、创造力以及直觉。
为了加速先导化合物的优化过程,有人开发了计算建模技术来预测分子在实验室中的表现。通过使用计算机模型,研究人员可以在计算机上快速进行新分子的设计:首先在计算机中模拟所有模型,然后仅筛选出最有希望的分子在实验室中进行合成,最后再进行体内测试。
这使得昂贵且耗时的实验可以集中在最有希望的化合物上。这些化合物有望具有较好的效力和较少的副作用。然而,在使用建模技术时,微软遇到了两个没有专家协助便无法解决的问题:(1)计算机模型的研究不能只局限于探索特定的、有成功希望的结构;(2)模型难以复制一些关键结构(如复杂的环系统等),这是因为该软件是在原子水平上进行生成,所以在构建新的复杂分子结构时遇到了困难。
为了改进建模技术,微软的生成化学(Generative Chemistry)团队与瑞士生物技术和制药公司诺华的专家合作开发了“MoLeR模型”,一种基于图形的机器学习神经网络。它可以在计算机上自动构建有效分子,使药物开发更快、更有效。
通过MoLeR模型,计算机建模技术得以脱离单个原子水平,并能立即处理更大的结构。它的工作方式有点类似于人们的写作方式:用熟知的一个个单词组成句子,而不是用随机的字母序列组成句子。因此,MoLeR模型构建类药物分子所需的步骤更少。此外,这种工作方式更像化学家思考分子构造的方式,所以更为实用。
此外,人工智能非常有助于药物研发人员应对呈指数增长的数据量。它能够编译全球每天出版长度从8~1万页不等的专业文章和其他科学文献。智能文本识别如微软的语言认知服务(Cognitive Service for Language)能够帮助研究人员对重要的信息进行分类。
瑞士的分子建模实验室(mml)公司的一个应用案例表明,人工智能还可以帮助研究人员对临床试验期间产生的数据进行更快地搜索和更好地分类。
mml致力于研究无定形固体分散体(ASD)。它用于药物和有效成分的代谢,即用于人体内药物的生化转化或降解。药物活性成分的分子结构正变得越来越复杂,通过使用ASD则可以降低最终到达体内病灶的活性成分的含量。
在实验室进行的一些复杂研究表明,ASD 有助于提高药物递送系统的溶解度、溶出速率和生物利用度。但是,如果活性成分的浓度超过了溶解度极限,那么ASD就会完全降解或断裂。
长期以来,人们认为预测ASD的均衡稳定性对于建模算法来说过于复杂,因此药物研发人员大多只限于对其进行人工测试。
不过,通过模拟分子,研发人员能够发现许多药物组合和聚合物在各种分散体以及各种条件下的表现。因此,mml的研究人员认为这或许也可以用于发现新的、可能未预料到的ASD 组合,从而提高药物安全性并减少开发新化合物的时间和成本。
然而,在扩展这一革命性的解决方案时,mml的研究人员意识到,它的计算和模拟过于复杂和庞大,在自己公司的计算机上无法进行。因此,他们决定依靠高性能计算 (HPC) 以及云端的人工智能和虚拟机来提高公司模拟建模的能力。凭借着从Microsoft Azure获得的大量计算资源,该公司能够快速为各种条件下的 ASD 结构建模。最终,这使得这家初创公司节省了大量的硬件投资,迅速成长为一家能与世界领先的制药商合作的成熟公司。