●张静 雨萌
今天,Insilico Medicine宣布与日本制药企业安斯泰来制药集团合作,利用其AI技术研发新药。安斯泰来是日本顶尖的制药企业,仅次于武田制药。此次合作意味着Insilico Medicine在亚洲市场再添强大的合作伙伴。这家AI公司缘何获得制药大厂的青睐?生辉于近日采访了 Insilico Medicine创始人兼首席执行官 Alex Zhavoronkov。
《麻省理工科技评论》将“人工智能发现分子”评为2020年“全球十大突破性技术”(TR10)之一。Insilico是该项技术中被点名的一家AI公司,主要研究“用于药物发现、生物标志物发展和衰老研究的AI”。该公司成立于2014年,总部位于中国香港,目前团队规模刚刚超过100人,其中有80多人为AI背景,他们在2016年发表了该领域的第一篇同行评议论文。
一款新药的研发涉及很多流程,从靶点发现——化合物合成——制剂生产——临床实验——批准上市之间要经历极其复杂的过程,需要耗费大量的人力、物力和财力,正因如此,周期长、成功率低、费用高的困境使新药研发难以破局。
“Incilico最擅长的是哪个方面?”,生辉问Zhavoronkov。“我们认为,药物发现是一场MMA(综合格斗)比赛,在药物发现领域,每一方面都得最强。”Zhavoronkov说。他从加拿大皇后大学计算机系毕业之后,在美国约翰霍普金斯大学攻读生物学硕士,之后在俄罗斯的莫斯科国立大学获得物理和数学双博士学位。他曾在加拿大ATI Technologies担任工程师,后该公司被AMD以90亿美元收购。
“世界上没有任何一家公司能做我们能做的事情”,Zhavoronkov宣称。Insilico曾用21天时间创造了30000个蛋白质分子设计,与药明康德和多伦多大学的研究人员合作在实验室中设计出了6个分子,然后在细胞中测试了两个,最后在老鼠身上试验了其中一个分子,结论显示出“类似药物”的特性。整个过程用了46天。此项研究发表在Nature Biotechnology上。
之后没多久,该公司宣布完成了3700万美元的B轮融资,启明创投领投,药明康德、斯道资本、F-Prime Capital、礼来亚洲基金、创新工场、百度风投等其他投资方跟投。
该公司的核心技术是开发一系列生成对抗网络(generative adversarial networks,GANs)和强化学习(reinforcement learning,RL)来识别蛋白质靶点,从而生成具有特定属性的分子结构并合成数据。最新的融资将被用于加快该技术商业化,并推进癌症、纤维化和其他与年龄有关的疾病的内部药物发现项目。
Zhavoronkov所说的 Insilico Medicine的绝对优势在于他们是少有的能把AI渗透到从靶点发现到临床预测每一个产业环节的公司。
AI技术主要包括自然语言处理、图像识别、机器学习、深度学习、认知计算等,它们在新药研发中的应用场景主要有七类,分布在药物研发阶段、临床前研究阶段和临床研究阶段。
从公司数量分布看,目前靶点发现场景的玩 家 最 多 , 比 如 Nimbus、Insitro、IBM、Verge Genomics等;化合物合成、筛选的玩家也不少,比如 Atomwise、Schrodinger、BenevolentAI、深度智耀等;晶泰科技、Iktos是典型的晶型预测公司;另外还有优化临床实验设计、患者招募、药物重定向场景的公司,相比靶点和分子筛选,后者入局者不多。
Zhavoronkov曾在接受《福布斯》采访时说:“选择正确的靶点是药物研发中最复杂和最危险的过程,错误的靶点会导致多年后昂贵的失败。测试靶点的最好方式之一是设计一个能且只能与之结合的小分子化合物。但是,即使是简单的靶点,寻找化合物也需要一年多时间,再加上验证的过程使之更加漫长。AI可以加速这一过程并更快地设计好分子结构。”
Insilico开发了一个名为 “pandomics”的AI开放平台,可以帮助寻找和筛选靶点,该平台上的样本数量超过200万。前几日,勃林格殷格翰制药公司刚刚宣布将利用该平台寻找潜在靶点。
“整个制药业的成功率都很低,传统的制药方式有92%的失败率,他们需要分析各种失败的可能性。对我来说,这只取决于我们所追求的靶点有多复杂。我们目前在纤维化的疾病上找到了5个靶点,非常成功。因为我们的 AI临床数据在2018和2019年已经非常完备。传统的方式会花费5年的时间,而我们在纤维化疾病上寻找靶点只需要2年时间。这是相比于传统药物发现方式上我们的绝对优势。”Zhavoronkov对生辉说。不过他们在训练数据的过程中也会遇到问题,比如一些罕见病的数据太少,没办法训练模型。
Insilico每3个月更新一次模型,每9个月更新一次AI Pharma Pipeline。他们与150多个学术机构和公司合作,从中获得训练数据。
除了以上提到的“pandomics”平台之外,Insilico还有一系列被称为“工具包”的平台资源:追踪使用公共和私人资金生成数据的Pharmacognitive和AgingPortfolio;生成化学的社区资源;生物年龄的预测因子,如Aging.AI;他们正在帮助建立一个名为AgingChart的维基百科,以及一个名为geroprotector的数据库,该数据库跟踪各种干预衰老的有效性。
此前,该公司表示只做 IND(Investigational New Drug Application,新药临床实验申请)之前的环节,所以他们没有实验室。现在,他们决定启动临床前项目,要“把我们的分子从算法延伸到 I期、II期临床试验,AI药物公司不能只是会写漂亮的代码,必须要自己亲自做苦力活。”做出这一决定主要是为了解决当下AI缺乏可解释性的问题。
AI就像一个黑箱,AI公司用算法找到一个靶点或者生成一个分子结构,但药厂不知道过程,这也是大多数药厂对AI保持怀疑态度的原因。Insilico想要通过自己亲自去验证安全性、合理性,告诉药企 AI的结果是可信的、可解释的。
在Zhavoronkov此前的论文中写到,AI缺乏可解释性,机器学习预测器(predictors)、分类器(classifiers)、生成器(generators)的工作都没有采用现代的特征提取和特征选择则技术来使这些工具更加易于解释。虽然人工智能在药物发现方面的进展正在加速,但唯一真正成功的证据是对人工智能产生的分子进行靶点测试。
为了解决可解释性的问题,Zhavoronkov认为,还有一个方式就是定期发表论文。他认为衡量一家AI公司能力的一个重要标准就是论文数量和质量。
Zhavoronkov说,除了可解释性的问题,AI药物研发还有一个难点:“现在有一个普遍的误区是认为我们缺少数据,但事实上数据不难找。现在最大的问题在于验证速度。这完全不同于语音或者图像的识别。我们用几天时间就能想出一个具体靶点的新结构,但需要一两个月、甚至更长时间去合成。要去验证并得到反馈通常需要五个月甚至半年时间。这还不仅仅是时间的问题,在验证过程中很有可能药厂会告诉我分子结构一开始就是错的,或者在这个过程中分子结构因为储藏条件的变化而发生改变。”
另外,AI药物研发公司还有一个普遍的问题,药物专业的人和AI工程师的思维方式存在偏差,在合作中可能会出现一些问题。
从AI初创与大药企之间的合作关系网络也可看出,“AI+药物研发”的成熟期或许将在3-5年内,默沙东、葛兰素史克、拜耳等等大药厂与AI公司合作逐渐频繁,AI日益参与到药物发现的各个环节。
AI公司与大药企的合作方式主要有三种:药厂提出目标疾病,AI公司寻找靶点;药厂给出蛋白质靶点,AI公司设计、筛选分子结构;药厂给出以上要素,AI公司预测临床结果。
“目前我们最大的竞争者就是涉足新药研发全流程的AI公司,中国的相关公司目前的发展阶段还不够成熟,我们会在战术上重视它们,但是我们很清楚,在这一领域我们掌握关键专利。”Zhavoronkov说,很多AI公司说他们可以做药物转化、可以做化学分子、可以发现靶点,但他们手里拿着的却是 MIT、阿斯康利等等公司或者机构的论文和成果挂在自己的公司官网或者PPT上。
Incilico除了与药明康德有长期合作之外,去年10月,Insilico与江苏正大丰海制药签订了2个项目的AI技术开发服务合同,今年与北京泰德制药达成战略合作。
Insilico与药明康德的合作对于双方都至关重要,药明康德早在2018年就领投了Insilico的A轮,布局AI新药研发。前者更是在去年将总部搬到了中国。
“如果说历史是未来的指示灯的话,我觉得中国代表未来的趋势。我非常看好中国制药产业的未来。在中国,我能找到很多非常聪明同时又有大药厂工作经历的人才。”
2017年以来,中国监管机构对创新药给出了积极的信号。新药审批速度加快,以2018年来看,中国抗癌新药审批时长比之前快一倍,最快仅需12个月,而以往需要24个月。2019年国内新药研发领域一级市场活跃,投融资案例数量为130件。从监管、研发、资本投入等多个方向来看,创新药依旧是未来医疗市场最坚定的方向之一。
与之形成对比的是,从 1950年开始,每个新药的研发费用平均每九年增加一倍,药物开发的成本急剧上升。AI带来行业变革是未来必然的趋势。“我们会很高兴见到中国可以有越来越多的药企开始寻找新靶点,我也希望钻研计算机科学的年轻人们能更多地了解生命科学。”■