高丽 刘艾林 杜冠华
随着分子生物学、X射线晶体学的发展,大量与疾病相关的生物大分子的三维结构被确定;计算科学的迅速崛起使得数据挖掘、机器学习等技术快速发展。在这两方面的推动下,计算机辅助药物设计 (computer aided drug design,CADD)应运而生,并渗透到新药研发的各个环节。CADD可以提高药物研发的成功率,降低研发成本,缩短研发周期,是目前创新药物研究的核心技术之一。
CADD以计算机作为操作界面和辅助手段,利用计算化学、分子图形学等技术,将理论思维形象化,使药物设计更加直观、便捷和有效。经过50年的发展和应用,CADD在新药研发过程的不同阶段均产生了重要作用。笔者以CADD的应用为基础,探讨CADD在药物靶点的发现与确证、先导化合物的发现与优化、药物的药动学行为及毒理学前景的评价等方面的应用进展,说明CADD的重要价值和潜在优势,及其面临的挑战和发展前景。
靶点的发现与确证是现代新药研发的第一步,也是新药创制过程中的瓶颈之一。CADD的应用可以加快靶点发现的速度,提高靶点发现的准确度,从而推进新药研发。
生物信息学通过计算机对基因组学、蛋白质组学等数据资源进行采集、存储、分析、处理,并开发出来一些实用的生物信息学软件,如多重序列比对软件BLAST,CLUSTAL,PROMALS3D等将靶点序列与数据库中的同源序列进行比对,实现对靶点的分类;PPT-DB数据库可以预测蛋白质的二级结构、等电点、疏水性等理化性质,实现对靶点的识别。此外,运用生物信息学可以整合分析大量的临床实验数据,为靶点的确证提供新的视角。
Chhabra等运用BLASTp将产气荚膜梭菌(Clostridium perfringens)的2558个基因与人的基因组进行序列比对,将比对结果中与人同源性低的基因在必需基因数据库(database of essential genes,DEG)中进行比对分析,从中发现ABC转运蛋白等5个抗菌药物作用靶点,从而为广谱抗菌药的开发提供了重要的参考信息。
一般而言,生物信息学辅助药物靶点发现与确证主要通过比对氨基酸序列的相似性来实现,因此很难发现与已知靶点同源性低的“新型”药物靶点。基于机器学习和结构风险最小化原理开发的支持向量机(support vector machines,SVM)方法,通过建立人工智能模型区分成药性和非成药性蛋白,预测“新型”药物靶点。
最近,Han等应用SVM方法对1484个成药性蛋白和6637个非成药性蛋白进行预测,其准确率分别达到64.1%~71.0%和85.0%~85.8%,其中包括“新型”药物靶点,这说明SVM技术对靶点尤其是“新型”药物靶点成药性具有较好的预测能力。
反向分子对接是将同一个活性分子分别对接到多个蛋白的活性位点,以确定该分子潜在药物靶点的技术。该技术能够高效、大规模进行靶点的确定和验证,预测与毒性相关的靶点。
最近Bernard等运用SELNERGYTM反向分子对接软件发现了托非索泮(tofisopam)的作用靶点。托非索泮是一种外消旋体,作为抗焦虑药于20世纪80年代在亚洲和欧洲上市,但其生物学靶点不明确。反向分子对接结果显示,托非索泮的作用靶点是磷酸二酯酶4(phosphodiesterase 4,PDE4)。该药物的S型异构体与已上市的PDE4抑制剂咯利普兰(rolipram)相比,抑制作用更强,且不存在呕吐的副作用,这为开发高选择性的PDE4抑制剂提供了广阔的应用前景。
先导化合物的发现和优化是创新药物研究成败的关键。长期以来,先导化合物的发现依赖药物化学家合成大量的化合物以及药理学家运用各种模型进行大量筛选。CADD的应用,包括基于结构的药物设计(structure-based drug design,SBDD)、基于配体的药物设计(ligand-based drug design,LBDD)、高通量虚拟筛选(high-throughput virtual screening,HTVS)等技术,突破了传统的先导物发现模式,极大地促进了先导化合物发现和优化。
基于结构的药物设计(SBDD)是根据药物靶点结构,研究受体和小分子之间的相互作用,设计与活性口袋互补的新分子或寻找新型先导化合物的技术。SBDD方法包括分子对接、全新药物设计等,常用的分子对接软件有Autodock、Gold、Dock、FlexX、Glide、MOE等。
目前国内外应用SBDD技术已经取得了非常显著的成绩,在该技术的辅助下,许多药物已成功上市或进入临床研究,近年来SBDD技术应用成功的典型实例;对于卡托普利、扎那米韦的成功研发过程这里分别作一简述。
2.1.1 抗高血压药物卡托普利(captopril)的发现血管紧张素转化酶(angiotensin-convertingenzyme,ACE)是一种Zn2+依赖型羧肽酶,对血压起重要的调节作用。羧肽酶A与ACE结构相近,且羧肽酶A的活性位点、特异性底物及其抑制剂在当时已被充分认识,而ACE的活性位点尚不明确。因此,研究人员针对羧肽酶A的活性位点,ACE及其底物结构建立了ACE活性位点假说。
对比两者的活性位点发现,ACE与羧肽酶A的活性位点都包含与底物羧酸阴离子末端结合的阳离子位点和Zn2+,主要差别在于两者的距离不同。ACE中阳离子位点与Zn2+相距二个氨基酸残基的距离,而羧肽酶A中只相距一个氨基酸残基的距离。
L-苄基琥珀酸,是有效的羧肽酶A抑制剂,其两个羧基分别与阳离子位点和Zn2+作用。根据ACE和L-苄基琥珀酸的结构,适当延长两个羧基之间的距离,设计出琥珀酰脯氨酸。结构改造发现,D构型2-甲基取代的琥珀酰脯氨酸衍生物对ACE的抑制活性增强了15倍,表明立体特异性的甲基取代使抑制剂与酶的作用显著增强。构效关系研究发现,当化合物2的末端羧基被巯基取代时,抑制活性变为原来的1000倍,由此发现了卡托普利,1981年被FDA批准为第一个应用于临床的ACE抑制剂,用于治疗高血压。
2.1.2 神经氨酸酶抑制剂扎那米韦(zanamivir)的开发流感是一种常见的病毒感染性疾病,其传染性强,传播速度快,易发生大范围流行。据统计,1976—2007年美国由于季节性流感的平均年死亡人数为23607人。时至今日,流感病毒依然猖獗,开发抗流感药物成为全世界药物研发的重要课题。流感病毒神经氨酸酶(neuraminidase,NA)又称唾液酸酶,能催化裂解唾液酸末端和相邻糖基之间的糖苷键,促进病毒从感染的细胞中释放,继而感染新的宿主细胞。因此,抑制NA即可干扰或阻止流感病毒的复制,达到防治流感的目的。NA晶体结构于1983年被确定,之后运用探针技术及计算软件GRID确定了其结合位点和结合能。Glaxo Wellcom公司应用分子模拟和计算化学方法,设计出了扎那米韦。
扎那米韦的发现是成功应用计算机辅助药物设计的典范,其开发的思路受到广泛重视。首先,研究人员以已知的NA抑制剂2-去氧-2,3-去氢-N-乙酰基神经氨酸(Neu5Ac2en)为设计模板,根据Neu5Ac2en中C4位OH与NA活性位点的结合特征,用氨基取代羟基得到2-去氧-2,3-去氢-N-乙酰基神经氨酸衍生物(4-amino-4-deoxy-Neu5Ac2en),该化合物能与Glu119形成盐桥,因此与NA具有更高的亲和力;在此基础上,用胍基取代氨基,得到扎那米韦,扎那米韦的胍基能同时与Glu119和Glu227相互作用,与NA的亲和力显著增强,Ki达到2×10-10mol·L-1。实验证明,扎那米韦能够有效抑制A型和B型流感病毒,于1999年8月由美国FDA批准上市。
基于配体的药物设计(LBDD)是从已有的活性小分子结构出发,通过建立药效团模型(pharmacophore model)或定量构效关系(quantitative structure-activity relationship,QSAR),预测新化合物活性或指导原有化合物结构改良。基于配体的药物设计方法主要有药效团模型构建和定量构效关系分析。
2.2.1 药效团模型的构建药效团模型的构建是先导化合物发现的重要方法,有基于配体和受体两种方式。基于配体的药效团模型的建立是从一系列活性化合物结构出发,确定其生物活性必需的疏水、氢键等特征元素;基于受体的药效团模型通过探测生物大分子与配体的相互作用点来建立。药效团模型建立之后,通过对数据库中化合物进行3D搜索,可以富集活性化合物,从而发现新的活性分子。目前,常用的构建药效团的软件有DISCO、HypoGen、GASP、PHASE等。
药效团模型构建的药物设计方法已广泛应用于药物研发中,也有很多成功的例子。CB2受体与慢性痛、炎症、动脉粥样硬化等疾病密切相关,Markt等建立药效团模型并应用该模型对922944个化合物进行虚拟筛选,得到14个分子。经活性验证有7个化合物的Ki值在25 μmol·L-1以下,包括CB2受体的部分激动剂、反向激动剂和拮抗剂,新型母核结构也随之确定,奠定了开发CB2受体的活性配体的基础。
2.2.2 定量构效关系分析定量构效关系分析一般基于有相同母体的同系物分子,采用数理统计的方法构建方程,分析化合物的生物学活性与其结构的定量变化规律,预测改造后的化合物活性,用于先导化合物的优化。构效关系通常分为2D-QSAR和3D-QSAR,目前,QSAR正向多维化方向发展,引入了4D-QSAR和5D-QSAR的概念,以克服3D-QSAR中分子排列和构象选择等问题。
HIV整合酶催化病毒DNA插入到宿主染色体内,是HIV复制必需的基本酶之一,由于只存在于病毒体内,因此是十分有前景的抗HIV药物设计靶点。整合酶抑制剂通过抑制整合酶,能有效抑制HIV复制,为抗HIV药物的开发指明了方向。Kuo等运用3D-QSAR中的比较分子场分析法(comparative molecular field analysis,CoMFA)和比较相似因子分析法(comparative molecular similarity indices analysis,CoMSIA)建立了可靠的活性预测模型,用于设计新型整合酶抑制剂。
乙酰胆碱酯酶(acetylcholinesterase,AChE)抑制剂是治疗老年性痴呆的一线临床药物,本实验室Liu等应用CoMFA方法,对30多个新型活性化合物进行构效关系分析,建立了3D-QSAR模型,为设计高活性的乙酰胆碱酯酶抑制剂提供重要线索。
高通量虚拟筛选(HTVS)针对靶点的三维结构或已建立的药效团模型、QSAR模型,从化合物数据库中,将符合条件的小分子挑选出来,进行生物活性测试,成为先导化合物发现的重要手段。
近年来,采用HTVS技术发现的先导化合物的实例迅速增长。如趋化因子受体5(CCR5)激动剂,酪蛋白激酶2(CK2)抑制剂等。NA是抗流感的作用靶点,本实验室Liu等应用虚拟筛选技术,对10000个化合物进行NA抑制作用的虚拟筛选评价,选择结果较好的160个化合物用高通量筛选技术进行NA抑制活性评价,最终发现3个有显著活性的NA抑制剂,其IC50均小于3 μmol·L-1。
上述各种药物设计方法并不是相互独立的,在实际应用过程中需要根据获得的信息,综合运用多种方法,来实现先导化合物的发现和优化。LY-517717和NVP-AUY922的发现综合运用了SBDD和HTVS技术;基于受体和配体相结合的虚拟筛选方法与仅用一种方法相比,能够获得更为可靠的结果,已成功应用于先导化合物的发现,如D3受体激动剂,MDM2-p53抑制剂等。
药物代谢动力学(pharmacokinetics,PK)和毒理学(toxicity,T)是药物临床前研究的重要组成部分,其中PK反映了药物在生物体内吸收(absorption,A)、分布(distribution,D)、代谢(metabolism,M)、排泄(excretion,E)的规律。在过去的新药创制过程中,约60%的药物由于ADME性质不佳或毒性过大而导致开发失败,为此研究者付出了沉重的资金和时间代价。
基于QSAR、定量结构性质关系(quantitative structure property relationship,QSPR)、定量结构—毒性效应关系(quantitative structuretoxicity relationships,QSTR)等理论基础,ADME/T性质预测能将无成药前景的药物在早期排除在研究范围之外,从而降低研发成本,提高研发效率。
目前,常用的药物代谢产物预测软件有TIMES、METEOR、ADMET Predictor等。METEOR预测9个上市药物的代谢产物,与实验结果完全吻合,说明其有较好的预测能力。DEREK、TOPKAT等软件可以预测药物的致癌性、诱变性、皮肤敏化作用、动物体内难以检测的反应(如恶心、头痛、认知缺损)等,其中DEREK对诱变性预测的准确度在70%以上。
CADD在新药研发中的应用已经取得了可喜的成绩,其可行性强,发展前景广阔。然而,CADD作为一种新型的技术仍然存在许多局限性,有待于改进和完善。
分子对接时受体柔性,水分子的处理,配体的异构化、离子化等均会影响对接的准确性。① 受体柔性的处理。在配体对接过程中许多蛋白会经历骨架或侧链的移动,不同配体对接同一蛋白时蛋白采取的构象也可能不同,因此考虑受体的柔性是非常重要的。随着软件的不断开发,有些软件如QXP、Schrodinger公司的Induced-fitdocking(IFD)模块等已将蛋白柔性考虑在内。与刚性对接结果相比,应用IFD对21个蛋白-配体复合物进行柔性对接后,其RMSD均值从5.5×10-10m减小到1.4×10-10m。② 水分子的处理。水分子在蛋白-配体相互识别过程中起着关键作用,因此在对接时不能忽略水介导的相互作用,然而能够很好地处理水分子是十分困难的。③ 配体的异构化和离子化。分子对接时,配体会形成多种形式的异构化和离子化状态,选择哪种构象的配体作为对接结果仍然是个难题。
配体构象的产生和训练集化合物的选择影响基于配体的药效团模型构建,受体活性位点的柔性和个数影响基于受体的药效团模型构建。① 配体构象的产生。多数情况下,配体分子是柔性的,如何高效、准确地产生配体所有可能构象是药效团模建中的主要难题之一。最近开发的构象搜索算法CAESAR可以有效排除系统搜寻过程中由于拓扑对称产生的重复构象,与Catalyst/FAST相比,速度提高了5~10倍。② 训练集化合物的数目和结构多样性。应用同一软件的同一算法,选择不同的训练集可能产生完全不同的药效团模型,因此要合理选择训练集化合物,并理性分析药效团数据搜索的结果。③ 受体活性位点的柔性和个数影响基于受体的药效团模建的准确性。
综上所述,CADD在新药研发中的优势已经日益凸显。CADD为新药研发开辟了新的天地,我们不必盲目地合成大量的化合物,做大量的生物活性测试,既节省了原料和动物,又节约了时间,提高了研发效率。同时,我们应该认识到CADD是新药研发过程中的重要辅助方法之一,它不是万能的,计算结果不能取代实验数据,药物设计结果最终还需要实验的验证,并借助实验结果来改进和完善CADD方法与策略。无论如何,CADD为新药研发提供了一种新的思维模式,并渗透到新药研发的各个阶段,其可行性很强。随着化学计算理论方法的不断完善以及CADD计算软件的不断改进,CADD在新药研发中必将得到更广泛的应用,以更好地推动新药研发。
(摘自《中国药学杂志》2011年第9期)