宋 衡
(天津市职工医院,天津 300050)
综 述
药物分子设计中定量结构-药代动力学关系研究进展
宋 衡
(天津市职工医院,天津 300050)
本文阐明定量构动关系的概念,说明定量构动关系研究对于药物分子设计的重要性和必要性。概述了定量构动关系的研究内容与研究方法,综述了近年来国内外药物定量构动关系的研究进展,以及定量构动关系研究对于药物分子设计和药物研发的指导意义,并建议性地提出了今后可能的研究方向。
定量构动关系,药物分子设计,分子描述符,药动学
传统的新药研发需漫长的时间与高昂的成本,且成功率低。据统计,在30000个新化合物中有2 000个可进入临床前研究,200个可进入Ⅰ期临床试验,40个可进入Ⅱ期临床试验,12个可进入Ⅲ期临床试验,8个可被批准上市,仅有1个在投资上有良好收益。其中很大一部分原因是其药动学性质达不到要求[1,2]。因此,在药物分子设计的早期筛选出具有良好药动学性质的候选化合物,达到药物分子设计的药效学与药动学最佳平衡,关系到新药研发的成败。基于生命科学与信息科学的计算机辅助药物设计(cumputer-aided drug design,CADD),为合理的药物设计提供了可能,极大地提高了筛选的命中率[3],运用计算机进行的定量构动关系(quantitative structure pharmacokinetic relationship,QSPR)研究,目的之一就是在保证药效分子结构的同时优化和筛选药物分子,使其具有最佳药动学性质,有效地节省因化学合成和体内外实验而耗费的大量时间及资金,提高新药的研发效率,缩短研发进程,成为当今药物化学的发展方向之一。
1.1 定量构动关系 定量构动关系(QSPR)研究是以分子描述符为基础,即将药物分子表达为若干个分子结构参数(分子结构描述符),然后建立此参数与药动学性质相关联的数学模型,探讨药物分子结构及性质与其在人体内的吸收、分布、代谢、排泄(absorption、distribution、metabolism、excretion,ADME)等药动学参数之间的定量关系,从而为优化药物分子结构以获得最佳人体药动学性质提供依据。ADME是药物进入人体的代谢必经过程,也是一个复杂的过程,每个环节都可能对药物的有效性和安全性产生影响。所以,在新药的研制和临床用药过程中,ADME也是评价化合物成药性的重要指标[4]。QSPR的主要原理是,利用化合物的理化性质和相关的体内外实验数据,根据人体生理学知识,结合数学模型模拟化合物在人体内的ADME过程。例如,研究人员已应用计算机技术,以药物在Caco-2细胞模型中的渗透系数P为因变量构建了许多预测药物ADME中吸收性能的数学模型[5]。QSPR研究的主要步骤是数据信息的采集、分子结构输入、分子描述符的计算与相关性分析、数学模型的建立和验证。经过验证的模型可用于预测具有某一特征分子描述符的药物分子相关的药动学参数,从而对药物分子的优化提供理论依据。QSPR预测的精确度主要取决于分子描述符的选择以及建模所采用的数学方法[6]。
1.2 分子描述符及其筛选与计算 分子描述符即药物分子的结构参数,其必须能反映药物分子的特征。常用作分子描述符的分子结构参数有:电性参数:偶极矩Diop、分子最低空轨道能量ELUMO、分子最高占有轨道能量EHOMO等;疏水性参数logP;水合能EH;氢键参数:如氢键给体个数HDO等;拓扑学性质参数;几何参数:分子体积V、分子量M、表面积S等;量化参数;立体参数等。分子描述符的选取对药物药动学性质评价和预报模型的稳定性及准确性至关重要。其选择原则主要有两点:一是尽量用较少的变量来表征尽可能多的药物分子结构信息;二是选择一个小的与研究对象密切相关的分子描述符集合。这些对于QSPR预测模型的建立是非常重要的。目前,常用的分子描述符筛选方法有:逐步回归法、遗传算法、启发式方法、人工神经网络法、变量最优子集回归法、 PLS变量筛选法等[7]。随着量子化学在药物研究领域的广泛应用,运用AM1、PM3等半经验方法和Gaussian、Hondo等从头算方法求解药物分子的Schrodinger方程,可从本质上解释药物与受体的相互作用,同样重要的是,量子化学参数本身已隐含了分子结构的几何特征,其物理意义更加明确。因而在理论上可获得更高的拟合度和预测精度,现已广泛用于QSPR研究中分子描述符的计算。
1.3 建立QSPR模型所采用的数学方法 QSPR模型是连系药物分子描述符与药动学性质的纽带,是一种药物分子结构与其药动学性质间的定量函数关系。应用数学方法建立这种关系是QSPR研究的重要环节。好的QSPR模型可以正确反映药物分子结构与其相应的药动学性质的关系,从而为备选药物分子药动学性质的预测及达到良好药动学性质的药物分子优化提供理论上的依据,其主要取决于药物分子描述符的选择和数学模型的表达形式。目前常用的建模方法有:多元线性回归法、主成分回归法、偏最小二乘法、聚类分析法、递归分割法、人工神经网络法和支持向量机法等。多元线性回归法代表模型有Hansch模型、Free-Wilson模型等。偏最小二乘法、一般算法及分子指纹图谱[8]、比较分子力场分析(CoMFA)等方法由于需要大量数学计算和相关程序,阻碍了其进一步的应用。目前,比较流行的QSPR模建方法是人工神经网络法。国内有文献报道的QSPR研究大多采用人工神经网络法建模,国外的一些QSPR研究者也有相当一部分采用此法建模。刘涛[9]分别用偏最小二乘法和人工神经网络法对碳青霉烯类化合物的分子描述符和相关药动学参数进行了建模。用建好后的模型对药物的药动学参数进行预测,结果显示用人工神经网络所建模型的预测误差值远小于用偏最小二乘法所建模型。Fujiwara等[10]在进行QSPR研究时,比较了线性回归和人工神经网络两种方法的预测能力。结果,通过留一法交叉验证(leave-one-out cross-validation)分析显示,简单和二次方根回归模型预测的RMSE值分别是0.584和0.568,均大于神经网络法预测的RMSE值0.507由此可见,人工神经网络模型的预测能力比回归模型更好。
1.4 人工神经网络 人工神经网络是一种新型的信息处理系统,是在对生物神经系统的结构和功能进行数学抽象和模仿的基础上,由大量简单的处理单元广泛连接构成的复杂网络系统;是建立在现代神经科学研究基础上的一种抽象数学模型;反映了大脑功能的基本特征,但并非大脑功能逼真地描写,只是某种简化抽象和模拟,属于一种多变量统计分析方法。由于人工神经网络具有自学习、高度容错性和高度非线性描述能力等特点,因此,在许多领域得到了广泛的应用[11,12],并已成为药学研究的一种重要手段,该项技术已在定量构动关系及定量构效关系研究中被广泛使用[13]。药物的体内过程具有复杂性,采用机理建模方法来阐明药动学性质与药物分子结构之间的关系还存在困难。然而实践证明,人工神经网络方法却适合解决像药动学过程这类知识背景不清楚、因果关系不明确、作用机理不了解、推理规则不确定的复杂性问题。当然,人工神经网络这一新的建模方法也有其现阶段的不足,比如很难发展内置参数、训练时间长、过拟合、神经网络评价和预报模型外推等问题。未来的研究应致力于统一网络模型与通用的学习算法、网络函数、神经元数、变换函数类型、逼近精度与拟逼近及非线性映射之间的关系等基础理论性研究。
自20世纪90年代以来,国内外开始进行了药物分子结构与药动学参数的QSPR研究。
周鲁等[14]应用半经验量子化学方法和误差反向传播人工神经网络方法,研究了头孢菌素类抗生素的定量构动关系。头孢菌素作为一类广谱抗菌药物,自1984年被发现以来,因其广谱、高效、抗菌活性强、副作用小等优点,得到临床广泛关注[15],对于这类药物的研究也是不断深入。研究者利用量子化学AM1算法计算了26种头孢菌素的18个结构参数,并利用MATLAB软件对其进行相关性分析,筛选出与头孢菌素类抗生素药动学指标相关性较大的6个结构参数(ELUMO、Diop、EH、logP、M和HDO)作为人工神经网络的输入参数,以头孢菌素类抗生素的5个主要药动学指标(t1/2α、t1/2β、AUC、Cl和Vap)作为人工神经网络的输出参数,利用误差反向传播的神经网络(BP网络)构建头孢菌素类抗生素的QSPR模型。从26个头孢菌素类抗生素样本中,随机抽取了23个样本作为训练集:模型的训练是QSPR建模过程中一个非常重要的环节,此研究中,BP网络通过不断调整参数net trainFcn已设定的训练函数来实现网络的训练,而训练的方式由参数net.trainFcn的值确定。通过对已设定函数关系的调整达到6个结构参数,通过函数关系得到的5个药动学参数与实际值相差最小。具体设定如下:学习率lr为0.04,学习增长率lr-inc为1.085,循环次数epochs为8000次,目标误差(以网络误差的均方根之和MSE作为性能函数)goal为0.01,经977次迭代后,MSE<0.01,此时,模型训练完毕。后用剩余的3个样本对训练好的QSPR模型进行验证,因为对模型本身性能的验证关系到构动关系预测的准确性。建立的QSPR模型就像一个三棱镜,要真实折射出药物分子结构相应的药动学参数,从而为药物分子的筛选与修饰提供一个可靠的标准与依据。结果显示,头孢菌素类抗生素的ELUMO、Diop、EH、logP、M和HDO是影响其药动学性质的主要因素,所建立的QSPR模型能有效地描述并预测头孢菌素类抗生素的药动学指标。
喹诺酮类药物作为一类人工合成抗菌药发展迅速并成为目前抗菌药物的研究热点[16]。周鲁等[17]应用量子化学方法和反传神经网络方法研究了喹诺酮类化合物的定量构动关系。该研究采用Hyper Chem 7.0量化程序包计算了21个喹诺酮类化合物的16个理化和量化参数,将16个结构参数在MATLAB软件包进行相关性分析,筛选出6个与其药动学性质相关性较大的结构参数:Diop、7-位取代基的净电荷QR7、分子体积V、EH、logP、EHOMO作为人工神经网络的输入层,以实验获得的喹诺酮类化合物的3个药动学参数Cmax、AUC和t1/2为输出层建立了含两个隐含层的反传神经网络QSPR模型。随机选出20个化合物作为训练集并进行leave-one-out分析,剩下1个化合物作为预测。结果显示,所建模型能有效地分析喹诺酮类化合物的定量构动关系。对喹诺酮类药物的研究近年来如雨后春笋,赵瑞[18]采用LC-MS/MS分析方法,对喹诺酮类药物吉米沙星的PK/PD及新型抗结核药物的ADME/T早期研究也是其中典型代表。陈英等[19]采用逐步多元回归法及人工神经网络法,从分子极性表面积和分子量预测喹诺酮类药物的血浆蛋白结合率。研究人员根据半经验自洽场分子轨道AM1法,对优化构型用Monte Carlo法计算得到分子量和分子极性表面积,用逐步多元回归分析法及人工神经网络法建立从药物的分子量、分子极性表面积预测喹诺酮类药物的人血浆蛋白结合率的数学模型,回归方程采用statistics 60软件,结果喹诺酮类药物的人血浆蛋白结合率与分子量和氢键给体表面积具有良好的相关性。神经网络的计算结果25个训练样本的根均方误差RMSE为0.036 8,3个预测样本的根均方误差RMSE为0.064 0,结果表明药物血浆蛋白结合率与分子量和分子极性表面积密切相关。从分子极性表面积预测药物血浆蛋白结合率具有方便快捷的优点,可用于相关的药动学参数研究。
周鲁等[20]利用量子化学和神经网络方法研究了药物清除率的定量构动关系,目前国内外对药物清除率与药物分子结构参数关系的研究工作开展的比较少[21]。研究者利用Hyper 6.0化学程序软件包计算了100种药物的理化参数,用AM1半经验算法计算了18个量化参数,同时采用主成分分析法对其进行筛选,获得3个独立结构参数,分别以3个结构参数和18个结构参数作为神经网络的输入,以药物清除率作为输出进行了神经网络的建模和预测,结果表明采用3个结构参数作为输入的神经网络的预测能力明显优于采用18个结构参数,所建预测药物清除率的神经网络可行,同时证明建模时进行药物分子结构参数选择非常必要。
李钢[22]应用量子化学方法和人工神经网络法研究了磺胺类药物生物利用度的定量构动关系。磺胺类药物主要通过竞争性结合二氢叶酸合成酶影响叶酸代谢进而阻碍病原菌生长[23]。研究者计算了48种磺胺类药物的14余种结构参数,并利用相关性分析筛选出了6个结构参数:EHOMO、ELUMO、Diop、V、logP、EH作为人工神经网络计算的输入建模。并对模型进行了训练和验证。用建立的QSPR模型预测了3个磺酰胺类内皮质受体拮抗剂的生物利用度,结果显示所建模型有较好的预测能力。
DiFenza等[24]采用人工神经网络方法,结合Caco-2细胞模型,对小肠吸收过程进行模拟,并以Papp作为通透性指标,利用遗传法则选择分子描述符,成功构建了反应分子结构与吸收性能关系的QSPR预测模型。
Gleeson等[25]运用QSPR模型预测药物在人和大鼠体内的Vss,其间采用了3种不同的统计学方法:贝氏神经网络、分类回归树以及偏最小二乘法,并结合药物在人和大鼠体内的Vd数据进行预测。结果表明,这些模型的应用对早期的药物研发有很大的帮助。
药物作为配体在与受体结合之前,要经过生物体的某些体内过程,其药动学性质起着举足轻重的作用。21世纪的药物分子设计必须同时科学、完整地预见化合物的药效学和药动学性质。如果说构效关系研究是药物分子设计的终极目标,那么构动关系的研究则是实现这一终极目标必要的前提和保障,相比于定量构效关系(QSAR)研究,可追溯到十九世纪[26],QSPR的研究虽起步较晚,但已呈现出良好的发展态势。国内外大量的研究成果表明了QSPR研究的科学性、可行性与必要性。另一方面,由于生物体的复杂性和某些药物药动学性质的特殊性,现有的QSPR研究水平还不能很好地解释一些现象。但目前的研究已经提供了大量宝贵的药物结构与药动学性质间定量关系的资料,更深入地探索药物结构与其药动学性质的联系将不再是梦想。
同时,QSPR的研究不是孤立的,它与QSAR研究是相辅相成的。脱离了人体的药效不能称之为药效,而使药物与受体有了较佳结合机会的同时,药物分子本身对受体的亲和力与内在活性也十分重要,寻找这个平衡点有可能成为未来QSPR研究的发展方向。总之,QSPR研究为当代合理药物设计开辟了一条新的道路,可望提高药物设计和开发的质量,将更安全有效的药物分子应用到临床治疗中。
1 Waller C L, Shah A, Nolte M. Strategies to support drug discovery through integration of system and data[J].Drug Discov Today,2007,12(15/16):634-639
2 Smith P A, Sorich M J, Low L S,etal. Towards integrated ADME prediction : past , present and future directions for modelling metabolism by UDP-glucuronosyltransferases[J]. J Mol Graph Model ,2004,22(6):507-517
3 郭晓娟.局部黏着斑激酶抑制剂的设计合成及药理活性初筛[D].湖北:华中科技大学,2013:16-17
4 吴丽红,韩伟,秦晶,等.ADME/T评价技术在组分中药配伍吸收研究中的应用[J].黑龙江医药,2014,27(5):1022-1024
5 Faqerholm U.Prediction of human pharmacokinetics—gastrointestinal absorption [J].J Pharm Pharmacol,2007,59(7):905-916
6 Yamashita F,Hashida M.In silico approaches for predicting ADME properties of drugs[J].Drug Metab Pharmacokinet,2004,19(5):327-338
7 张永红.基于PLS变量筛选法的QSAR模型快速评价药物的ADME活性[D].重庆:重庆大学,2013:4
8 王明华,陈建华.色谱技术在药物定性分析中的研究进展[J].抗感染药学,2013,10(4):251-254
9 刘涛. 碳青霉烯类化合物的构效/构动关系及分子设计[D].四川:四川大学,2006:8
10 Fujiwara S,Yamashita F,Hashida M.Prediction of Caco-2 cell permeability using a combination of MO-calculation and neural network[J].Int J Pharm,2002,237(1/2):95-105
11 王昭懿,陈永杰,韩丽琴.基于BP神经网络黄芩红外光谱数据与总黄酮含量模型的建立[J].吉林医药学院学报,2016,37(4):257-260
12 张方圆,郁芸,赵宇,等.人工神经网络在临床医学中的应用[J].北京生物医学工程,2016,35(3):318-324
13 钱俊臻.基于神经网络的黄酮类金属配合物抗肿瘤与抗氧化构效关系模型研究[D].重庆:重庆大学,2014:16
14 周鲁 , 郝丽芬. 头孢菌素类抗生素的定量构动关系[J]. 华西药学杂志,2006,21(6):534-536
15 郭岚,马丽梅,张发明.头孢菌素类抗菌药物研究进展[J].北方药学,2015,12(9):74-75
16 陈丕俞,齐学硕.浅析喹诺酮类药物的研究进展[J].黑龙江医药,2013,26(6):122-125
17 周鲁,夏昆华. 喹诺酮类化合物的定量构动关系[J] 华西药学杂志,2006,21(5):433-435
18 赵瑞.喹诺酮类抗菌药吉米沙星的PK/PD及新型抗结核药物的ADME/T早期研究[D].北京:北京协和医学院,2015:117-131
19 陈英,詹淑玉,张琼.从分子极性表面积预测喹诺酮类药物的血浆蛋白结合率[J].海峡药学,2013,25(2):250-254
20 周鲁, 赵蔡斌. 药物清除率的定量构动关系研究[J]. 华西药学杂志,2005,20(1):4-6
21 Lewis, DFV, Dickins M. Factors influencing rates and clearance in P450-mediatedr reactions:QSARs for substrates of the xenobiotic-metabolizing hepatic microsomal P450s[J].Toxicology,2002,170:45
22 李钢.磺酰胺嘧啶类内皮素受体拮抗剂的构效/构动关系及分子设计[D].四川:四川大学,2005:43-46
23 龙颖姣,刘晓鹏,陈平.伊氏肺孢子菌中二氢叶酸合成酶基因突变与磺胺耐药的研究进展[J].中华传染病杂志,2015,33(7):443-445
24 Di Fenza A,Alaqona G,Ghio C,etal.Caco-2 cell permeability modelling:a neural network coupled genetic algorithm approach[J].J Comput Aided Mol Des,2007,21(4):207-221
25 Gleeson M P,Waters N J,Paine S W,etal.In silico human and rat Vss quantitative structure-activity relationship models[J].J Med Chem,2006,49(6):1953-1963
26 张成林.2型糖尿病治疗药物芳基咪唑啉、三氮杂芴衍生物的QSAR研究[D].湖南:南华大学,2014:2
2016-06-09
R969.1
A
1006-5687(2016)05-0060-04