EP1受体抗拮剂定量构效关系

2012-07-19 05:47闫玉莲杨银凤卢晓伟张述伟
哈尔滨工业大学学报 2012年4期
关键词:受体分子预测

闫玉莲,李 燕,杨银凤,卢晓伟,张述伟

(大连理工大学化工学院,116024 辽宁 大连)

EP1受体抗拮剂定量构效关系

闫玉莲,李 燕,杨银凤,卢晓伟,张述伟

(大连理工大学化工学院,116024 辽宁 大连)

为辅助开发高活性EP1受体抗拮剂,探讨和研究EP1受体拮抗活性的关键影响因素,选取103个EP1受体抗拮剂分子作为数据集,采用多元线性回归(MLR)法和主成分分析(PCA)法分析每个分子的254个参数进行模拟建模.结果表明,应用MLR和PCA方法都得到了具有良好预测能力的定量构效关系模型.MLR法所建模型结果为:训练集R2=0.77,SEE=0.83,检验集R2=0.74,SEP=0.33.PCA所建模型为:训练集R2=0.72,SEE=0.45,检验集R2=0.71,SEP=0.38.两种方法相比,MLR法所建模型较优,可靠性及预测性强.这些模型及其确定的活性影响参数有助于辅助研发和筛选新型EP1受体抗拮剂.

EP1受体抗拮剂;定量构效关系;多元线性回归;主成分分析

前列腺素是一类重要的具有多重生物活性的内源性天然产物,是多种生理过程的重要介质[1-3],由机体通过花生四烯酸代谢产生[4].前列腺素E2(prostaglandins E2)是其中的一种,主要作用于神经及其周边系统.EP1是前列腺素E2的特异性受体,在治疗炎症和神经痛方面具有优良特性[5-6].结构上含酸性基团的甘氨酸磺胺类EP1受体抗拮剂对神经系统的作用往往受限[4],因此,对结构上不含酸性基团的这类抗拮剂的研究可能会引起其对神经系统活性的改变.目前,国内外对结构上含酸性基团的EP1受体抗拮剂的研究已较深入,对不含酸性基团的分子则研究较少.本文拟对103个含酸性基团的EP1受体抗拮剂分子进行定量构效关系(quantitative structure-activity relationship,QSAR)研究,以探讨影响其拮抗活性的关键结构参数.目前还未发现此类分子的模拟研究报道,因此,在多年计算机模拟工作[7-11]的基础上,对这类分子进行了QSAR研究.

1 数据与方法

1.1 数据[4-6]

共103个EP1受体抗拮剂(如表1,骨架结构如图1).建模过程中随机选取80个分子作为训练集,其余作为检验集,抗拮剂分子活性采用pIC50.

表1 数据集分子结构及活性

图1 分子骨架结构

采用Dragon软件为每个分子计算得到254种理化及结构参数,包括kappa形状、电-拓扑等价以及总拓扑指数等,然后分别利用多元线性回归(multiple linear regression,MLR)和主成分分析法(principal component analysis,PCA)分析处理这些参数,反复训练与检验模型,最终确立最优模型.

1.2 方法

为了与MLR法进行比较,采用主成分分析方法进行数据研究.PCA法是利用数学上处理降维的思想,将实际问题中的多个参数重新组合成一组新的几个综合参数,并用其代替原来参数的一种多元统计方法.其数学模型为:若有n个分子,每分子共有p个参数(变量)描述,则这些参数构成了一个n×p阶矩阵,即

其中 X1=(X11,X21,…,Xn1)T,将(X1,X2,…,Xp)线性拟合,得到新的参数factor1,factor2,…,然后将这些参数对其分子活性pIC50做MLR,得到新的MLR方程.

2 结果

2.1 MLR法

采用5种MLR法进行数据预测,其中逐步筛选法(stepwise)所得的结果最优,最终确立一个数学模型A,即

该模型统计结果良好:R2=0.77,SEE=0.83,N=6.将该模型用于预测检验集分子活性,其R2=0.74,SEP=0.33,预测能力良好,充分证实了该模型的可靠性.此外,检验集和训练集分子预测值与实验值吻合较好,如图2所示.

图2 模型A实验值与预测值的对比

模型采用了分属两类的6个参数,即结构参数(nN:氮原子个数;DECC:偏心性质;RBN:旋转键个数;nR06:6元环个数)和拓扑状态指数(Ms:平均电性状态;HNar:鸣海谐波拓扑指数),由式(1)可见模型A中DECC、Ms及HNar系数相对较大,证明其为影响分子活性的主要因素.

2.2 PCA法

用PCA法得到9个主成分(principal component,以P表示),共包含了原数据95.61%的信息,主成分的变量值和累计值见表2.然后利用MLR法对其分析,最终得到一个包含前8个主成分的数学模型B,其相关系数 R2=0.72,SEE=0.45,应用于检验集得到了R2=0.71,SEP=0.38的结果.模型B实验值与预测值的对比见图3.该模型如下:

表2 主成分的变量值和累计值

图3 模型B实验值与预测值的对比

如表2所示,P1到 P8反映了原始数据94.70% 的信息,包含了分子的结构、拓扑、连接、二维自相关等多种结构信息.

3 讨论

3.1 MLR和PCA方法比较

由表3可见,在MLR建模过程中,由逐步筛选法和向前筛选法(forward)所建模型的统计结果一致.且模型的可靠性和预测能力良好(训练集R2=0.77,验证集R2=0.74),其散点图中的训练集和检验集的趋势线几乎重合,数据点大部分分布在趋势线的两侧(图2),且近似线性,证明了该模型的合理性.此外,直接进入法(enter)、强制去除法(remove)和向后筛选法(backward)所得模型的统计结果相同.但这些模型的训练集与检验集R2相差较大,说明出现过度拟合现象,其散点图中训练集与检验集的趋势线成很大角度,且数据点分散,所建模型不可靠.

表3 各种建模方法结果对比

由PCA-MLR组合模拟得到模型6,如表3所示.其训练集R2=0.72,验证集R2=0.71,预测能力良好.对比其和MLR所建模型2、5可知,两者模型结果均较好,因此,采用逐步筛选和向前筛选两MLR法及PCA法所建模型为最优.虽然采用PCA法所建模型预测能力良好,但该法消除了各参数间的相关性,且所得的主成分只映射了全部信息的94.70%,应用参数也较多,不能较直观地影响分子活性的关键参数.而MLR法可以较直观地解释活性与结构关系,综合考虑,多元线性回归(MLA)法对研发和筛选EP1受体拮抗剂更为适合.

3.2 PCA法相关讨论

表4为PCA-MLR联用所建模型预测能力与其所用主成分个数的关系.其中,N表示模型所用P的个数,R和R分别表示训练集和验证集的相关系数.

表4 选择主成分个数与模型预测能力关系

由表4可知,当用5个 P时(只表达出89.25%的原始信息,见表2)所得模型较差,训练集和检验集R2较小.随着模型所用P数目的增加,模型训练集和检验集R2都变大.当使用9个或8个P建模时,得到的两模型训练集和检验集R2基本一致,说明使用8个主成分已经可以很好地建立有良好预测能力的模型.

3.3 对未知分子的活性预测

为验证所建模型的推广性,另外选择了文献[12]中的4个与本文所研究的结构类似的分子作为第二验证集,利用上述模型A和B分别对其对EP1受体的拮抗活性(pIC50)进行了预测,并与其实验值进行了比较.结果如图4所示.

图4 利用A,B模型检测相似分子活性

由图4可见,数据点呈线性且均匀分布在趋势线两侧,所得R2=0.96,再次证明了模型A的良好预测能力.但模型B的R2仅有0.28,预测能力较差.因此,模型A为较优模型.此外,若能进一步增加模型数据集中分子数目及多样化结构,扩大所研究分子的实验活性范围,本文所建模型的预测能力必将具有更好的推广性.对这一工作的研究仍在进行中.

4 结语

首次对不含酸性基团的一系列EP1受体抗拮剂进行了QSAR模拟研究,并建立了具有良好预测能力的数学模型.在建模过程中用到了5种MLR和PCA统计方法,其中MLR所建模型优于PCA,易于直观解释,而由stepwise和forward MLR法所建模型最优.这些模型和信息为后续非酸性EP1受体抗拮剂的开发提供了一定理论指导.

[1]MATLHAGELA K,TAUB M.Involvement of EP1 and EP2 receptors in the regulation of the Na,K-ATPase by prostaglandins in MDCK cells[J].Prostaglandins&other Lipid Mediators,2006,79(1/2):101 -113.

[2]RAO T S,SETH S D,MANCHANDA S C,et al.Antiarrhythmic effects of prostaglandins E2 and I2 on ouabain-induced cardiac arrhythmias in cats:effect of vagotomy and adrenergic neuron blockade[J].Pharmacological Research,1990,22(2):151-160.

[3]CHI M S,HAWKINS K.Effects of dietary sodium intake on blood pressure and urinary excretion of prostaglandins in normotensive and hypertensive subjects[J].Nutrition Research,1998,8(11):1237-1249.

[4]MCKEOWN S C,HALL A,BLUNT R,et al.Identification of novel glycine sulfonamide antagonists for the EP1 receptor[J].Bioorganic & Medicinal Chemistry Letters,2007,17(6):1750 -1754.

[5]HALL A,ATKINSON S,BROWN S H,et al.Discovery of novel,non-acidic 1,5-biaryl pyrrole EP1 receptor antagonists[J].Bioorganic & Medicinal Chemistry Letters,2007,17(5):1200 -1205.

[6]HALL A,ATKINSON S,BROWN S H,et al.Structure- activity relationships of 1,5-biaryl pyrroles as EP1 receptor antagonists[J].Bioorganic& Medicinal Chemistry Letters,2006,16(14):3657 -3662.

[7]LIU Jianling,WANG Fangfang,MA Zhi,et al.Structural determination of three different series of compounds as Hsp90 inhibitors using 3D-QSAR modeling,molecular docking and molecular dynamics methods[J].International Journal of Molecular Sciences,2011,12(2):946-970.

[8]LIU Jianling,ZHANG Hong,XIAO Zhengtao,et al.Combined 3D-QSAR,molecular docking and molecular dynamics study on derivatives of peptide epoxyketone and tyropeptin-boronic acid as inhibitors against the β5 subunit of human 20S proteasome[J].International Journal of Molecular Sciences,2011,12(3):1807 -1835.

[9]WEI Shaopeng,JI Zhiqin,ZHANG Huixiao,et al.Isolation,biological evaluation and 3D -QSAR studies of insecticidal/narcotic sesquiterpene polyol esters[J].J Mol Model,2011,17:681 -693.

[10]WANG Xia,XU Xue,MA Ming,et al.pH-dependent channel gating in connexin26 hemichannels involves conformational changes in N-terminus[J].Biochimica et Biophysica Acta,2012,doi:10.1016/j.bbamem.2011-12-27.

[11]XU Xue,LI Ruibin,MA Ming,et al.Multidrug resistance protein P-glycoprotein does not recognize nanoparticle C60:experiment and modeling[J].Soft Matter,2012,8:2915-2923.

[12]HALL A,BROWN S H,IAIN P,et al.1,5-Biaryl pyrrole derivatives as EP1 receptor antagonists.Structureactivity relationships of 6-substituted and 5,6-disubstituted benzoic acid derivatives[J].Bioorganic & Medicinal Chemistry Letters,2007,17(4):916 -920.

Study on quantitative structure-activity relationship of EP1 receptor antagonists

YAN Yu-lian,LI Yan,YANG Yin-feng,LU Xiao-wei,ZHANG Shu-wei
(School of Chemical Engineering,Dalian University of Technology,116024 Dalian,Liaoning,China)

To develop EP1 receptor antagonists with higher activities,the key factors that affect the activities of EP1 antagonists were explored in this study.103 EP1 antagonists were selected as data sets,and each molecule was calculated based on 254 parameters.Two regression methods of multiple linear regression(MLR)and principal component analysis(PCA)were used.The results show that the quantitative structure-activity relationship models using both the MLR and PCA exhibit good predictive ability.The statistical results by MLR show training set R2=0.77,SEE=0.83,test set R2=0.74,SEP=0.33,and those by PCA show training set R2=0.72,SEE=0.45,test set R2=0.71,SEP=0.38.

EP1 receptor antagonists;quantitative structure-activity relationship;multiple linear regression;principal component analysis

R913

A

0367-6234(2012)04-0121-05

2010-07-09.

国家自然科学基金资助项目(10801025).

闫玉莲(1984—),女,博士研究生.

李 燕,yanli@dlut.edu.cn.

(编辑 刘 彤)

猜你喜欢
受体分子预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
分子的扩散
“精日”分子到底是什么?
米和米中的危险分子
不必预测未来,只需把握现在
Toll样受体在胎膜早破新生儿宫内感染中的临床意义
2,2’,4,4’-四溴联苯醚对视黄醛受体和雌激素受体的影响
臭氧分子如是说