康士鹏,赵凯元,陈 万,秦正龙
(江苏师范大学化学化工学院,江苏徐州221116)
氟化酚类化合物急性毒性的定量构效关系研究*
康士鹏,赵凯元,陈万,秦正龙*
(江苏师范大学化学化工学院,江苏徐州221116)
摘要:应用分子形状指数(mK)、电拓扑状态指数(Ek)构建氟化酚类化合物定量结构-急性毒性关系模型,其多元相关系数为0.986,并用Jackknife法进行稳健性检验,相关系数在0.983~0.992之间,具有良好的稳健性和预测能力,计算值与实验值颇为吻合,结果优于文献方法。
关键词:氟化酚类化合物;分子形状指数;电性拓扑状态指数;急性毒性;定量结构-活性关系
氟化酚类化合物在许多化工产品的生产过程中被广泛使用,由此造成的环境危害日益严重。由于化学工业的不断发展,每年都有上万种化合物排入环境,而测定化合物的活性需要大量的财力和时间,因此,对化合物进行定量结构-活性关系研究显得尤为重要[1,2]。有了构效关系模型,就可以较为方便地对其活性进行计算,为环评提供依据[3,4]。本文用分子形状指数(mK)[5 ]、电拓扑状态指数(Ek)[6 ]对氟化酚类化合物的分子结构进行表征,并与其对梨形四膜虫的急性毒性(- lgIC50)进行回归分析,所建模型的相关系数为0.986,明显优文献方法[7 ],计算值和实验值都很接近,结果令人满意。
1.1材料
Chemoffice 2005、SPSS 13.0、分子拓扑指数计算软件;氟化酚类化合物对梨形四膜虫半数生长抑制浓度(IGC50)的毒性数据[8 ],其数值越小,说明毒性越大。
1.2分子结构表征
1.2.1分子形状指数(mK)即使两个分子的表面积、体积等参数相同,它们的形状、结构不一定相同。据此,Kier提出了Kappa分子形状指数(mK):
式中m:Kappa分子形状指数的阶;nj:分子j中非氢原子的个数;pj:分子j中路径是m的数目。为了拓展分子形状指数的应用,对(1)式进行校正,引入参数αi:
式中r:sp3杂化碳原子的原子半径;ri是非sp3杂化碳原子和其他原子的原子半径。(1)式中引入αi后即为:
其中,αj=∑αi。
1.2.2电拓扑状态指数(Ek)电性拓扑状态指数(Ek)是对化合物分子中各个处在不同环境和成键电子信息的杂原子进行计算而得到的数学不变量。Ek分为两部分:一部分是由各个杂原子类型k的结构和化学环境构成的特征值,记作“Hk”;另一部分是由于受到其他杂原子的干扰作用而产生的特征值增量,记作“ΔHk”。原子类型k的电拓扑状态指数Ek定义为:
式中j:原子类型k的数目。
1.3方法
用ChemDraw Ultra 9.0画出16种氟化酚类化合物的分子结构,以摩尔格式保存,在Matlab7.1.0中用分子拓扑指数计算软件[9]得到上面两类拓扑指数(见表1,篇幅所限只列了6种)。将两类拓扑指数作为自变量,对应的- lgIC50作为因变量,用最佳变量子集方法选择最好的变量组合,建立QSAR计算模型,其预测能力及鲁棒性用逐一剔除法进行检验。
2.1QSAR模型的构建
在95%的置信区间内,应用SPSS 13.0软件将16种氟化酚类化合物对梨形四膜虫急性毒性(- lgIC50)数据及对应的拓扑指数进行回归分析,由最佳变量子集回归得到的预测模型见表2,R、R2,,S,F依次为相关系数、判定系数、校正判定系数、估计标准误差及Fischer检验值。
表1 氟化酚类化合物的急性毒性数据及mK、EkTab.1 The parametersmK,Ekand toxicity data of fluorinated phenol compound
表2 mK、Ek和-lgIC50的最佳变量子集回归结果Tab.2 The results ofmK、Ekand -lgIC50with Leapsand-Bounds regression
由表2可知,随着模型中变量数的增加,相关系数R的数值越大。但是,5参数以后R的数值不再变化。另外,模型的样本数目与变量数目之比不能太小。综合考虑,最佳QSAR模型为:
由(2)式给出的计算值与实验值吻合较好(见表1)。
2.2QSAR模型的质量检验
置信度95%时Fisher检验的临界值F0.05 (5,10)是3.330,如果所建QSAR模型的F0.05 (5,10)比3.330大,则- lgIC50与mK、Ek之间的相关关系显著。模型(2)的Fisher检验值是69.876,比3.330大得多,说明- lgIC50与mK、Ek之间的关系有95%的可信度。模型(2)的判定系数为0.972,已经揭示了氟化酚类化合物对梨形四膜虫急性毒性(- lgIC50)97.2%的本质因素。采用Jackknife法对模型(2)的稳健性进行检验。每次剔除一个化合物,用余下的化合物建模,依据相关系数的雷达图对模型的稳健性进行评价。如图1,以0.978为圆心,0.002为间距,16个Jackknife的相关系数(R)在原始模型(2)的相关系数(R=0.986)上下波动,而且全部落在0.983~0.992之间。另外,所有计算值与实验值的差值都小于3S。这些都表明,模型(2)具有良好的稳健性和预测能力。
图1 Jackknife的相关系数(R)雷达图Fig.1 Radar graph of Jackknife correlation coefficient(R)
2.3QSAR模型中变量的自相关性检验
方程可靠性的依据是模型中各个参数之间是否共线性。共线性检验一般用变异膨胀因子[10](VIF)、自相关矩阵来检验。VIF=1,变量之间不相关;1<VIF<5,变量之间相关性不显著;VIF>5,变量之间相关性显著。容忍度T0也可对共线性进行检验,T0全部大于0.1,说明中各个参数之间的共线性显著。本文所建模型的自相关矩阵、T0、VIF见表3。显然。模型(2)中的每个参数间自相关性不明显。
表3 模型中参数的自相关矩阵与T0、VIFTab.3 T0,VIF and self-correlation coefficient matrix of the descriptors in the model
2.4与文献方法的比较
将本方法与文献方法[7 ]进行比较,两个方程都是5参数,它们的F、R、S、平均误差(Ea)、最大误差(Em)见表4。可见,本文结果明显比文献好。
表4 两种方法比较Tab.4 Comparisons of results obtained by the two methods
分子形状指数(mK)、电拓扑状态指数(Ek)比较客观、全面地反映了氟化酚类化合物的分子结构特征,应用最佳子集回归构建的5参数QSAR预则模型,相关性高,稳健性好,预测能力强,为同类型氟化酚类化合物生物活性的预测提供了一种新方法。
参考文献
[1]闫秀芬,肖鹤呜,居学海,等.硝基芳烃对梨形四膜虫毒性的QSAR研究[J].化学学报,2006,64(5):375- 380.
[2]秦正龙,吴俊明.芳烃化合物生物活性及理化性质的定量构效关系[J].化学工程师,2003,(5):1- 2.
[3]薛慧峰,张生万,李美萍.分子电距矢量用于乙酰苯胺类化合物QSAR研究[J].化学工程师,2008,(5):6- 8.
[4]刘新会,骆文茹,王连生.用电性拓扑态预测苯砜基乙酸酯对发光菌的毒性效应[J].中国环境科学,2004,24(4):442- 446.
[5]许禄,胡昌玉.应用化学图论[M].北京:科学出版社,2000,247.
[6]Hall LH, Kier LB. Electrotopological state indices for atomtypes: a novel combination ofelectronic, topological, and valence state information[J].JournalChemicalInformationandComputerSciences,1995, 35(6):1039- 1045.
[7]谢永红,廖立敏.氟化酚类化合物结构与生物毒性关系研究[J].河南师范大学学报(自然科学版),2012,40(2):112- 114.
[8]Cronin M T D, Aptula A O, Duffy J C, et al. Comparative Assessment of Methods to Develop QSARs for the Prediction of the Toxicity of Phenols to Tetrapymena Pyriformis[J].Chemosphere, 2002,49: 1201- 1221.
[9]张婷,梁逸曾,赵晨曦,等.基于分子结构预测气相色谱程序升温保留指数[J].分析化,2006,34(11):1607- 1610.
[10]李吉来,杭烨超,耿彩云,等.苯砜基羧酸酯类急性毒性的QSAR研究[J].高等学校化学学报, 2007, 28(1):117- 120.
Quantitative structure-activity relationship studies of fluorinated phenol compound*
KANG Shi-peng,ZHAO Kai-yuan,CHEN Wan,QIN Zheng-long*
(School of Chemistry & Chemical Engineering, Jiangsu Normal University, Xuzhou 221116, China)
Abstract:Based on the molecular shape index(mK)and atom-type electrotopological state index(Ek),a quantitative structure-activity relationship betweenmK, Ekand acute toxicity of fluorinated phenol compound to Tetrahymena Pyriformis is developed. The correlation coefficient(R)of the model is 0.986.The robustness of the regression model was validated by Jackknife method, and the results showed that the R was between 0.983 and 0.992. The present study demonstrates that the model is highly reliable and has favorable predictive ability. The calculated values are in good agreement with experimental data, and the estimated results are all better than the relevant achievements of literatures.
Key words:fluorinated phenol compound;molecular shape index;atom-type electrotopological state index;acute toxicity;quantitative structure-activity relationship
通讯作者:秦正龙,男,教授。
作者简介:康士鹏(1993-),男,甘肃兰州市人,本科生,主要从事污染物的构效关系研究。
基金项目:江苏省高校品牌专业建设工程资助项目
收稿日期:2015- 10- 26
中图分类号:O641
文献标识码:A
DOI:10.16247/j.cnki.23-1171/tq. 20160164