唐自强,冯长君
1. 徐州工程学院化学化工学院,徐州 221018 2. 徐州技师学院,徐州 221151
取代苯酚类化合物是有机工业中重要的一类物质,但大多都有毒性。其中邻氯苯酚等4种酚类化合物被美国环境保护局列为优先控制的有机污染物,7种取代苯酚化合物被确定为中国优先控制的有机污染物[1]。因此,取代苯酚类化合物的生物毒性预测引起人们的关注。研究表明,定量结构-活性关系(quantitative structure-activity relationship, QSAR)[2-11]在预测化合物生物毒性方面已成为化学、环境等学科的一个重要领域。徐文国等[12]采用量化方法研究氯代苯酚类化合物对发光菌毒性;刘够生等[13]采用量化及连接性指数方法研究氯代苯酚类化合物对发光菌毒性;罗一帆和许旋[14]以量化方法研究氯代苯酚类化合物对鱼类毒性;廖立敏等[15]以新的结构描述符关联氯代苯酚类化合物对海洋中的杜氏盐藻(Dunaliella salina)的抑制活性;Serge等[16]以量化方法研究了有机化学品对绿藻的生物毒性。上述研究都取得良好结果,但都局限于2D-QSAR研究。本文以3D-QSAR方法[17-20]研究氯代苯酚类化合物对海洋中的杜氏盐藻的抑制活性(pI)[15],以揭示影响抑制活性的微观结构因素,探讨其发挥生物毒性作用的分子机理。
20个氯代苯酚类化合物对海洋中的杜氏盐藻(96 h)的半数抑制浓度以“IC50”表示。考虑化学平衡常数与平衡浓度为对数关系,故令:
pI =-lg(IC50)
(1)
pI值来源于文献[15]。氯代苯酚类分子的具体结构及pI数据见表1。
本文3D-QSAR分析及建立CoMFA模型均使用Tripos公司最新版本Sybylx2.1.1分子模拟软件完成,使用的模块包括SYBYL、Sketch、Minimize、Database-alignment以及CoMFA的QSAR方法等,各项参数除特别指明外均采用缺省值。
表1 氯代苯酚类分子的结构与抑藻活性(pI)Table 1 The structures and inhibitory effect on algae activity (pI) of chlorinated phenolic compounds
注:*表示测试集。
Note: * indicates test set.
分子活性构象的确定是建立有效3D-QSAR模型的首要前提之一。通常采用分子的最低能量构象代替药效活性构象。使用Sybylx2.1.1软件中的Sketch molecule模块先构建20个氯代苯酚类分子的初始三维结构,再通过Minimize模块,选取Tripos力场,加Gasteiger-Huckel电荷,将最大迭代次数(Max. Iterations)定为1 000,将Gradient降低到0.005;最后将Powell能量梯度法的收敛梯度设为0.21 kJ·mol-1·nm-1。以此完成所有氯代苯酚类分子的分子力学优化,并以此最低能量构象作为分子叠合的生物活性构象。
随机选取分子6、9、13、19和20为测试集(Test set),其中20号为模板分子,为表1中带“*”的分子;余下16个分子作为训练集(Training set),亦含20号模板分子。在CoMFA研究中,所谓模板分子是指总体上生物活性最强的分子。常用的是基于公共骨架的叠合方法,即保证所有分子取向的一致性,使分子间相互重叠时的均方根偏差最小。本文以五氯苯酚分子中的公共骨架,运用Align database模块分别对训练集、测试集进行叠合。训练集的叠合图如下(测试集的叠合图与图1相同,故予以省略)。
用训练集的叠合数据库建立CoMFA模型。采用Tripos标准力场,对叠合分子周围每个网格点上的立体场(steric, St)及静电场(electrostatic, El)予以计算,场能阈值(Cut off值)设为125.5 kJ·mol-1,其余各项参数均为系统默认值。在进行偏最小二乘法(partial least squares, PLS)进行分析时,首先采用逐一剔除法(leave-one-out, LOO)予以交叉验证,以获交叉验证系数(Q2)和最佳主成分数(N)。即以统计指标Q2衡量模型的预测能力,Q2>0.5的模型,才具有95%的可信度[21],所含机会相关的可能性小于5%。另外,将模型中的化合物数(m)与变量数(N)之比称为“样变比”,以“Sv”表示。Sv定义式为:
Sv = m/N
(2)
只有满足Sv≥5的模型,才可能具有统计意义、稳健性及较低或然性[22]。样变比通过非交叉验证进行回归分析,得到非交叉验证判定系数(R2)、统计方差比(F)。最后采用View CoMFA模块,以三维等势图直观反映立体场和静电场对化合物pI的贡献,至此完成3D-QSAR模型。
训练集的CoMFA模型如下所述。(1) 交叉验证部分:Q2=0.915>0.5,以及最佳主成分数N=2,Sv = m/N=8>5,这表明模型具有很好的预测能力与稳健性。(2) 非交叉验证部分:R2=0.963>0.8,显示良好拟合性;在95%显著水平下,训练集CoMFA模型的F临界值为F0.05(2,13)=3.88。该模型的F=169.137,远大于3.88,表明模型的因变量与自变量密切相关,具有统计学稳定性。利用训练集的3D-QSAR模型对测试集中分子的pI进行预测,以检验其预测能力。测试集的pI预测值见表1,与相应实验值基本吻合,表明模型确实具有良好的预测能力。另外,将表1中的实验值与预测值关联:
pIexp= 1.003pIcal- 0.006
(3)
该模型的R2=0.958,与训练集的R2=0.963非常接近,表明训练集CoMFA模型的稳健性与良好的预测能力。
图2给出了以训练集中抑藻活性最高的分子20为模板的CoMFA模型的三维等势图,分子周围不同颜色的块状图表示氯酚类化合物的分子中取代基的立体场和静电场对抑藻活性的影响。图2(a)为取代基的立体作用分布图,其中绿色表示在该区域增大取代基体积有利于提高化合物的抑藻活性,黄色区域表示减小立体位阻可提高抑藻活性。值得注意的是,仅有一小块黄色区域在苯环的3、4位之间,且被绿色包裹;可以忽略其对抑藻活性的影响。由立体场的空间分布可知,在苯环的3、4和5的3个位置上引入体积较大基团,有助于氯酚类化合物抑藻活性的提高。如在6个三氯取代苯酚的同分异构体中,16号化合物(3,4,5-三氯苯酚)的抑藻活性最大,pI = 2.15。又如在3个四氯取代苯酚的同分异构体中,17号化合物(2,3,4,5-四氯苯酚)的抑藻活性最大,pI = 2.41。因为这2个分子的3、4和5的3个位置上均有体积较大基团氯原子存在。
图2(b)为化合物周围的静电场分布,蓝色表示在该区域增大基团正电性有利于化合物活性的提高,然仅有一小块蓝色区域在苯环的1、2位之间,故可以忽略其对抑藻活性的影响。红色区域表示引入带负电荷的基团对化合物活性有利。由静电场的空间分布可知,在整个苯环的3、4和5的3个位置上都被大片红色区域覆盖,说明在这些位置上引入负电性基团,有助于提高氯酚类化合物的抑藻活性。因此,在三氯酚中,16号化合物的抑藻活性最大。而在四氯酚中,17号化合物的抑藻活性最大。因为这2个分子的3、4和5的3个位置上均有负电基团氯原子存在。
图1 训练集的叠合图Fig. 1 3D view of all the aligned molecules in training set
图2 比较分子力场分析(CoMFA)模型的等势图注:(a)立体场,(b)静电场。Fig. 2 The comparative molecular field analysis (CoMFA) contour mapsNote: (a) steric field; (b) electrostatic field.
训练集的3D-QSAR模型给出的立体场和静电场对pIi的贡献分别为48.4%和51.6%,显示立体作用稍弱于静电作用。立体场一般对应空间位阻及疏水作用,静电场主要为氢键及配位作用。文献[15]报道:含氯苯酚类化合物对杜氏盐藻产生毒性可能分为两步,一是化合物穿过细胞膜进入生物体内,此与化合物的疏水性正相关;二是化合物进入细胞内作为电子给与体或氢键受体而与生物体内的靶标发生作用。因此,苯环上的取代基Cl越多,其疏水性越强,相应毒性越大。但对三氯、四氯酚的同分异构体,之所以16、17号毒性最强,是因为其他同分异构体包含空间位阻,导致毒性降低。进入细胞后,酚羟基与靶标形成氢键,3、4和5位上的负电基团氯原子与靶标的配位及弱氢键作用,使化合物发挥更强的致毒作用。由此可见,本文研究结果与文献[15]结论较为一致。与文献[15]比较,本文具有2点创新:一是化合物透过细胞膜的能力不仅与分子疏水性有关,还与氯原子所处位置即空间位阻有关;二是进入细胞后的致毒作用,除了酚羟基与靶标形成氢键外,还与3、4和5位上的负电基团氯原子与靶标的配位及弱氢键密切相关。
综上所述:(1)采用CoMFA方法研究氯代苯酚类化合物对杜氏盐藻抑藻活性的三维定量构效关系,获得合理、可信及良好预测性的3D-QSAR模型:N = 2,Sv=8,Q2= 0.915,R2= 0.963,F=169.137。
(2)所建CoMFA模型三维等势图较好地解释了训练集分子抑藻活性的差异,主要表现在苯环的3、4和5位上键合体积较大的负电基团氯原子,利于抑藻活性增强。