堵锡华,陈艳,宋明,田林,徐艳
徐州工程学院材料与化学工程学院,徐州 221018
肉桂酸是从肉桂皮分离出的一种天然有机酸,有微量的桂皮气味,安全无毒[1],它不但具有抗肿瘤、抗炎及抗氧化作用[2-3],还具有良好的抑菌和保鲜作用,故常被用作食品添加剂[4-5],由于它具有抑制过氧化物酶的生物活性并诱导类脂的过氧化作用[6],能抑制形成黑色酪氨酸酶、可隔绝紫外线,故又常用于高级防晒霜的生产;此外它还用于香精香料、医药、农药以及有机合成等工业生产行业[7-8]。卤代肉桂酸则是基于肉桂酸得到一种卤代芳烃化合物,由于具有类似的特性,故也广泛应用于医药、化妆品和农药等生产行业[9],随着近年来该化合物使用量的增加,对环境造成的影响也越来越为严重。
藻类是水生生态系统的初级生物,它维持着水生生态系统结构和功能的稳定[10],羊角月牙藻是淡水水体中常见的一种藻类,因其细胞特征明显而且易于培养[11],对污染胁迫敏感性很强,故常常用作水生生态毒理研究的一种重要的指示生物[12]。
定量结构-活性关系(quantitative structure-activity relationship, QSAR)研究最初是应用于药物设计中的一种方法[13-14],近年来该法在化学[15]、环境科学[16]和毒理学[17]等领域得到推广应用。由于目前对卤代肉桂酸的相关研究并不多见,特别是利用神经网络方法对卤代肉桂酸相关急性毒性的QSAR研究未见有报道,故笔者在前期研究[18-19]基础上,根据文献[9]检测分析卤代肉桂酸对羊角月牙藻急性毒性半数效应浓度(EC50)值,利用计算应用程序软件,计算了14种卤代肉桂酸化合物分子的4类分子结构参数,并筛选了其中2种参数,构建了用于预测卤代肉桂酸对羊角月牙藻急性毒性的神经网络模型,本研究对评估卤代肉桂酸残留的生物毒性及其生态风险具有指导意义。
李敏等[9]选择了14种卤代肉桂酸,测定了这些化合物对羊角月牙藻急性毒性的72 h-EC50值,卤代肉桂酸(序号1~14)的分子结构及其对羊角月牙藻的EC50实验值列于表1中。
表1 卤代肉桂酸的分子结构参数及其毒性Table 1 Molecular structure parameter and toxicity of halogenated cinnamic acid
根据表1中所列的序号为1~14共14种卤代肉桂酸的分子结构,应用Chemoffice2005画图软件勾画这些分子的3D分子结构图,利用MATLAB自编程序[20]相关软件,计算了分子连接性指数、分子形状指数、电性拓扑状态指数和电性距离矢量4类分子结构参数,按照分子样本总数/变量数需>5这一规则[21],经过反复分析试验,发现只有选用电性拓扑状态指数(E13)和电性距离矢量(M15)这2个结构参数时,所得回归分析结果相对最好,故这里选用E13和M15作为建立模型的自变量,相关数据也列于表1中。
将选择的E13和M15这2个结构参数作为自变量,将卤代肉桂酸对羊角月牙藻的急性毒性值(72 h-EC50)作为因变量,进行多元回归分析,得到对羊角月牙藻毒性预测的多元回归方程为:
EC50=1267.772E13-32.493M15-9962.357
(1)
神经网络方法是集计算机技术、统计学方法和化学技术等多学科交叉又较为前沿的一种研究方法,它能模拟生物神经网络行为特征,进行分布式并行信息处理,具有强大的非线性映射能力,该法在众多学科领域得到了广泛的应用[22-26]。由于前述多元线性回归法预测结果并不理想,这里进一步采用神经网络非线性方法对卤代肉桂酸对羊角月牙藻毒性进行研究。将式(1)多元回归模型中的E13和M15作为神经网络法中的输入层参数,14种卤代肉桂酸化合物对羊角月牙藻急性毒性作为输出层参数,综合许禄[27]和Andrea等[28]建议规则,得出下式:
2.2>n/[(Si+2)Y+1]≥1.4
(2)
式中:n、Si和Y分别为样本总数、神经网络输入层参数和隐含层参数。根据该式计算得到Y应取2,为此神经网络结构采用2-2-1的结构方式。为防止建模过程中有过拟合现象,将14个卤代肉桂酸分子随机分为3组:取每5个分子的第1、3、5个分子作为训练集、第2个分子作为测试集、第4个分子作为验证集,将本法建立的神经网络模型计算得到的EC50预测值也列入表1中,神经网络模型的权重与偏置相关数据列于表2中。
表2 BP-ANN模型的权重和偏置Table 2 Weights and bias of BP-ANN model
通过计算14个卤代肉桂酸的4类分子结构参数,筛选了其中E13和M15这2种指数,与这些化合物分子对羊角月牙藻急性毒性进行相关性分析,建立的多元回归模型的相关系数为0.911,根据该模型得到的预测值与实验值的相对平均误差为7.16%,而在此基础上建立预测毒性的神经网络法模型,模型的总相关系数R总=0.951,训练集R训练=0.956、测试集R测试=0.996、验证集R验证=0.999,从这些相关系数可以看出,神经网络非线性模型的相关系数明显得到提高,利用该模型预测卤代肉桂酸对羊角月牙藻急性毒性,预测值与文献实验值的吻合度较为理想(图1),两者的相对平均误差为4.49%,对相对误差作控制图(图2)可以看出,所有相对误差均在可控范围之内,说明预测结果较为可靠,分子结构参数与毒性值之间存在较好的非线性关系,而不是线性关系。对神经网络法与多元回归法所得预测误差进行比较可以看出,神经网络法的预测误差值明显小于多元回归法的预测误差值。
图1 EC50的实验值(Exp.)与预测值(Pre.)关系Fig. 1 Relationship between experimental (Exp.) and predicted (Pre.) values of EC50
图2 相对误差的控制图注:UCL为控制上限,LCL为控制下限。Fig. 2 Control chart of relative errorNote: UCL stands for upper control limit; LCL stands for lower control limit.
根据建构的神经网络模型,对另外12种可能结构的卤代肉桂酸化合物分子(表1中打*的15~26号分子)的EC50进行了预测,所得预测结果也列于表1中。根据表1中1~14号卤代肉桂酸的分子结构与EC50实验值的关系可以看出,肉桂酸苯环上连接半径越大、电负性越小的卤素原子,其毒性越大,如F的电负性>Cl的电负性>Br的电负性,而半径大小相反,故连接Br的毒性>Cl>F;如基团相同,则连接在2位的毒性<3位<4位。对照预测的15~26号分子所得毒性值,基本符合该变化规律,说明本法建构的模型具有一定的合理性和应用型,当然这还需要通过实验来进行确证,故本模型的建构,可以在理论上指导设计低毒性、高活性的类似化合物分子。
综上所述,本研究表明:
(1)优化筛选电性拓扑状态指数和电性距离矢量作为分子结构描述子,与卤代肉桂酸对羊角月牙藻急性毒性具有较好的非线性关系,建构的毒性预测神经网络模型相关系数达0.951,预测结果明显优于多元回归法,说明卤代肉桂酸的分子结构参数与其对羊角月牙藻急性毒性(EC50)之间具有好的非线性关系,而不是线性关系。
(2)卤代肉桂酸对羊角月牙藻急性毒性的大小,与其苯环上连接的卤素基团的原子半径、电负性大小及基团连接的位置有较大的相关性。