二苯甲酮类化合物对发光菌毒性的神经网络法研究

2020-07-13 09:25堵锡华
关键词:酮类毒性化合物

堵锡华,田 林,徐 艳,吴 琼,陈 艳

(徐州工程学院 材料与化工学院,江苏 徐州 221018)

二苯甲酮类化合物已在日用化工、医药、染料及其农药等领域得到广泛应用[1-4].由于它对紫外光有很好的吸收能力,故常被用于防晒霜、护肤液等个人护理品(personal care products, 简称PCPs)中,是个人护理品中非常重要的一种化工原料,但如果这些产品中二苯甲酮类物质过度使用,会引起皮肤过敏、湿疹等不良反应,故我国化妆品卫生标准中对防晒剂的种类和用量有严格的限制性规定[5].此外由于二苯甲酮的挥发性强、热损失大,在固化膜中易迁移析出,产生毒性,经过生物迁移累积到人体和生物体,可能导致遗传毒性和内分泌的干扰效应[6].近年来,由于个人护理品和食品包装膜等产品的用量增大,二苯甲酮类化合物被直接或间接排入水环境中,它们已成为一类新型的环境污染物,开始威胁人体健康和生态系统,为此对二苯甲酮类化合物的粉尘或有机紫外防晒剂等的测定[7-8]、合成[9-10]、性质[11-12]及其毒性评价[13-14]研究逐渐受到相关学者的重视.

神经网络方法是一个集数学、计算机、统计学、化学等多学科交叉的研究方法,该法在化学[15]、食品科学[16]、农业科学[17]、药物化学[18]、毒理学[19]、建筑学[20]等相关领域得到广泛应用.笔者在前期[21-23]工作基础上,根据魏东斌等[24]检测的14 种二苯甲酮类化合物对发光菌急性毒性值(EC50),按照梁逸曾等[25-26]相关研究编写的计算应用程序,计算了文献[24]所列14种具有代表性的二苯甲酮类化合物分子的分子连接性指数,并利用MINITAB软件中的最佳变量子集回归方式,筛选了其中的2X,5Xc两种指数作为神经网络的输入层参数,以二苯甲酮类化合物对发光菌急性毒性的EC50作为输出层参数,建构了二苯甲酮类化合物对发光菌急性毒性的神经网络预测模型,该模型具有高度相关性,所得预测值与文献值吻合度也达到了令人满意的结果,研究工作对环境中个人护理品含有的二苯甲酮类化合物残留的生物毒性及其生态风险评估具有实际意义,可为防晒剂的绿色生产、合理使用和科学管理提供指导.

1 数据处理

分子连接性指数是Kier等[27]改进了Randic提出的分枝指数而提出的一种根据分子的空间和电性结构信息的结构参数.这里应用Chemoffice2005软件勾画了文献[24]列出的14种二苯甲酮类化合物的分子结构,利用MATLAB软件自编应用程序,调用14种二苯甲酮类化合物的分子结构,计算其分子连接性指数,再采用MINITAB14.0统计分析应用软件中的最佳变量子集回归方式,统计分析二苯甲酮类化合物分子结构与其对发光菌急性毒性之间的相关关系,筛选了分子连接性指数中与急性毒性相关性最优的2个变量2X,5Xc,分析结果见表1.

表1 pEC50与连接性指数mX的最佳变量子集回归结果

(1)

其中:n为二苯甲酮类化合物的样本总数,b为多元回归分析模型的变量数,r2为回归分析模型的决定系数.根据式(1)计算所得FIT值越大,说明模型越稳定.由于样本数相对较少,按照样本数/变量数必须≥5的要求,这里只能取2个变量,故选择模型2,将14个二苯甲酮类化合物分子及其分子连接性指数的2X,5Xc值列于表2中.

注:带*号的分子为设计的新分子.

2 模型的构建

2.1 多元回归预测模型

将文献[24]中列出的14种二苯甲酮类化合物对发光菌急性毒性与优化筛选的2种分子连接性指数2X和5Xc进行回归分析,得到的多元回归方程为

pEC50=2.3652X-9.1525Xc+1.818,

(2)

利用式(2)对发光菌急性毒性值进行预测,所得预测值与文献实验值[24]之间有较大的误差,两者的相对平均误差为13.87%,说明利用多元回归方法预测毒性并不理想.

2.2 神经网络预测模型

针对上述多元回归方法预测结果不理想的问题,为提高预测二苯甲酮类化合物对发光菌急性毒性的准确性,需进一步采用神经网络方法进行研究,故先检验多元回归模型的稳定性,采用逐一剔除法进行检验,即每次剔除1个分子后进行建模,得到相应相关系数,这样共有14个相关系数,见表3.由表3可以看出,14个相关系数值较为接近,平均值为0.874 8,与式(2)相吻合.

表3 Jackknifed相关系数的检验

将式(2)模型中使用的两个变量2X和5Xc作为神经网络法中的输入层节点,14种二苯甲酮类化合物对发光菌的急性毒性作为输出层节点,并按照许禄等[29]的建议规则,要求符合1.4≤n/M<2.2,n为样本的个数,M为网络总权重,M的计算式为

M=(Si+1)H+(H+1)So,

(3)

其中:Si,H,So为神经网络3层结构中的输入层节点数、隐含层数及输出层节点数.这里采用了2个连接性指数作为输入层节点,故Si=2; 二苯甲酮类化合物对发光菌的急性毒性作为输出层节点,即So=1; 根据式(3)计算得到H为2,故这里神经网络结构采用2-2-1的结构方式.

为防止建模过程中的过拟合现象,将14个二苯甲酮类化合物分子分为3组:第1组为训练集组(以每5个分子为1组,取其中第1,3,5个分子)、第2组为测试集组(每5个分子组中的第2个分子)、第3组为验证集组(每5个分子组中的第4个分子),用MATLAB软件中神经网络计算软件进行计算分析,得到了预测二苯甲酮类化合物对发光菌急性毒性模型的总相关系数rt=0.998 3,3个集组的相关系数分别为:训练集组的相关系数r1=0.999 1、测试集组的相关系数r2=0.999 9、验证集组的相关系数r3=0.999 7,这里可以看出,模型总相关系数相比多元回归方法得到了明显提升,达到了0.99以上的优级相关性,而且3个集组的相关系数与模型总相关系数较为接近,说明模型的稳定性相对较好,利用该QSAR神经网络模型来预测二苯甲酮类化合物对发光菌急性毒性,计算得到的预测值与文献值吻合度较为理想,两者的相对平均误差仅为1.60%,明显优于多元回归方法的预测精度,说明神经网络法模型的预测能力优于多元回归分析法.将急性毒性的预测值与文献值同样列于表2中,将多元回归法、神经网络法的预测值与文献值的关系分别作雷达图(见图1,2),并将神经网络模型的权重和偏置列于表4.

图1 多元回归法雷达图

图2 神经网络法雷达图

表4 神经网络模型的权重和偏置

3 结果讨论与分子设计

通过计算14个二苯甲酮类化合物的分子连接性指数,筛选了其中的2种指数与该化合物分子对发光菌急性毒性的相关性分析,建立了二苯甲酮类化合物对发光菌急性毒性预测的神经网络法模型,该毒性预测模型的总相关系数能达到0.998 3优级相关,预测得到的毒性值与文献[24]所得的值吻合度较高,相对平均误差为1.60%.从表2可以看出,二苯甲酮类化合物分子的毒性大小,既与化合物分子本身的大小有关,还与连接的基团种类、基团性质、连接的位置、连接基团的数量多少有关,它们均能影响其毒性大小.如连接的羟基数越多毒性越大,且连接在2,3,4位,毒性会逐渐增大;如连接烷氧基、磺酸基等基团,则能使毒性减小.为此,笔者根据这一特性,设计了新的7个二苯甲酮化合物分子(见表2中15*-21*号分子),利用建构的神经网络预测毒性模型所得预测值与分子结构参数之间的关系,得到了这7个分子的毒性预测值,这些毒性预测值也列于表2中,这里可以看出,这些分子中,即使毒性最大的2-羟基-3-磺酸基-5-甲氧基-二苯甲酮(pEC50为0.565),其毒性值也明显小于文献[24]所列的14个二苯甲酮化合物的急性毒性,这里毒性最小的是2′-羟基-3-甲基-4-甲氧基-5-磺酸基-二苯甲酮(pEC50为0.111),可能与其吸电子的磺酸基对相近的甲基、甲氧基的影响较大有关,当然这里预测的毒性值还需要通过实验来进行确证,但模型的建构对设计毒性低的新的化合物分子可起到重要的理论指导作用.

4 结束语

(1) 通过MINITAB应用程序优化筛选了2个分子连接性指数作为结构描述子,与二苯甲酮类化合物对发光菌急性毒性具有高度的非线性相关性,建构的预测模型相关系数达到了0.998 3的高度相关,建立的神经网络毒性预测模型明显优于多元回归法模型,利用神经网络模型预测得到的毒性值误差明显低于多元回归分析法,相对平均误差只有1.60%,充分说明二苯甲酮类化合物的连接性指数(mX)与生物急性毒性(EC50)之间具有良好的非线性关系.利用该神经网络模型,可以设计毒性低的新的二苯甲酮类化合物分子.

(2) 神经网络模型具有较好的预测能力.优化筛选的分子连接性指数2X和5Xc能充分反映二苯甲酮类化合物的分子空间结构以及电性结构之间相关信息,它们能在一定程度上反映该类化合物对生物急性毒性大小变化的规律.

(3) 二苯甲酮类化合物分子苯环上连接的基团种类和数量、连接的位置对毒性影响较大.连接的羟基越多毒性越大,连接烷氧基和磺酸基则能使毒性变小.

猜你喜欢
酮类毒性化合物
“60%敌畏马乳油”农药对家蚕残毒性调查
广州市环境空气中醛酮类化合物的污染特征研究
《纺织染整助剂产品中异噻唑啉酮类化合物的测定》等2项纺织染整助剂行业标准发布
除草剂敌草快对克氏原螯虾(Procambarus Clarkii)的毒性研究
大气中醛酮类污染现状研究
应激宁小鼠急性毒性试验及亚慢性毒性试验
甲基苯丙胺神经毒性作用及机制的研究进展
高脂肪低碳水化合物有助对抗流感
例析高考中的铁及其化合物
例谈氯及其化合物的学习与考查