芳香族化合物与硝基自由基速率常数的HQSAR研究*

2022-05-17 07:45晋润萍
云南化工 2022年4期
关键词:硝基全息自由基

晋润萍,焦 龙,马 羚

(西安石油大学 化学化工学院,陕西 西安 710065)

迄今为止,人类活动已导致大量有害芳香族化合物释放到大气中[1-4]。在白天,芳香族化合物主要通过与羟基自由基的反应降解;而在夜间,硝基自由基在与大多数芳香族化合物降解中起主要作用[5-6]。此外,已经发现,在欧洲大陆边界层中,硝基自由基对芳香族化合物的降解高达28%[7-8]。因此,评估芳香族有机污染物和硝基自由基之间的速率常数至关重要。

作为最实质性的有机化合物类型之一,芳香化合物有多种形式,通常用于化学产品[9-10]。硝基自由基与芳香族化合物的反应速率常数(pk(NO3))对于研究芳香族化合物的降解具有重要意义。然而,通过实验测量pk(NO3)无法满足对芳香族化合物和硝基自由基之间反应的评估[11-12]。因此,使用非实验性方法获取有用的pk(NO3)数据变得越来越重要[13-14]。

最近,已经发现了基于实验数据预测未测量化合物速率常数的方法。定量结构性质关系QSAR提供了所研究化合物分子性质和活性的数学关系和理论模拟。虽然可能很难获得所需的实验数据,但一旦QSAR建立,它就可以用来预测一组新化合物的反应速率,从而避免了新实验的潜在巨大努力[15-17]。

分子全息定量构效关系(HQSAR)是一种特殊的QSAR技术,已被许多QSAR研究作为一种简单、快速和高度预测的方法采用[18-19]。与传统的2D-QSAR技术相比,HQSAR的预测精度大大提高。另一方面,HQSAR方法具有与更复杂的3D-QSAR方法相当的预测能力。因此,本篇文章建立了HQSAR模型,这是几种常见芳香族化合物的pk(NO3)的定量连接。

1 方法与实验

1.1 数据集

所研究的28种芳香族化合物的负对数pk(NO3)来自文献[20],并用于构建模型。随机选取28种芳香族化合物中的21种作为训练集的样本建立模型,其余7种芳香族化合物(表1中标有*)作为测试集,评估模型的预测能力。

表1 pk(NO3)的实验值和预测值

(1)

(2)

(3)

(4)

(5)

1.2 分子建模

所有HQSAR建模过程都是在Sybyl-X 2.0软件(美国Certara)中进行的。计算是在i7-5557U/4G-RAM个人计算机上执行的。

1.3 HQSAR建模

HQSAR方法的工作原理是使用分子结构片段作为结构描述符来表达分子的结构信息[25]。HQSAR建模的关键步骤:首先,将训练集中的分子切成不同结构和大小的亚结构片段,并对获得的亚结构片段进行分类。有两种类型的片段:片段区分(FD)和片段大小(FS)。原子(A)、键(B)、连接(C)、氢原子(H)、手性(CH)和供体/受体原子都是可能的FD特性(DA)。FS参数表示分子片段中的原子数,由最小原子数M和最大原子数N定义。中型原子碎片编号为4~7(系统默认值);更大的原子碎片编号为8~10。循环冗余校验(CRC)技术用于计算数据库中每个片段的频率。全息图长度的数据可以通过计算分子全息图来获得。通过计算分子全息图可以获得与化合物数量和全息长度相关的一组数据。全息长度可以手动设置,也可以从六个默认值中选择:97、151、199、257、307 和 353[26-28]。最后,利用偏最小二乘法(PLS)[29]方法建立了硝基自由基和芳香族化合物之间pk(NO3)的QSAR模型。

2 结果与讨论

2.1 片段区分的选择

使用训练集构建和优化HQSAR模型。首先,对FD参数进行优化,利用不同的FD参数和默认FS参数4-7获得一系列HQSAR模型。表2显示了具有不同片段区分的8个最佳模型的关键统计数据。

表2 具有不同片段区分参数的HQSAR模型的统计

其中:SEE为标准误差;PCs为最佳主成分数;HL为最佳分子全息长度。

根据表2中的数据,最佳模型结果是A/B/C/CH/DA的FD参数,交叉验证相关系数Q2=0.986,非交叉验证相关系数R2=0.997。

2.2 片段大小的确定

为了进一步选择最优HQSAR模型,在确定FD参数后,通过调整FS参数区间,计算出8个最佳模型的统计数据。表3列出了HQSAR模型的最佳片段大小为1~4。由表3可知,当片段区分、片段大小、全息图长度和主成分分别设置为“A、B、C、H、CH、DA”、“6~7”、“151”和“5”时,可以建立最佳HQSAR。

表3 不同片段大小参数的HQSAR模型的统计数据

2.3 最佳模型的评估

首先,利用训练集通过LOO-CV方法连续预测21种化合物(结果见表1)。实验值和预测值之间的误差相当小,并且基本一致。计算后,RMSRE=9.67,RMSECV=0.12。实验值与预测值的线性关系方程为y=0.9973x+0.0345(x表示实验值,y表示预测值),相关系数R=0.9986。基于此训练集的HQSAR模型具有良好的预测能力。

图1 pk(NO3)的实验值和预测值之间的相关性

3 结论

采用HQSAR方法研究了28种芳香族化合物的分子全息定量构效关系,LOO-CV和外部试验集验证结果表明,芳香族化合物与硝基自由基之间存在着一定的定量关系,且HQSAR模型具有极好的预测芳香族化合物与硝基自由基反应的能力。

猜你喜欢
硝基全息自由基
全息? 全息投影? 傻傻分不清楚
瘤胃微生物对硝基化合物的代谢转化与脱毒机制研究进展
全息“魔镜”在身边
含四(3,5-二硝基-1,2,4-三唑基)硼酸肼推进剂的能量特性计算
陆克定:掌控污染物寿命的自由基
能延缓衰老的蛋白质
“亲临”火星:全息眼镜助力火星探索
下游需求启动 硝基氯苯市场量价齐升
全息,何以为全息
羟自由基氧化对大豆分离蛋白理化和乳化特性的影响