孙磉礅 米思奇 游 靖 余吉良 胡松青,* 刘新泳
(1胜利油田采油工艺研究院,山东东营257000;2中国石油大学(华东)理学院,山东青岛266580;3华北油田采油工程研究院,河北任丘062500;4山东大学药学院,济南250012)
在油气田开采及增产过程中,经常需要对油气井进行酸化及酸洗,1,2但酸液对开采设备及传输管道的腐蚀异常严重.3-5向环境介质中合理添加缓蚀剂是防止金属及其合金发生腐蚀的最有效的方法之一.6-8然而传统的缓蚀剂研制方法大多建立在猜测和大量探索性实验的基础上,工作周期长,并且存在极大的盲目性和随机性.因此,设计开发针对特定环境的新型高效缓蚀剂迫切需要可靠的理论指导.近年来随着计算机技术的迅猛发展,定量构效关系(QSAR)9方法已成为药物及农药分子设计、环境化学、环境毒理学、化学品风险评价等领域不可或缺的工具,并为油气田缓蚀剂的分子设计提供了新的思路.根据QSAR模型,可对未知化合物进行预测、评价和筛选,大大减少实验工作量,缩短工作周期,减少工作盲目性.
迄今为止,QSAR方法针对缓蚀剂的研究还处于初级阶段,前人的研究主要围绕各种物理化学参量与缓蚀效率之间的定量关系,建立简单的二维定量构效关系(2D-QSAR)10的回归模型,11-16并未实现缓蚀剂在分子层次的合理化定向设计.前期本课题组应用三维定量构效关系(3D-QSAR)17方法对缓蚀剂分子进行定量构效关系研究,由最优模型得到反映分子修饰信息的三维等势图,并以此为基础设计了14种理论性能较好的新型缓蚀剂分子,18这表明将药物分子设计理念应用到缓蚀剂分子设计领域是切实可行的.在各类QSAR方法中,全息定量构效关系(HQSAR)19方法由计算程序自动生成分子全息描述子,并建立预测模型,既避免了2D-QSAR中繁杂的物理化学参数计算过程和各种参数之间的多重共线性问题,又避免了3D-QSAR方法中活性构象和叠合规则难以确定等困难.而在由不同QSAR模型所得到的针对分子设计的指导性意见方面,2D-QSAR方法只能给出不同的物理化学参量对分子活性的影响,在进行新分子设计时,无法定性地考虑哪些分子具有相应的物理化学特性,且计算量巨大,分子设计盲目性较强;相比较而言,3D-QSAR方法虽然能够以等势图形式直观地表现出哪些区域需要具有哪些性质的基团,但其等势图的块状区域通常过大,无法精确定位所需修改基团的位置,且在选择取代基团种类时也具有一定的随机性;而HQSAR方法得到的活性贡献图,能够明确显示哪些位置上的哪些基团或原子对分子活性有利,哪些基团或原子对分子活性不利,在设计分子方面能够精确定位并找出合适的取代基团,因此,HQSAR方法是一种具有较高预测能力的QSAR新技术,在指导分子设计方面具有不可取代的优势.该方法简单、快速,已成功地应用到不同类型化合物的研究中,20-24但是有关缓蚀剂的HQSAR研究工作国内外均未见公开报道.将HQSAR方法引入缓蚀剂分子设计领域,对实现缓蚀剂的定向化设计具有重要的理论指导意义.
苯并咪唑类化合物是已知的一种针对碳钢在酸性环境中腐蚀的优良缓蚀剂.25-28本文以苯并咪唑类缓蚀剂为研究对象,采用HQSAR方法对其分子结构与缓蚀性能的定量关系进行研究,建立稳定且预测能力较强的HQSAR模型,并根据HQSAR模型得到的活性贡献图对分子结构进行优化修饰,设计出一系列新型高效缓蚀剂分子,为油气田新型缓蚀剂的研发提供新思路.
本文所选取的研究对象为实验室自行合成的20种苯并咪唑类缓蚀剂,并采用静态挂片失重法对缓蚀效率进行测定.实验选取Q235钢试样,腐蚀环境为1 mol·L-1HCl溶液(分析纯,广东省精细化学品工程技术研究开发中心),添加缓蚀剂(1-20号)的浓度为50 mg·L-1,实验温度为298 K(ZK-1型自控恒温水浴锅,江苏省高邮市仪器厂),腐蚀时间为10 h.苯并咪唑类化合物的公共结构、所研究化合物的分子结构及实验测得的缓蚀效率值(IEexp)列于表1中.
本文所有计算工作均使用Tripos公司Sybyl 8.1分子模拟软件29完成,使用模块包括SYBYL/Base、Minimize、HQSAR等,计算中各项参数除特别指明外均采用缺省值.
首先利用Sybyl软件中的Sketch Molecule模块构建20种苯并咪唑类分子的初始三维结构;然后通过Minimize模块,采用Powell能量梯度法,选取Tripos力场,加Gasteiger-Huckel电荷,收敛梯度设为0.21 kJ·mol-1·nm-1,迭代1000次,对所有苯并咪唑分子进行分子力学优化,以获得化合物分子的最低能量构象.以前15号分子作为训练集进行HQSAR建模,以16-20号分子作为测试集对模型性能进行评价.
表1 苯并咪唑类化合物的公共结构及所研究化合物的分子结构(1-20号)Table 1 Common structure of benzimidazole compounds and molecular structures(No.1-20)under investigation
分子全息的产生主要包括以下步骤:30首先,训练集中每个分子结构被划分为包含所有可能结构(线性、分支、环状、搭接或重叠)的分子碎片.碎片中所包含的结构类型即为碎片亚结构类型,包括原子类型(A)、化学键类型(B)、连接性(C)、氢原子(H)、手性(Ch)、质子给体和受体(D&A).碎片中所包含的原子数目即为碎片大小,由最小原子数(N)和最大原子数(M)指定.(1-3)为较小原子碎片,可以近似表征原子类型和官能团性质;(4-7)为中等原子碎片,可以区分脂肪环的链长或芳香环的性质以及取代基的位置和类型等结构特征;(8-10)为较大原子碎片.然后,对分子碎片进行全息编码.对应于一个分子的所有亚结构碎片按照循环冗余校验(CRC)算法映射成一定长度的整数串,这个整数串即分子全息.31整数串的长度称为分子全息长度(HL),在HQSAR模块中,提供12个缺省的质数(53,59,61,71,83,97,151,199,257,307,353和401)作为全息长度.
HQSAR模型可以通过改变碎片区分参数和碎片大小来优化.碎片区分参数决定了分子全息中所映射的拓扑结构信息.其中原子类型可以区分原子种类的不同;化学键类型可以区分原子间所形成的化学键差异;连接性可以辨别碎片内部原子杂化状态;手性可以辨别碎片中的原子手性与化学键的立体化学信息;氢键给体和受体可区分碎片的氢键给体或受体情况.一般而言,{A+B+C}包括区分不同碎片所需的最基本信息.在此基础上加入其他碎片参数,建立8种碎片参数组合,选取不同碎片大小(1-3,2-9,3-8,4-7,1-10,8-10),将12个全息长度全部选定,构建48个HQSAR模型.
采用SAMPLS32对所得分子结构信息及缓蚀效率数据进行PLS33分析.采用留一法(LOO)34进行交叉验证,确定最佳主成分数(ONC)、交叉验证系数(q2)和交叉验证标准误差(SEcv).并通过非交叉验证进行回归分析,得到非交叉验证相关系数(r2)及标准误差(SE).综合考虑q2、r2、SEcv来度量所建模型的统计能力、稳健度和预测能力,得到最优HQSAR模型.并通过HQSAR模型图直观反映原子或基团对化合物活性贡献,得到对现有分子进行修饰的有利信息.
不同碎片区分参数及碎片大小所构建的HQSAR模型的PLS分析结果如表2所示,观察表中数据发现,碎片区分参数组合{A+B+C}与{A+B+C+Ch}、{A+B+C+H}与{A+B+C+H+Ch}在选取相同碎片大小时,其结果完全相同,这是由于苯并咪唑类分子不含手性原子,因此Ch无法区分碎片;而{A+B+C+D&A}与{A+B+C+Ch+D&A}、{A+B+C+H+D&A}与{A+B+C+H+Ch+D&A}在选取相同碎片大小时,其结果不尽相同,这可能是由于苯并咪唑类分子中含有氢键给体及受体原子,加氢反应可以改变分子手性,当引入碎片区分参数(D&A)时会引起分子手性的变化,以至于Ch的引入也会导致模型统计结果产生差异.
表2中q2是模型预测能力的统计指标,当q2>0.3时,所建模型在5%显著水平上有统计意义,其机会相关的可能性小于5%(该模型可信度为95%);而当q2>0.5时,表明所建模型的统计意义十分显著.35观察表中数据发现,所建的48个模型中,其r2均为较大值(0.89以上),q2均在0.5之上,说明各模型统计学稳定性及预测能力均较好.因此在选取最优HQSAR模型时,综合考虑交叉验证标准误差SEcv对模型的影响,模型中SEcv小于5的共有2个,分别为Model 31及43,在表中由黑体标出.
表2 不同碎片区分参数及碎片大小的HQSAR模型Table 2 HQSAR models of different fragment distinctions and sizes
初选的两个较优模型中,其碎片大小集中在小碎片(Fragment size 1-3)上,这与本文研究的苯并咪唑类缓蚀剂分子均为小分子相吻合,在切割碎片时只需区分原子类型和官能团性质即可,小碎片就能有效反映出分子的活性片段.
为了验证HQSAR模型的性能,并继续筛选最优HQSAR模型,首先用初选的较优HQSAR模型(Model 31及43)对训练集15个分子的活性进行预测,确定模型的稳定性;再将其余5个分子作为测试集,利用两模型对其活性进行预测,以评价模型的预测能力.缓蚀效率的实验值与预测值如表3所示.图1为训练集和测试集化合物缓蚀效率预测值与实验值的相关性曲线,图2为预测值与实验值的残差分析图.
图1 模型31和模型43化合物缓蚀效率实验值与预测值相关图Fig.1 Correlation of inhibition efficiency experimental and predicted values of Models 31 and 43
表3 化合物实验值与HQSAR模型(模型31及43)预测值Table 3 Experimental and predicted inhibit efficiency values of training set and test set using HQSAR Model 31 and 43
图2 模型31和模型43残差分析图Fig.2 Residual analysis plots of Models 31 and 43
由图1可以看出,两模型所有数据均集中在趋势线附近,表明初选的两个HQSAR模型均具有较好的稳定性,模型31及43的相关系数R2分别为0.967和0.980,说明模型43拟合能力高于模型31.从图2所示的残差分析图可以直观看出,模型43对各分子缓蚀效率的预测值与实验值更为接近,说明模型43预测能力较模型31更强,可以用于具有类似骨架结构化合物缓蚀性能的预测.综合分析验证结果,选取模型43为最优HQSAR模型,并由最优模型得到的活性贡献图获取分子修饰信息,进行新型缓蚀剂分子设计.
图3 最优HQAR模型活性贡献图Fig.3 Contribution maps of optimal HQSAR model
通过Sybyl 8.1软件可以直接得到HQSAR模型的活性贡献图,分子中不同基团及原子对分子活性的贡献会通过不同颜色直观显示出来,如图3中色谱带所示,从红色到绿色分别表示基团或原子对分子活性由弊到利的变化:红色、橘红色以及橘色表示对分子活性不利;黄色、蓝绿色和绿色表示对分子活性有积极影响;白色表示贡献中等.模型43的活性贡献图如图3所示,其中以蓝绿色标记的苯并咪唑环部分为分子的公共结构.
综合观察图3中各分子的活性贡献图发现:4、8、11号分子R1位置上的N原子显示绿色;13、14、15号分子R1位置上的N原子显示黄色;11、12号分子R4位置上的C原子显示黄色;6号分子R1位置上的C原子显示红色.这表明,R1位置上的―NH2对分子活性最为有利、R4位置上的―CH3有利程度次之,而R1位置上的―CH2―对分子活性不利.
由表1中缓蚀效率的实验数据可以看出,R1位置上有―NH2基团的4号及13号分子与R4位置上有―CH3基团的12号分子,较无取代基的1号分子缓蚀效率均有了大幅提高,且4号及13号分子缓蚀效率高于12号分子;而同时在R1位置上具有―NH2基团及R4位置上具有―CH3基团的11号分子,缓蚀效率高于4、12及13号分子;6、7、9号分子由于R1位置上―CH2―的存在,缓蚀效率均较低(IE<60%),而8号分子由于―CH2―上连有―NH2基团,其缓蚀效率高于6、7、9号分子;这与活性贡献图所反映的R1位置上的―NH2为最有利基团、R4位置上的―CH3为次有利基团、R1位置上的―CH2―对分子活性不利相一致.13号分子缓蚀效率低于4号分子,这可能是由于R2位置上―NO2基团的影响,虽然―NO2在活性贡献图中无明显标示,但究其机理,是由于―NO2电负性过高,无法在金属表面进行稳定吸附,因此缓蚀效率较低.而处于训练集缓蚀效率数据顶部的14、15号分子,可能是由于R2及R3位置上―N(CH3)2的作用,能够在金属表面形成多位点吸附,形成稳定致密的保护膜,因此缓蚀效率较高.2、3、5及10号分子,其活性贡献图中各活性原子均为白色而无明显标示,其缓蚀效率均在70%之下,位于训练集缓蚀效率排序的中下部.因此,同时考虑不同位置上不同基团对分子活性的影响,可以设计出理论上具有较高缓蚀效率的缓蚀剂分子.
综合分析HQSAR模型活性贡献图中不同位置上不同基团对训练集中各个分子的影响,以苯并咪唑环为公共骨架,对原有分子进行优化修饰,并在各取代基位置进行基团的合理组合,设计出38种分子,并通过最优HQSAR模型(模型43)对所设计分子的缓蚀效率进行预测,分子结构与预测值见表4.
分别对分子1、2、3、5、6、7、8、9、10、13进行优化修饰,在取代基R4位置上添加活性有利基团―CH3,设计出21-30号分子;在HQSAR活性贡献图中,R2及R3位置上的―N(CH3)2基团虽无明显标识,但14及15号分子在训练集中缓蚀效率最高,联系其机理分析认为―N(CH3)2基团应为活性有利基团,因此考虑在R2及R3位置上添加―N(CH3)2基团对原分子进行修饰,设计出31-50号分子;对有利基团―NH2及―CH3不考虑位置而进行组合,设计出51-58号分子.
表4 基于最优HQSAR结果所设计分子的结构及其预测值Table 4 Structures and predicted values of designed compounds by the optimal HQSAR model
由表4中数据可以看出,经修饰后得到的21-30号分子的缓蚀效率虽未达到较高理论值,但其较原分子的缓蚀效率均有大幅提高;添加―N(CH3)2基团及活性基团―NH2和―CH3合理组合后得到的31-58号分子,缓蚀效率均在70%以上.这进一步印证了HQSAR模型图提示的―NH2和―CH3为活性有利基团,以及推测的―N(CH3)2为活性基团的信息.
苯并咪唑类缓蚀剂的缓蚀机理比较复杂,影响缓蚀剂缓蚀性能的因素较多,本文仅通过HQSAR模型图得到的直观信息对现有分子进行优化修饰,大量设计分子并进行理论筛选,其中42、43、50号分子理论缓蚀效率已达95%以上,其化学合成路线及在真实腐蚀环境中的缓蚀性能有待于下一步用实验方法进行验证.
采用HQSAR方法对20种苯并咪唑类缓蚀剂的全息定量构效关系进行了系统的研究,所建立的HQSAR模型中,模型43具有较好的统计意义、稳定性及预测能力(q2=0.960,r2=0.996,SEcv=3.709),基于以上研究,推荐模型43进行苯并咪唑类缓蚀剂定量构效关系研究的相关应用.通过HQSAR模型一方面能够明确分子的活性基团及其位置,并很好的解释缓蚀剂分子活性差异的原因,另一方面可以在合成之前对其他同类缓蚀剂分子的缓蚀性能进行预测.本文研究结果表明,基于HQSAR方法的缓蚀剂分子设计是可行的,HQSAR模型图能够将有利及不利基团用不同颜色直观表现出来,应用HQSAR分析结果对现有分子进行了优化修饰,设计出了一系列具有较好缓蚀性能的新型苯并咪唑类衍生物,为下一步缓蚀剂的合成工作提供了有益的参考,同时为新型缓蚀剂的研发提供了一种新的思路.
(1) Migahed,M.A.Mater.Chem.Phys.2005,93(1),48.doi:10.1016/j.matchemphys.2005.02.003
(2)Abd El-Maksoud,S.A.;Fouda,A.S.Mater.Chem.Phys.2005,93(1),84.doi:10.1016/j.matchemphys.2005.02.020
(3) Mernari,B.;Elattari,H.;Traisnel,M.;Bentiss,F.;Lagrenee,M.Corrosion Sci.1998,40(2-3),391.doi:10.1016/S0010-938X(97)00142-X
(4) Khaled,K.F.Electrochim.Acta 2003,48(17),2493.doi:10.1016/S0013-4686(03)00291-3
(5) Mu,G.N.;Li,X.H.;Qu,Q.;Zhou,J.Corrosion Sci.2006,48(2),445.doi:10.1016/j.corsci.2005.01.013
(6) Trabanelli,G.Corrosion 1991,47(6),410.doi:10.5006/1.3585271
(7)Gómez,B.;Likhanova,N.V.;DomínguezAguilar,M.N.;Olivares,O.;Hallen,J.M.;Martínez-Magadán,J.M.J.Phys.Chem.A 2005,109(39),8950.doi:10.1021/jp052188k
(8)Wang,X.M.;Yang,H.Y.;Wang,F.H.Corrosion Sci.2011,53(1),113.doi:10.1016/j.corsci.2010.09.029
(9) Wang,P.Quantitative Structure-Activity Relationship and Research Methods;Harbin Institute of Technology Press:Harbin,2004;pp 1-3.[王 鹏.定量构效关系及研究方法.哈尔滨:哈尔滨工业大学出版社,2004:1-3.]
(10) Hansch,C.;Fujita,T.J.Am.Chem.Soc.1964,86(8),1616.doi:10.1021/ja01062a035
(11) Bentiss,F.;Traisnel,M.;Vezin,H.;Lagrenée,M.Corrosion Sci.2003,45(2),371.doi:10.1016/S0010-938X(02)00102-6
(12)Khaled,K.F.;Babić-Samardžija,K.;Hackerman,N.Electrochim.Acta 2005,50(12),2515.doi:10.1016/j.electacta.2004.10.079
(13)Zhang,S.G.;Lei,W.;Xia,M.Z.;Wang,F.Y.J.Mol.Struct.-Theochem 2005,732(1-3),173.doi:10.1016/j.theochem.2005.02.091
(14) Lebrini,M.;Traisnel,M.;Lagrenée,M.;Mernari,B.;Bentiss,F.Corrosion.Sci.2008,50(2),473.doi:10.1016/j.corsci.2007.05.031
(15) Hu,S.Q.;Hu,J.C.;Shi,X.;Zhang,J.;Guo,W.Y.Acta Phys.-Chim.Sin.2009,25(12),2524.[胡松青,胡建春,石鑫,张 军,郭文跃.物理化学学报,2009,25(12),2524.]doi:10.3866/PKU.WHXB20091126
(16) Ashry,E.S.H.E.;Senior,S.A.Corrosion Sci.2011,53(3),1025.doi:10.1016/j.corsci.2010.11.037
(17) Marshall,G.R.;Cramer,R.D.Trends.Pharmacol.Sci.1988,9(8),285.doi:10.1016/0165-6147(88)90012-0
(18)Hu,S.Q.;Mi,S.Q.;Jia,X.L.;Guo,A.L.;Chen,S.H.;Zhang,J.;Liu,X.Y.Chem.J.Chin.Univ.2011,32(10),2402.[胡松青,米思奇,贾晓林,郭爱玲,陈生辉,张 军,刘新泳.高等学校化学学报,2011,32(10),2402.]
(19) Winkler,D.A.;Burden,F.R.Quant.Struct.-Act.Relat.1998,17(3),224.
(20)Chen,D.;Yin,C.S.;Wang,X.D.;Wang,L.S.Chemosphere 2004,57(11),1739.doi:10.1016/j.chemosphere.2004.08.075
(21) Honorio,K.M.;Garratt,R.C.;Andricopulo,A.D.Bioorg.Med.Chem.Lett.2005,15(12),3119.doi:10.1016/j.bmcl.2005.04.017
(22)Nair,P.C.;Srikanth,K.;Sobhia,M.E.Bioorg.Med.Chem.Lett.2008,18(4),1323.doi:10.1016/j.bmcl.2008.01.023
(23)Ye,M.;Dawson,M.I.Bioorg.Med.Chem.Lett.2009,19(12),3310.doi:10.1016/j.bmcl.2009.04.072
(24) Cheng,Y.H.;Zhou,M.;Tung,C.H.;Ji,M.J.;Zhang,F.S.Med.Chem.Lett.2010,20(11),3329.doi:10.1016/j.bmcl.2010.04.033
(25) Popova,A.;Sokolova,E.;Raicheva,S.;Christov,M.Corrosion Sci.2003,45(1),33.doi:10.1016/S0010-938X(02)00072-0
(26)Abboud,Y.;Abourriche,A.;Saffaj,T.;Berrada,M.;Charrouf,M.;Bennamara,A.;Cherqaoui,A.;Takky,D.Appl.Surf.Sci.2006,252(23),8178.doi:10.1016/j.apsusc.2005.10.060
(27)Aljourani,J.;Raeissi,K.;Golozar,M.A.Corrosion Sci.2009,51(8),1836.doi:10.1016/j.corsci.2009.05.011
(28)Benabdellah,M.;Tounsi,A.;Khaled,K.F.;Hammouti,B.Arab.J.Chem.2011,4(1),17.doi:10.1016/j.arabjc.2010.06.010
(29) Sybyl Software,Version 8.1;TriposAssociates Inc.:St.Louis,MO,USA,2008.
(30)Doddareddy,M.R.;Lee,Y.J.;Cho,Y.S.;Choi,K.;Koh,H.Y.;Pae,A.N.Bioorg.Med.Chem.Lett.2004,12(14),3815.doi:10.1016/j.bmc.2004.05.005
(31) Flower,R.D.J.Chem.Inf.Comput.Sci.1998,38(3),379.doi:10.1021/ci970437z
(32)Bush,B.L.;Nachbar,R.B.J.Comput.-Aided.Mol.Des.1993,7(5),587.doi:10.1007/BF00124364
(33)Wold,S.;Sjöström,M.;Eriksson,L.Chemom.Intell.Lab.Syst.2001,58(2),109.doi:10.1016/S0169-7439(01)00155-1
(34) Cawley,G.C.;Talbot,N.L.C.Neural Netw.2004,17(10),1467.doi:10.1016/j.neunet.2004.07.002
(35)Clark,M.;Cramer,R.D.;Jones,D.M.;Patterson,D.E.;Simeroth,P.E.Tetrahedron Comput.Method 1990,3(1),47.doi:10.1016/0898-5529(90)90120-W