吲唑类PI3Kδ选择性抑制剂活性理论模型的构建

2019-06-11 03:14:46堵锡华
中北大学学报(自然科学版) 2019年4期
关键词:分子结构电性选择性

堵锡华,王 超,吴 琼,李 靖,周 俊

(徐州工程学院 化学化工学院,江苏 徐州 221018)

0 引 言

脂酰肌醇-3-激酶(phosphoinositide 3-kinases,PI3K) 是细胞中重要的信号分子,是PI3K/AKT/mTOR信号通路的重要组成部分[1],其本身具有丝氨酸/苏氨酸和磷脂酰肌醇激酶的活性[2],故在细胞存活、分裂增殖、分化、凋亡和血管生成过程中起重要调节作用[3],以PI3K为靶点可以抑制肿瘤细胞的增殖、诱导其凋亡及逆转肿瘤细胞的耐药性等[4-5]. PI3K主要有3种类型: I型、II型和III型,不同类型的PI3K具有不同的功能,其中I型PI3K中的PI3Kδ与血液肿瘤和炎症的发生有密切关系,它参与调控巨噬细胞骨架的重排以及趋化[6]. PI3Kδ选择性抑制剂是一种促进恶性肿瘤细胞凋亡的新药[7],它在血液肿瘤,特别是B细胞肿瘤的治疗中有明显成效,该类药物在治疗淋巴肿瘤方面也已取得进展,故近年来对PI3K抑制剂抗癌新药的研究已成为热点[8-10],但这些研究大多通过实验进行,耗时较长. 故利用构效关系(QSAR)方法对PI3Kδ抑制剂新型药物研究开始有少量报道[11-12],但利用神经网络法对吲唑类PI3Kδ选择性抑制剂进行研究未见有报道.

基于文献[13-16],根据文献[12]所列的47个吲唑类PI3Kδ选择性抑制剂的活性pIC50,按文献方法[17]的自编程序,计算了分子形状指数和电性拓扑状态指数两类分子结构参数[18-19],用最佳变量回归筛选了分子形状指数的K1,K3和K4,以及电性拓扑状态指数的E7,E16和E19共6种参数作为神经网络输入变量,将PI3Kδ选择性抑制剂的活性pIC50作为输出变量,构建了预测吲唑类PI3Kδ选择性抑制剂活性的神经网络模型,所建模型总相关系数r=0.979 4,根据模型计算的活性值与文献实验值吻合度较好,相对平均误差为1.92%,该方法与现有常用的多元回归法所得相对平均误差6.14%的结果相比,预测精度更高,所得预测结果的误差更小. 本研究对设计活性高、毒性低的新型PI3Kδ选择性抑制剂药物分子,具有重要的现实指导意义.

1 吲唑类化合物结构及活性数据来源

47个吲唑类PI3Kδ选择性抑制剂分子及其活性数据pIC50(半数抑制浓度IC50的负对数)来源于文献[12]. 将其分子结构图及其活性实验值,如表 1 所示.

表 1 吲唑类化合物的结构参数

表 1(续)

表 1(续)

表 1(续)

2 结构参数计算及变量的优化筛选

采用Chem3D Ultra 9.0画图软件,勾画文献[12] 中所列47种吲唑类PI3Kδ选择性抑制剂的分子结构,在MATLAB中调用画好的分子结构,计算分子形状指数和电性拓扑状态指数两类分子结构参数,去除全部为0的数组,对其它剩余的数组,用MINITAB软件的最佳变量子集回归方法,进行优化筛选,所得结果见表 2.

表 2 pIC50与参数的最佳变量子集回归结果

表 2 中FIT的计算式[20]为

(1)

式中:n为化合物分子个数;b为模型的变量数;R2为模型的决定系数.

可以看出,当选择分子形状指数和电性拓扑状态指数中的K1,K3,K4,E7,E16和E19共6个参数时,吲唑类PI3Kδ选择性抑制剂的活性pIC50与分子结构参数之间的相关性最好,文献所列的47种吲唑类PI3Kδ选择性抑制剂的6种分子结构参数也列在表 1 中.

3 定量结构-活性相关(QSAR)模型的建构

3.1 多元回归模型的构建

将文献[12]列出的47种PI3Kδ选择性抑制剂分子的活性pIC50,与优化筛选的分子形状指数和电性拓扑状态指数得到的6种结构参数K1,K3,K4,E7,E16和E19进行线性多元回归分析,得到方程为

pIC50=-0.659K1+1.392K3+0.952K4-0.204E7-0.122E16+0.205E19+6.706,

(2)

3.2 稳定性检验

表 3 Jackknifed r的检验

图1 Jackknifed相关系数r的正态分布图Fig.1 Normal distribution graph of Jackknifed correlation coefficent r

3.3 神经网络模型的建构

从所得多元回归方程来看,结构参数与活性的相关系数没有达到0.9以上的优级相关,预测误差稍大,为提高预测PI3Kδ选择性抑制剂活性的准确度,结合神经网络法进一步开展研究. 将筛选的K1,K3,K4,E7,E16,E19这6个参数,作为神经网络的输入变量,将47种PI3Kδ选择性抑制剂分子的活性作为输出变量,综合许禄等[21]及Andrea[22]的建议规则

1.4≤ρ(=n/M)<2.2,

(3)

式中:n为样本数;M为网络总权重.M的定义为

M=(E+1)H+(H+1)Q,

(4)

式中:E,H,Q分别为神经网络中输入变量、隐含层变量及输出变量.

图2 预测误差的控制图Fig.2 Control diagram of predictive error

图3 神经网络法预测值和实验值关系图Fig.3 Relationship between prediction value and experimental value by neural network method

这里,6个结构参数作为输入变量E=6,PI3Kδ选择性抑制剂分子的活性作为输出变量Q=1,根据式(3)和式(4)计算,H可取3或4,经多次分析试验,发现当H取4时,所得结果更优,故采用6∶4∶1网络结构方式,为防止出现“过训练、过拟合”现象,将样本分为训练集(每5个数据为数组的第1, 3, 5个数据)、测试集(第2个数据)、验证集(第4个数据),得到神经网络模型的总相关系数r=0.979 4,训练集、测试集和验证集三个集合的相关系数分别为r1=0.983 5,r2=0.982 1,r3=0.965 9,利用该神经网络模型预测活性值与文献实验值较为吻合,相对平均误差为1.92%,将计算所得的误差值作控制图(见图2),从控制图可以看出,所有误差值均落在标准可控范围内,说明没有异常的预测误差存在; 将神经网络模型得到的预测值与实验值作关系图(见图3),可以看出,预测值与实验值的对应点均在45°直线上或附近,没有偏离直线较远的点存在,说明神经网络法的预测精度较好.

4 结 论

化合物分子中原子的连接特性及其与基团的组合方式等结构信息,直接决定化合物所表现的性质,而结构参数是分子结构的量化表示,因此通过结构参数可以建立与性质之间的拓扑关系. 本研究通过最优变量子集回归优化筛选的分子形状指数的K1,K3,K4及电性拓扑状态指数的E7,E16,E19,与PI3Kδ选择性抑制剂分子活性的相关性最优. 这两类结构参数中,分子形状指数是用来表征分子形状或分子立体空间拓扑结构的一个参数,电性拓扑状态指数则是一种原子级指数,它既能反映出分子中原子的电子和局部拓扑特性,又能表达该原子所处环境中其他非氢原子扰动程度[23-24],将这两类结构参数进行有机结合,能较好反映分子的空间结构、电性结构、基团所处位置以及原子或基团之间的相互作用对活性的影响. 通过对表1吲唑类PI3Kδ选择性抑制剂分子活性数据进行分析,可以看出,当R2位连接有供电子基团时,会使活性明显变小; 在R1位连接的基团中含有的原子数越多,分子体积越大,抑制剂活性也越大,而且随着基团中含有杂原子数量的增多活性也会增大; 如1号(pIC50=7.0)和2号(pIC50=5.9)分子、12号(pIC50=7.1)和13号(pIC50=8.0)分子可较好说明这一特点. 此外,基团与基团之间、杂原子之间的相互作用也会影响到活性的大小,单一种分子结构参数不能充分出这种复杂的关系,故蕴含了分子空间结构形状和原子电性结构信息的电性拓扑状态指数进行结合,能充分反映PI3Kδ选择性抑制剂活性的变化规律,这两类分子结构参数与其活性之间呈现了良好的非线性关系,预测值的相对平均误差只有1.92%,建构的神经网络模型具有良好的预测能力. 本研究为寻找高效低毒的吲唑类PI3Kδ选择性抑制剂分子并进行分子设计具有重要的实际意义.

猜你喜欢
分子结构电性选择性
把握分子结构理解物质的性质
中学化学(2024年5期)2024-07-08 09:24:57
选择性听力
第一财经(2019年8期)2019-08-26 17:53:46
三步法确定有机物的分子结构
民间引爆网络事件的舆情特点——以“北电性侵事件”为例
新闻传播(2018年21期)2019-01-31 02:42:00
用于燃烧正电性金属的合金的方法
色谱相关系数和随钻电性参数实时评价地层流体方法
录井工程(2017年3期)2018-01-22 08:40:08
解读分子结构考点
中学化学(2016年10期)2017-01-07 08:37:06
外电场中BiH分子结构的研究
选择性应用固定物治疗浮膝损伤的疗效分析
哈尔滨医药(2015年2期)2015-12-01 03:57:13
带电粒子在磁场中的多解问题