eEF2K蛋白同源模建及其抑制剂小分子的虚拟筛选研究

2019-09-10 07:22黎玉梅孔研于大永宋昱唐川史丽颖
中国药房 2019年16期

黎玉梅 孔研 于大永 宋昱 唐川 史丽颖

中圖分类号 R914.2 文献标志码 A 文章编号 1001-0408(2019)16-2199-07

DOI 10.6039/j.issn.1001-0408.2019.16.08

摘 要 目的:筛选潜在的真核生物延伸因子2激酶(eEF2K)抑制剂小分子,为eEF2K抑制剂的设计和研发提供参考。方法:采用同源模建技术构建eEF2K蛋白晶体结构模型,并进行Loop优化和分子动力学优化,借助SAVES在线服务器从Verify_3D、EERAT和拉氏图等3个方面对上述模型进行评估。收集55个eEF2K抑制剂小分子,使用Insight Ⅱ软件以其中的28个(编号为奇数,设为训练集)为基础构建具有活性预测能力的Hypogen药效团模型,以另外27个(编号为偶数,设为测试集)进行验证,通过拟合活性[即半数抑制浓度的负对数(pIC50)]预测值与真实值并借助Ligand profiler热图筛选最优药效团模型。结合上述药效团模型和Lipinski五规则、分子对接方法进行eEF2K抑制剂小分子的虚拟筛选。结果与结论:所建eEF2K蛋白晶体结构模型的整体质量因素得分为93.697,其中83.33%的氨基酸Verify_3D得分≥0.2,且位于不允许区的氨基酸占氨基酸总数的1.7%,其氨基酸构象及骨架结构合理,模型可靠性高。共构建了9个具有活性预测功能的Hypogen药效团模型(02~10号),其中03号药效团模型包含2个氢键受体和2个共轭芳香环,可更好地区分活性及非活性分子,其pIC50预测值与真实值拟合最好(相关系数为0.665 3),具有较好的预测能力和较高的可靠性。通过虚拟筛选最终获得9个潜在的eEF2K抑制剂小分子(pIC50预测值为1.074~1.185,分子与蛋白相互作用的Dcoking-score得分为-9.730~-7.467),其中Pro268、Asp267、Gln171、Phe121、Glu212可能是eEF2K抑制剂与靶点蛋白相互作用的关键氨基酸,作用方式包括氢键、盐桥、疏水等。上述分子有望成为eEF2K抑制剂研发的先导化合物。

关键词 真核延伸因子2激酶;抑制剂小分子;同源模建;Hypogen药效团;分子对接;虚拟筛选

Study on Homology Modeling of eEF2K Protein and Virtual Screening of Its Inhibitors Molecules

LI Yumei1,KONG Yan2,YU Dayong1,SONG Yu1,TANG Chuan1,SHI Liying3(1. School of Life Sciences and Technology, Dalian University, Liaoning Dalian 116622, China; 2. Dept. of Oncology, Dalian Third People’s Hospital, Liaoning Dalian 116033, China; 3. Institute of Materia Medica, Dalian University, Liaoning Dalian 116622, China)

ABSTRACT   OBJECTIVE: To screen potential eEF2K inhibitor molecules, and to provide reference for the design and R&D of eEF2K inhibitor. METHODS: The eEF2K crystal structure model was constructed by homology modeling technique. The model was optimized by Loop optimization and molecular dynamics. With the help of SAVES online server, the above models were evaluated from three aspects such as Verify_3D, EERAT and Laplace diagram. Totally 55 eEF2K inhibitor molecules were collected. Hypogen pharmacophore model with activity prediction ability was constructed based on 28 of them (odd number, as training set) by Insight Ⅱ software and validated by other 27 (even number, as test set). The optimal pharmacophore model was screened by fitting the predicted and experimental values of activity [i.e. negative logarithm of half inhibitory concentration (pIC50)] and using Ligand profiler thermogram. The virtual screening of small molecules of eEF2K inhibitors was carried out by combining the above pharmacophore model, Lipinski’s five rules and molecular docking method. RESULTS & CONCLUSIONS: The overall quality factor score of the crystal structure model of eEF2K protein was 93.697. Among them, 83.33% of the amino acid Verify_3D score was more than or equal to 0.2, and 1.7% of the total amino acids were located in the non-permissible region. The amino acid conformation and skeleton structure of the model were reasonable and the reliability of the model was high. Totally 9 Hypogen pharmacophore models (No. 02-10) with active predictive function were constructed, among which No. 03 pharmacophore model included 2 hydrogen bond receptors and 2 conjugated aromatic rings, which could better distinguish active and inactive molecules. The predicted value of pIC50 fitted the experimental value best (the correlation coefficient was 0.665 3), and it had good predictive ability and high reliability. Finally, 9 potential eEF2K inhibitor molecules were obtained through virtual screening (pIC50 ranged from 1.074 to 1.185, and Dcoking-score of protein-molecule interaction ranged from -9.730 to -7.467). Pro268, Asp267, Gln171, Phe121 and Glu212 may be the key amino acids for the interaction between eEF2K inhibitors and target proteins, including hydrogen bonds, salt bridges and hydrophobicity. These 9 molecules are expected to be the lead compounds for the development of eEF2K inhibitors.

KEYWORDS   eEF2K; Inhibitor molecule; Homology modeling; Hypogen pharmacophore; Molecular docking; Virtual screening

真核生物延伸因子2激酶(Eukaryotic elongation factor 2 kinase,eEF2K)又称钙调素依赖性真核生物延伸因子2激酶(Calmodulin-dependent protein kinase Ⅱ,CaMKⅡ),是由人类基因组eEF2K基因编码的一种激酶[1]。该酶在多种恶性肿瘤组织中均呈高表达,如恶性胶质瘤、髓母细胞瘤、乳腺癌等[2-4]。Parmer TG等[5]检测了不同细胞周期人乳腺癌MCF-7细胞中eEF2K的活性,发现S期细胞中eEF2K活性明显增强,提示其活性高低与肿瘤细胞周期密切相关。此外,eEF2K还可参与肿瘤细胞自噬[6]、凋亡[7]、血管新生[8]、侵袭与转移[9]等过程的调控。由此可见,作为潜在的抗癌药物作用靶点,eEF2K在肿瘤细胞生长、增殖过程中发挥着极其重要的作用,研究与开发新型的eEF2K抑制剂具有重要的临床意义,现已成为当前抗肿瘤药物研发的热点之一。

计算机辅助药物设计(Computer aided drug design,CADD)是以计算化学为基础,通过计算机进行模拟、计算和预测药物与受体之间的相互关系,设计并优化药物先导化合物的药物设计方法。该法可大大提高药物研发的成功率,减少研究的盲目性,具有成本低、周期短等优点,是药物研发的重要手段之一[10]。基于结构的药物设计、基于片段的药物设计和基于配体的药物设计是CADD的主要应用技术,其中同源模建(Homology modeling)、分子对接(Molecular docking)和虚拟筛选(Vir- tual screening)等方法对药物的研发意义重大。鉴于此,本研究以CADD为手段,首先通过同源模建的方法构建了eEF2K蛋白的晶体结构模型,以文献报道的eEF2K抑制剂分子[11-12]为基础构建了具有活性预测能力的Hypogen药效团模型,随后结合该药效团模型和类药性五规则(Lipinski 5规则)[13]、分子对接方法筛选出潜在的eEF2K抑制剂小分子,旨在为eEF2K抑制剂的优化设计和进一步研发提供理论依据。

1 资料来源

eEF2K氨基酸序列(含725个氨基酸残基)来源于Uniprot数据库(https://www.uniprot.org/);用于同源模建的模板蛋白来源于PDB数据库(http://www.rcsb.org/)。本研究所需的55个eEF2K抑制剂小分子(编号1~55,结构见图1)均来源于相关文献[11-12],将其结构导入药物设计工具Schrodinger Suite 2017软件,利用其中的“Ligprep”工具以“OPLC_2005”力场进行结构优化及3D结构转化,将结果保存为“mol2”文件格式,用于后续药效团模型和分子对接的构建与筛选。

2 方法

2.1 同源模建

2.1.1 模型构建与优化 利用美国国立生物技术信息中心(NCBI)的“BLAST”程序(https://blast.ncbi.nlm.nih.gov/blast.cgi)進行模板搜索,采用生物分子模拟软件Insight Ⅱ的“Align sequence to templates”模块进行序列比对,根据比对结果进行适当的筛除修饰,以提高目标蛋白与模板蛋白的同源性,选择比对结果最好(即同源性和相似性最高)[14]的作为模板蛋白。以Insight Ⅱ软件中的“Modeller 9.2”程序进行同源模建,构建eEF2K蛋白的三维结构,将运算参数中的“Number of models”设置为“10”(即构建10个蛋白模型,下同),“Optimization level”选择“High”(即高优化水平,下同),其余参数均选择“缺省值”。以输出模型的“PDF total energy”和“DOPE score”选择最优模型,两者得分越低,表明模型在同源约束条件下优化得越好、模型质量越可靠[13]。利用Insight Ⅱ软件“Loop refinement”模块和“Standard dynamics cascade”模块分别进行Loop优化和分子动力学优化,以消除原子间的不合理接触。结合前期预试验,将Loop优化参数“Number of models”设为“10”,“Optimization level”设为“High”。分子动力学优化时,首先赋予eEF2K蛋白“CHARMM”力场,溶剂模型选择“隐形溶剂模型(GBSW)”;随后使用“最陡下降法(Steepest descent method)”优化,设置“收敛RMS参数(RMS gradient)”为“0.05(kcal/mol)·Å”(1 kcal=4.186 kJ,1Å=0.1 nm)、“最大迭代步数(Max iterations)”为“10 000”;最后使用“共轭梯度法”,设置“收敛RMS参数”为“0.001(kcal/mol)·Å”、最大迭代步数为“100 000”,对模型的分子构象进行进一步优化。

2.1.2 模型评估 借助SAVES在线服务器(http://servicesn.mbi.ucla.edu/SAVES/),从Verify_3D、ERRAT和拉氏图(Ramachandran Plot)等3个方面对eEF2K蛋白模型进行评估。其中,Verify_3D用以评估模型和氨基酸一级结构的相关性,当80%以上的氨基酸得分≥0.2即表示氨基酸侧链构象合理[15]。ERRAT用以计算在空间距离0.35 nm内,不同原子类型间非键相互作用侧链(包括C—C、C—N、C—O、N—N、N—O、O—O)的数量,并计算整体质量因素(Overall quality factor)得分,若该得分>85则表明模型可靠性高[16]。拉氏图是通过蛋白中非键合原子间最小接触距离来评价两个相邻肽单位骨架构象的合理性,并以此表示蛋白中允许和不允许的构象,位于不允许区的氨基酸数应小于氨基酸总数的5%[16]。

2.2 Hypogen药效团模型构建

将图1中编号为奇数的eEF2K抑制剂小分子作为训练集(共28个),编号为偶数的作为测试集(共27个)。利用Insight Ⅱ软件中“3D QSAR pharmacphore generation”模块以训练集分子为基础构建具有活性预测能力的Hypogen药效团模型,拟合活性以半数抑制浓度(IC50)的负对数(pIC50)表示。设置“Minimum interfeature distance”为“1.5”、“Conformation generation”为“Best”、“Energy threshold”为“10”,其余参数为默认值,表征各分子的构象空间,保留能量值<10 kcal/mol的分子构象[17],构建Hypogen药效团模型。所建模型通过测试集分子进行验证,以筛选出可靠性及预测能力较好(即预测值与真实值拟合度较好,真实值来源于文献[11-12])的药效团模型,模型验证利用Insight Ⅱ软件中的“Ligand profiler”程序进行,“Conformation generation”设为“Best”、“Energy threshold”设为“10”、“Maximum omitted features”设为“-1”以允许小分子与Hypogen药效团特征元素部分匹配,其余参数为默认值,以Ligand profiler热图确定最优药效团模型(即可区分活性分子和非活性分子的模型)用于eEF2K抑制剂的虚拟筛选。

2.3 eEF2K抑制剂虚拟筛选

2.3.1 Hypogen药效团筛选 从ZINC数据库(http://zinc.docking.org/)搜索用于虚拟筛选的小分子,并利用Lipinski 5规则进行初步筛选。筛选标准[13]:①化合物分子量<500 Da;②化合物结构中氢键给体(包括羟基、氨基等)的数量不超过5个;③化合物结构中氢键受体的数量不超过10个;④化合物脂水分配系数的对数值(lgP)为-5~-2;⑤化合物中可旋转的化学键数不超过10个。随后使用Insight Ⅱ软件中“Ligand pharmacophore mapping”程序对“2.2”项下所获Hypogen药效团模型进行进一步筛选,并对筛选所得小分子进行活性预测。程序中“Maximum omitted features”设置为“0”、“Conformation generation”设为“Best”、“Energy threshold”设为“10”,其余参数为默认值,保留小分子所有特征与药效团匹配其能量值均小于10 kcal/mol的构象。

2.3.2 分子对接筛选 用于分子对接目标蛋白为同源模建所构建的eEF2K蛋白,使用Schrodinger Suite 2017软件中“Ligand docking”模块对由Hypogen药效团初步筛选所得小分子进一步筛选。通过该软件的“Sitmap”程序对目标蛋白最具潜力的活性位点进行精确对接,以“Docking-score”得分函数值评价小分子与eEF2K蛋白的相互作用,该函数综合考虑了氢键、疏水、范德华力等相互作用,其绝对值越大表明小分子与目标蛋白的对接复合物越稳定、匹配结合作用越好[18]。

3 结果

3.1 同源模建和模型評估

3.1.1 同源模建结果 通过BLAST程序搜索得与eEF2K蛋白同源性较高的蛋白晶体5KS5、3PDT、3LKM、3LMH,其相关参数见表1(蛋白名称后的“A”表示该晶体有一条A链,下同)。其中,“最大分”和“总分”均为蛋白晶体结构评价值,两者值越高表明晶体结构越优;“覆盖率”为序列覆盖率,其值越大表明晶体结构越优;“E”值为相似性分值远离理论值可能性的概率,该值越低表明序列相似性越高;“I”值表示序列经BLAST比对的同源性,其值越高表明晶体同源性越好[19]。以上述4个蛋白作为预选模板蛋白的序列比对结果见表2。经筛除修饰后,3PDT的同源性和相似性最高,故将其作为模板蛋白进行同源模建。选取构建的10个蛋白模型中的最优模型(PDF total energy为1 316.46、DOPE score为-688.31)进行后续研究。

3.1.2 模型评估 Verify_3D评估结果显示,eEF2K蛋白模型中,有83.33%的氨基酸得分≥0.2,表明模型中氨基酸侧链构象合理;ERRAT评估结果显示,本模型的整体质量因素得分为93.697,表明模型可靠性好;拉氏图评估结果如图2(图中,“ ”表示位于不允许区的氨基酸)所示,本模型共分为4个区域,其中位于不允许区的氨基酸占氨基酸总数的1.7%(12/689),小于5%,表明模型骨架结构合理。

3.2 Hypogen药效团模型构建结果

本研究共构建了9个Hypogen药效团模型(序号:02~10),进一步通过测试集分子进行模型验证,其Ligand profiler热图见图3(图中,热值数值越大表明对应小分子的预测活性越高。其中,“-”表示非活性分子,“*”表示中等活性分子,“+”表示活性较高分子)。

由图3可见,03号Hypogen药效团模型能更好地区分活性分子和非活性分子,其预测值与真实值见表3,线性关系见图4。由表3、图4可见,该药效团模型预测值与真实值相差较小,两者相关系数(R2)为0.665 3,提示该药效团模型具有较好的预测能力和可靠性。

03号Hypogen药效团模型由4个部分构成,包括2个氢键受体(A1、A2)和2个共轭芳香环(B1、B2),详见图5。

3.3 eEF2K抑制剂虚拟筛选结果

本研究从ZINC数据库中共筛选到符合Lipinski 5规则的小分子共10万个,选取经03号Hypogen药效团模型筛选出的pIC50预测值由大到小排序前500位的小分子进行分子对接,其中Docking-score得分排序前9位的小分子化合物(序号1~9)见表4(表中,“-”表示无相应的作用方式)。由表4可见,Pro268、Asp267、Gln171、Phe121、Glu212(同一作用方式出现频次较高)可能为eEF2K抑制剂小分子与靶点蛋白相互作用的关键氨基酸。

以1号小分子为例,其与eEF2K的相互作用方式见图6。由图6可见,该小分子可与氨基酸Lys153、Thr266、Glu212、Ile215形成氢键,与氨基酸Tyr219、Tyr214、Met95、Ile215具有疏水作用,与氨基酸Tyr219具有Pi-cation作用。

4 讨论

由于肿瘤细胞具有无限增殖的特点,需要消耗大量的营养物质,因此肿瘤细胞常处于缺乏营养和缺氧等条件下,此时其细胞中eEF2K的活性会增强,使得真核生物延伸因子2(Eukaryotic elongation factor 2,eEF2)的活性受到抑制,从而阻止了细胞蛋白合成过程中多肽链的延伸,降低了细胞对营养物质及能量的消耗,协助肿瘤细胞抵抗不良环境,有助于其增殖[20]。由此可见,eEF2K可作为肿瘤治疗的潜在靶点之一,但针对该靶点的抗肿瘤药物研发尚处于初期。相较于传统药物研发方法,CADD技术能够显著提高药物设计速度,降低药物研发成本,缩短研发周期[10]。其中,虛拟筛选技术可在生物活性筛选前借助计算机技术对化合物分子进行提前筛选,以降低实际筛选化合物的数量。目前,常见的药效团筛选方法包括基本分子共同特征药效团模型和基于受体-配体复合物的药效团模型等。笔者认为相较于上述两种药效团模型,Hypogen药效团模型可针对具有明确活性的特定化合物分子构建出具有活性预测能力的模型,对优化小分子构象具有重要的指导意义。

本研究首次针对eEF2K蛋白,利用同源模建技术构建蛋白模型,并从Verify_3D、ERRAT和拉式图等3个方面对模型进行评估。本研究结果显示,模型中有83.33%的氨基酸Verify_3D得分≥0.2,整体质量因素评分为93.697,位于不允许区的氨基酸数占1.7%,提示本研究所建模型的氨基酸构象及骨架结构合理,且可靠性高。同时,本研究以eEF2K抑制剂小分子(训练集)为基础,构建了9个(02~10号)具有活性预测能力的Hypogen药效团模型,并以测试集小分子进行模型验证。结果显示,03号药效团模型包括2个氢键受体(A1、A2)和2个共轭芳香环(B1、B2),其pIC50的预测值与真实值拟合较好,R 2为0.665 3,具有较好的预测能力和可靠性。本研究进一步通过03号药效团和分子对接方法对符合Lipinski 5规则的10万个小分子进行虚拟筛选,共得到9个抑制剂小分子,其中Pro268、Asp267、Gln171、Phe121、Glu212可能是eEF2K抑制剂与靶点蛋白相互作用的关键氨基酸;这9个小分子可作为eEF2K抑制剂研发的先导化合物。

综上所述,本研究构建了可靠的eEF2K蛋白模型,该模型可用于eEF2K蛋白分子对接、虚拟筛选等分子模拟方面的研究。本课题组后续将对本研究所得的9个小分子进行结构修饰,并对其eEF2K活性抑制作用进行验证和量效关系研究,以期获得高活性的eEF2K抑制剂。

参考文献

[ 1 ] XIE JL,VAN DAMME PETRA,FANG D,et al. Ablation of elongation factor 2 kinase enhances heat-shock protein 90 chaperone expression and protects cells under proteotoxic stress[J]. J Biol Chem,2019. DOI:10.1074/jbc.AC119.008036.

[ 2 ] ZHU H,YANG X,LIU J,et al. Eukaryotic elongation factor 2 kinase confers tolerance to stress conditions in cancer cells[J]. Cell Stress Chaperones,2015,20(2):217- 220.

[ 3 ] PROUD CG. Regulation and roles of elongation factor 2 kinase[J]. Biochem Soc Trans,2015,43(3):328-332.

[ 4 ] WANG X,REGUFE DA MOTA S,LIU R,et al. Eukaryo- tic elongation factor 2 kinase activity is controlled by  multiple inputs from oncogenic signaling[J]. Mol Cell Biol,2014,34(22):4088-4103.

[ 5 ] PARMER TG,WARD MD,YURKOW EJ,et al. Activity and regulation by growth factors of calmodulin-dependent protein kinase Ⅲ(elongation factor 2-kinase)in human breast cancer[J]. Br J Cancer,1999,79(1):59-64.

[ 6 ] KENNEY JW,MOORE CE,WANG X,et al. Eukaryotic elongation factor 2 kinase,an unusual enzyme with multiple roles[J]. Adv Biol Regul,2014. DOI:10.1016/j.jbior.2014.

04.003.

[ 7 ] LIU XY,ZHANG L,ZHANG Y,et al. Roles of eEF-2 kinase in cancer[J]. Chin Med J:Engl,2012,125(16):2908-2913.

[ 8 ] KHAN AA,DACE DS,RYAZANOV AG,et al. Resveratrol regulates pathologic angiogenesis by a eukaryotic elongation factor-2 kinase-regulated pathway[J]. Am J Pathol,2010,177(1):481-492.

[ 9 ] MANNING BD. Adaptation to starvation:translating a ma- tter of life or death[J]. Cancer Cell,2013,23(6):713-715.

[10] 劉维国.抗药物依赖功效药效团模型的构建及其虚拟筛选[D].北京:中央民族大学,2013.

[11] PAN Z,CHEN Y,LIU J,et al. Design,synthesis,and biological evaluation of polo-like kinase 1/eukaryotic elongation factor 2 kinase(PLK1/EEF2K)dual inhibitors for regulating breast cancer cells apoptosis and autophagy[J]. Eur J Med Chem,2018. DOI:10.1016/j.ejmech.2017.12.

046.

[12] GUO Y,ZHAO Y,WANG G,et al. Design,synthesis and structure-activity relationship of a focused library of β-phenylalanine derivatives as novel eEF2K inhibitors with apoptosis-inducing mechanisms in breast cancer[J]. Eur J Med Chem,2018. DOI:10.1016/j.ejmech.2017.11.

065.

[13] 张洁,谭初兵,徐为人. Lipinski五规则的研究进展[J].药物评价研究,2011,34(6):451-455.

[14] 李微.猪繁殖与呼吸综合症糖基化蛋白GP2/3与CD163/9同源模建及相互作用模拟研究[D].长春:吉林大学,2016.

[15] 黄佳俊,林淑玲,欧阳萍兰,等. DBAT酶的同源建模及与多样性底物对接[J].化学研究与应用,2018,30(8):1246-1251.

[16] 张莹,杨洪干,李娟,等.人类CCR5三维结构的同源模建[J].药物生物技术,2012,19(5):432-436.

[17] 宋昱,任聪,杨彭真,等. GPR40受体苯丙酸类激动剂三维定量构效关系研究[J].化学通报,2019,82(5):446- 451.

[18] CAVASOTTO CN,ABAGYAN RA. Protein flexibility in ligand docking and virtual screening to protein kinases[J]. J Mol Biol,2004,337(1):209-225.

[19] 曹洪玉,吴艳华,周兴智,等.虚拟筛选竞争性抑制NDRG3与L-Lactate结合的小分子研究[J].华南师范大学学报(自然科学版),2018,50(3):58-64.

[20] XIE J,DE SOUZA ALVES V,VON DER HAAR T,et al. Regulation of the elongation phase of protein synthesis enhances translation accuracy and modulates lifespan[J]. Curr Biol,2019,29(5):737-749.

(收稿日期:2018-12-27 修回日期:2019-06-11)

(编辑:张元媛)