孙悦 封佳欣 何旭 陈美华 臧皓 金莉莉
(1.延边大学 药学院,吉林 延吉 133002;2.通化师范学院 医药学院,吉林 通化 134002)
肺癌(lung cancer)是常见的癌症之一.目前,肺癌主要分为非小细胞肺癌和小细胞肺癌两类[1].近年来一些学者对狼毒大戟(Euphorbiafischeriana)进行了研究,发现其含有二萜、三萜、黄酮、香豆素、类固醇、酚酸等241种成分[2-4],其中二萜类成分对治疗乳腺癌[5-6]、前列腺癌[7-8]、肝癌[9]以及肺癌[10-13]等具有很好的疗效.2008年,Yan等[14]研究发现,狼毒大戟中的成分17-acetoxyjolkinolide B(结构式见图1)可有效抑制NF-κB 信号通路;2009年,Wang等[15]研究发现,狼毒大戟中的成分ingenol 3-myristinate 和ingenol 3-palmitate(结构式见图1)对肺癌A549细胞具有明显的抑制作用,同时发现17-hydroxyjolkinolide B(结构式见图1)可通过抑制STAT3 信号通路治疗肺癌.为了进一步探讨狼毒大戟治疗肺癌的疗效及其作用机制,本文利用网络药理学和分子对接技术对狼毒大戟治疗肺癌的作用机制进行了探讨,以期为利用狼毒大戟治疗肺癌提供理论依据和研究方向.
为了得到狼毒大戟抗肺癌的潜在活性成分及其靶点,本文首先利用Chemdraw 画出其2D结构;然后将得到的2D 结构导入SwissADME(http://www.swissadme.ch/)中,并以胃肠道吸收为“high”和类药性中至少有2个“yes”为标准对狼毒大戟的化学成分进行筛选,以此得到具有类药性高和能够被胃肠道吸收的潜在活性成分;最后利用SwissTargetPrediction(http://www.swisstargetprediction.ch/)数据库对上述狼毒大戟的潜在活性成分进行靶点预测,并在预测结果中选取可能性≥0.1的靶点作为狼毒大戟的潜在活性成分靶点.
利用GeneCards数据库(https://www.genecards.org/)、Therapeutic Target Database(TTD)药物靶标数据库(https://db.idrblab.net/ttd/)和Drugbank数据库(https://go.drugbank.com/)中的药物数据和药物目标信息对肺癌疾病靶点进行预测.预测时首先以“lung cancer”为关键词进行检索,然后将检索得到的肺癌疾病靶点进行合并和去除重复项,由此即得肺癌疾病靶点.
将狼毒大戟的潜在活性成分靶点和肺癌疾病靶点输入到Venny2.1.0 在线平台(https://bioinfogp.cnb.csic.es/tools/venny/index.html)中,由此可得到两者的韦恩图.在韦恩图中,潜在活性成分靶点与肺癌疾病靶点的相交部分即为潜在活性成分与肺癌疾病的交集靶点,这些交集靶点即可认为是狼毒大戟治疗肺癌的潜在靶点.
首先用狼毒大戟的潜在活性成分和交集靶点建立两者的“网络”和“类型”文件,然后将所得的文件导入到Cytoscape3.7.2软件中构建狼毒大戟治疗肺癌的“药物-潜在活性成分-交集靶点”网络,最后对该网络进行拓扑学分析即可得到狼毒大戟治疗肺癌的潜在活性成分.将所得结果按自由度值进行大小排序,并将排名前10的潜在活性成分作为狼毒大戟治疗肺癌的核心活性成分[16].
构建PPI网络的方法:将潜在活性成分与肺癌疾病的交集靶点导入到STRING v11.5数据平台(https://cn.string-db.org/)中后,通过检索即可得到PPI网络.检索条件为:以“智人”为限定物种,置信度分数为0.4,其他参数为默认值.
核心靶点的筛选方法:首先将构建好的PPI网络图导入到Cytoscape中;然后利用CytoNCA插件计算PPI网络的自由度、接近中心性(closeness centrality)和介度中心性(betweeness centrality),并同时筛选出大于其各自平均值的靶点;最后按自由度值的大小进行排序,并将排名前10的靶点作为狼毒大戟治疗肺癌的核心靶点[17].
Metascape数据库是一个数据丰富且可对基因功能进行注释的数据库,因此本研究利用其对交集靶点进行GO(gene ontology)和KEGG(kyoto encylopaedia of genes and genomes)富集分析,以此获取交集靶点的生物信息以及分析狼毒大戟治疗肺癌的潜在作用通路.为了便于对富集分析的结果进行分析,本文对富集分析的结果进行了可视化,即利用微生信(bioinformatics)在线作图平台(http://www.bioinformatics.com.cn/)对P值最小的10个富集分析结果进行了作图.
首先,在PPI网络中将自由度值排名前5的核心靶点TP53(5o1f)、TNF(7jra)、EGFR(5ug9)、STAT3(6njs)和MAPK3(6ges)作为分子对接的受体;然后,在药物-潜在活性成分-交集靶点中将自由度值排名前5 的核心活性成分[araucarone(LD11,d=35)、ent-13S-hydroxy-16-atisene-3,14-dione(LD14,d=33)、ent-3β-(13S)-dihydroxyatis-16-en-14-one(LD8,d=31)、ent-(13S)-13-hydroxyatis-16-ene-3,14-dione(LD18,d=31)、caudicifolin(LD12,d=30)]和4个已被证明具有抗肺癌活性的化学成分[17-acetoxyjolkinolide B(LD6,d=25)、ingenol 3-myristinate(LD36)、ingenol3-palmitate(LD37)和17-hydroxyjolkinolide B(LD39)]作为分子对接的配体;最后,将上述得到的潜在活性成分的2D 结构导入到Chem3D 中进行结构优化,由此得到能量最小的3D 结构.本文利用AutoDockVina1.1.2软件对配体和受体进行分子对接.在进行分子对接操作时,首先在AutoDockTool中对配体和受体进行去水和加氢等操作,然后设置对接grid参数(LD6-TP53(centerx=115.577,centery=87.131,centerz=-30.174;sizex=74.0,sizey=62.0,sizez=52.0);LD36-EGFR(centerx=-2.109,centery=18.808,centerz=-25.616;sizex=44.0,sizey=50.0,sizez=60.0);LD37-EGFR(centerx=-2.109,centery=18.808,centerz=-25.616;sizex=44.0,sizey=50.0,sizez=60.0);LD39-MAPK3(centerx=46.391,centery=4.48,centerz=-8.116;sizex=87.0,sizey=68.0,sizez=102.0);对接次数为10次),最后运行Vina进行分子对接.为了更直观地展示配体和受体的结合情况,本文采用Pymol软件将对接结果进行了可视化(以3D 图的形式).
本研究的具体操作流程见图2.
图2 研究狼毒大戟治疗肺癌作用机制的流程图
利用SwissADME数据库对已分离出的狼毒大戟中的化学成分进行筛选后得到38个潜在活性成分,见表1.利用SwissTargetPrediction数据库对狼毒大戟的潜在活性成分靶点进行预测,由此共得到1493个靶点.
表1 狼毒大戟的潜在活性成分
利用GeneCards数据库、TTD 药物靶标数据库和Drugbank数据库检索肺癌疾病靶点,对所得的靶点进行去重后共得到1561个靶点.
将去重后的419 个潜在活性成分靶点与1561 个肺癌疾病靶点进行韦恩分析后获得了139个交集靶点(占潜在活性成分靶点和疾病靶点总数的7.6%),如图3所示.
图3 狼毒大戟的潜在活性成分靶点与肺癌疾病靶点的韦恩图
利用Cytoscape,以139个肺癌靶基因(作为抗癌靶点)和38个狼毒大戟的潜在活性成分(作为狼毒大戟抗肺癌的潜在活性成分)构建“药物-潜在活性成分-交集靶点”网络图,结果如图4所示.图4中:绿色代表狼毒大戟,粉色代表狼毒大戟的潜在活性成分,紫色代表交集靶点;节点体积越大,表示自由度值越大,即其在治疗肺癌中的作用越大.由图4 可见,图中共有176 个节点,576条相互作用的边.由该网络可知,狼毒大戟治疗肺癌的核心活性成分为LD11(d=35)、LD14(d=33)、LD18(d=31)、LD8(d=31)、LD12(d=30)、LD10(d=27)、LD16(d=26)、LD20(d=26)、LD6(d=25)和LD9(d=25).
图4 “药物-潜在活性成分-交集靶点”网络图
首先将139个交集靶点导入到STRING 数据库中,以此获取肺癌疾病的蛋白互作信息和构建PPI网络图.为了更直观地展示PPI网络的结果,本文利用Cytoscape软件对PPI网络图进行了筛选和优化,并将蛋白按自由度值从大到小进行了排序(见图5).由图5可见,PPI网络图中含有139个相互作用的节点,2074条相互作用的边,平均节点度为29.8.由图5得出的核心靶点见表2.
表2 核心靶点的名称及其相关信息
图5 按自由度值大小排列的PPI网络图
GO 富集包括生物过程(biological process,BP)、细胞组分(cellular component,CC)、分子功能(molecular function,MF)3部分.对潜在活性成分与肺癌疾病的交集靶点进行GO 富集分析显示:BP共有1684个条目(P<0.05),主要涉及蛋白磷酸化、对激素反应、细胞迁移的正调节等;CC共有78个条目(P<0.05),主要涉及薄膜筏、膜微区部分等;MF共有161个条目(P<0.05),主要涉及蛋白激酶活性、蛋白质丝氨酸/苏氨酸/酪氨酸激酶活性和磷酸转移酶活性等.图6为对狼毒大戟进行GO 富集分析得到的三合一柱状图.由图6可以看出,狼毒大戟可通过调控多种生物学过程来发挥其治疗肺癌的作用.对潜在活性成分与肺癌疾病的交集靶点进行KEGG 富集分析显示,其共有182条KEGG 条目(P<0.05).图7为对狼毒大戟进行KEGG 富集分析得到的气泡图(图中的圆点越大,表示在通路上富集的靶点越多;图中的圆点越红,表示P值越小).由图7可知,交集靶点主要富集在癌症通路、AGE-RAGE信号通路、PI3K-Akt信号通路以及癌细胞的蛋白聚糖的表达上.
图6 GO 富集分析的三合一柱状图
图7 KEGG 富集分析的气泡图
研究[18-19]表明,结合能越低表明配体-受体的结合构象越稳定.图8为核心活性成分与靶点分子对接的结合能图(图中的颜色块越红,表示结合能的值越小,即结合效果越好).由图8可以看出,根据分子对接所选取的核心活性成分与核心靶点的结合能均小于-5.0kJ/mol,由此说明这些成分与靶点形成了良好的对接.
图8 核心活性成分与靶点分子对接的结合能图
由图9 可以看出,LD12-TP53 中的LD12与TP53中的MET793和CYS797,LD39-TP53中的LD39 与TP53 中 的THR-256、ARG267、SER99,LD39-MAPK3中的LD39与MAPK3中的ALA369和PRO315,LD39-STAT3中的LD39与STAT3中的ALA241和ASN485,LD39-EGFR中 的LD39 与EGFR 中 的ALA722、ASN842、ARG841,LD39-TNF 中 的LD39 与TNF 中 的PRO176、GLU192都各形成了1条氢键.由此进一步表明,狼毒大戟的核心活性成分与核心靶点形成了良好的对接.
图9 肺癌靶点分子对接的3D 图(A 为LD12-EGFR;B为LD39-TP53;C 为LD39-TNF;D 为LD39-EGFR;E为LD39-STAT3;F为LD39-MAPK3)
研究表明:TP53为抑癌基因[20-21],且其高表达对癌基因BIRC5 具有明显的抑制作用[22];TNF-α可促进Th9细胞的生长(Th9具有抗肿瘤的作用)[23-24];EGFR 可通过IL-6/STAT3信号通路对肺癌细胞的增殖和凋亡产生影响[25-26];STAT3对肺癌具有明显的抑制作用[27-28].在图8中,由于LD12与EGFR 的结合能最低(为-36.8 kJ/mol),因此可推测狼毒大戟极有可能通过影响IL-6/STAT3信号通路发挥其抗肺癌活性.
本研究利用网络药理学和分子对接技术探讨了狼毒大戟治疗肺癌的作用机制,研究结果表明:狼毒大戟的抗癌作用主要是通过其araucarone、ent-13S-hydroxy-16-atisene-3,14-dione、ent-3β-(13S)-dihydroxyatis-16-en-14-one、ent-(13S)-13-hydroxyatis-16-ene-3,14-dione和caudicifolin等核心活性成分与TP53、TNF、EGFR、STAT3、MAPK3等靶点共同作用(通过调节癌症通路、AGE-RAGE信号通路、PI3K-Akt信号通路以及抑制癌细胞的蛋白聚糖的表达)来实现的.本研究可为后续深入研究狼毒大戟在肺癌治疗中的应用提供良好参考.但由于网络药理学和分子对接技术存在一定的局限性,所以在今后的研究中我们将通过实验对其作用机制做进一步探讨.