席晓萌,姜云鸽,王煜丹,黄相中,田 凯
(1.云南民族大学 理论与计算化学实验室,云南 昆明 650500;2.云南民族大学 民族药资源化学国家民族事务委员会-教育部重点实验室,云南 昆明 650500)
糖尿病是一种以糖代谢紊乱为主要表现的疾病,以慢性高血糖为主要特征.糖尿病发病原因有很多,但是主要原因多涉及环境、遗传以及生活方式等[1].自从 2 000 年糖尿病地图集面世至今,该疾病的发病率呈现出日益高发的态势,给全球造成了巨大的公共卫生压力.在众多的慢性疾病中,其对人类的危害,仅次于心血管疾病和癌症[2-4].一旦患上这种疾病,机体内的多种物质,比如水、脂肪、蛋白质等,其代谢都将出现异常,胰岛素合成减少,血糖升高,长此以往,眼、肾、神经等多脏器的功能水平都将受到影响而降低.糖尿病会导致人的食欲增强,饮水量增加,小便增多,体重不断降低,即所谓的“三多一少”[5-8].糖尿病包括多种类型,从致病根源上来看包括了1型、2型糖尿病,以及妊娠期糖尿病和特殊类型糖尿病,相比之下,1型和2型患者占比更高,尤其是2型,超过 90%的患者都属于2型,并且发病年龄日趋年轻化[6, 9-10].糖尿病患者一经发病,往往很难治愈,只能终生服用各类降糖类药物.传统降糖药毒性较大,长期服用往往给患者身体造成严重的伤害,因此研制新型的、高效的、低毒的抗糖尿病药物是目前的主流研究.
网络药理学的概念是由来自英国的Hopkins教授于2007年率先提出的[11],其主要借助系统生物学、网络生物学、化学生物学和计算机技术等先进手段,通过药物对集体的干预实现对疾病详细而准确的判断和解释,然后在利用网络拓扑构建模型,以此对不同节点的相关性与作用机理实施分析[12-13].网络药理学是近些年新兴的一种基于系统生物学的理论,它首先对生物系统进行网络分析,以特定信号节点(Nodes)为基准,最终设计并研究多靶点药物分子的一门新学科.网络药理学表示,要从多个途径上对信号通路进行调节,确保药物的最佳疗效,减小毒副作用,提高新药在临床上的成功率,节约研发费用.所以,从某种意义上讲,它是从全新的角度去认识药物和机体的相互作用关系,以及阐释疾病与药物关联的计算方法.
黄酮泛指通过一个三碳原子实现2个酚羟基的苯环(A环,B环)的联结,由此所形成的若干种化合物,其基本母核为2-苯基色原酮.黄酮类化合物结构中常连接有酚羟基、甲氧基、甲基、异戊烯基等官能团.此外,它还常与糖结合成苷[14].黄酮类化合物广泛存在于天然的植物和中草药中,正是依赖于这些中草药,使黄酮类化合物的获取变得相对容易,给研究开展提供了便利(常见黄酮类化合物结构式见表1).
研究表明,黄酮类化合物的生理活性与药理活性都相对较多,在抗炎症、抗氧化、抗糖尿病并发症以及抗癌症等方面都能够产生一定的疗效[15-17].黄酮类化合物拥有毒性低的特点,在一些食物或者化妆品中都有添加.近几年来,有学者发现葛根异黄酮类化合物具有降血糖、降血脂及扩张冠状血管的作用[18];梅桂雪等[19]研究发现,黄酮类化合物可以通过抑制 Maillard 反应、增强机体对葡萄糖的摄取、促进胰岛素的分泌、作用于血管紧张素等,发挥防治糖尿病的作用;葛根素可以使链脲佐菌素(STZ)诱导的糖尿病小鼠的血糖明显降低,促进胰腺胰岛素受体底物以及生长因子的蛋白水平上升,进而促进胰岛素分泌能力的提升[18].Cheng等[20]对水飞蓟的药用机理进行分析,指出其能够使沉默信息调节因子表达能力下降,使胰腺β细胞的自我吞噬受到抑制,从而使血糖水平趋于正常,同时它还能对机体胰岛淀粉样多肽的毒性低聚反应形成抑制,避免其出现纤维化,进一步增强胰岛β细胞活力,减轻糖尿病的症状.
表1 常见的黄酮类化合物结构式
论文中所用到的6个黄酮均来自云南民族大学民族药资源化学国家民族事务委员会-教育部重点实验室在辣木、半育耳蕨、野番豆等药材中分离获得的黄酮类化合物.将上述化合物分别用ChemBioDraw Ultra 14.0软件画出,保存为sdf格式文件.
联网打开Swiss ADME(http://www.swissadme.ch/)数据库,将这6个黄酮类化合物的分子结构依次导入其中,检测其药代动力学参数.通过查阅文献,选择 GI absorption为High,P-gp substrate为Yes,再选一个参数为Yes作为筛选这些小分子的方法,即“1High,2Yes”[21].通过初步筛选,发现这6个黄酮类化合物均符合药代动力学参数规则,因此将其分别命名为HT-1-HT-6.具体的结构信息见表2.将上述经过初步筛选的6个化合物依次导入Swiss Target Prediction(http://www.swisstargetprediction.ch/)数据库中,分别获取它们所对应的靶基因.将化合物靶点数据保存为Excel表格形式.
表2 6个黄酮类化合物的分子结构信息表
联网打开GeneCards(https://www.genecards.org/)数据库,以“Type 2 Diabetes Mellitus”为关键词预测2型糖尿病相关靶点,随后将2型糖尿病靶点数据保存为Excel表格形式.
将上述获得的6个小分子Excel表格中“Common name”一列单独粘贴至一个全新的Excel表格中,以“Probability”这一栏大于零作为筛选标准,如果存在可能性为0的数据,需要将此数据的Common name删去,最后剔除重复的数据;
将下载好的2型糖尿病靶点信息Excel表格中“Gene Symbol”单独粘贴至一个全新的Excel表格中,剔除重复的数据;
图1 6个黄酮类化合物与2型糖尿病交集靶点韦恩图
联网打开Draw Venn Diagram(http://bioinformatics.psb.ugent.be/webtools/Venn/)数据库,将筛选后的黄酮类化合物和2型糖尿病的靶基因导入其中,即可得到这6个黄酮类化合物与2型糖尿病的交集靶点,共收集到201个交集靶点,如图1所示.
联网打开String(https://string-db.org/)数据库,将上述获得的201个交集基因导入其中,选择高置信度(highest confidence0.900)解析,可以得到原始的PPI网络图,如图2所示.将原始PPI网络文件导入Cytoscape 3.8.0软件中,选取网络节点度(Degree,Deg)、接近中心性(Closeness Centrality,CC)和介数中心性(Betweenness Centrality,BC)等指标作为量化节点,Degree、CC和BC值越大,说明该节点在网络中越重要[22].从中选取大于Degree、CC和BC三者值的中位数的化学成分和靶点分别作为关键化学成分和核心靶点,即为黄酮类化合物治疗2型糖尿病的关键化学成分和核心靶点.以这些核心靶点和关键化学成分为基础,做出蛋白-蛋白相互作用网络图(PPI)与成分-疾病-靶点网络图.
R语言是一款强大生物信息学数据处理的半编程软件,主要用于统计分析、绘图、数据挖掘.它可以灵活调用后台开发的集成包,支持扩展包的安装及更新[23].本论文采用R语言clusterProfiler[24]包进行富集分析.
将交集基因导入至symbol2id文件夹中Drug_Disease.txt文档中,联网打开R语言程序,R x64 3.6.3,调用org.Hs.eg.db指令将交集基因的Symbol转化为Entrez IDs,进一步调用clusterProfiler包对靶点基因进行GO生物富集分析和KEGG通路分析.物种设置为人,P<0.05作为富集筛选的标准,取排名前20的数据,利用Rstudio中的ggplot2包进行绘图.
通过筛选整理,6个天然黄酮类化合物共获得600个靶点基因,剔除重复数据,一共获得235个靶点基因;通过GeneCards数据库筛选整理,共获得了 10 735 条关于2型糖尿病相关的靶点.
将原始的PPI网络文件通过Cytoscape3.8.0软件基于Degree、combined score值等参数的构建,即可得到黄酮化合物-2型糖尿病相关的PPI网络,如图3所示.网络中共有201个节点和514条边,网络平均自由度为5.11.
图2 蛋白-蛋白相互作用网络关系原始图 图3 黄酮化合物-2型糖尿病PPI网络图
该图中,根据Degree值设置图形的大小及颜色的深浅,Degree值越大,图形越大,颜色也越深,说明与蛋白联系越密切;Combine score值越高,边就越粗,说明与蛋白相互作用的越好.
从图中可以看到颜色较深的几个蛋白,例如:PIK3CA、PIK3R1、MAPK3等均属于网络中前20的节点,在整个网络图中十分重要.
将6个黄酮类化合物共计235个靶点基因与2型糖尿病的 10 735 个靶点基因取交集之后,得到201个交集靶点基因.利用Cytoscape3.8.0软件构建化学成分-疾病-靶点网络图如图4所示(黄色菱形结构代表药物成分;绿色倒三角形结构代表靶点;蓝色六边形结构代表疾病).网络中一共有241个节点(其中6个节点属于黄酮类化合物,235个节点属于靶点);度值较高的化合物有HT-2、HT-3、HT-6等.上述提及的黄酮化合物对医治2型糖尿病可能具有一定功效.
图4 成分-疾病-靶点网络图
利用R语言程序的org.Hs.eg.db包和clusterProfiler包对201个交集基因进行GO功能富集和KEGG通路富集分析,201个交集基因共影响了146个生物功能(P<0.05,FDR<0.05),选取排名前20位靶基因功能信息,详见图5(柱状图中柱形区域越长,表明该生物功能富集的基因越多;颜色越红,表示P值越小,结果越显著)、表3.
图5 GO功能富集柱状图(排名前20名)
表3 GO功能富集分析表(排名前20名)
续表3
由表2可知,本论文中所使用的黄酮化合物主要富集在蛋白丝氨酸/苏氨酸激酶活性、蛋白酪氨酸激酶活性、碳酸盐脱水酶活性、跨膜受体蛋白酪氨酸激酶活性、蛋白丝氨酸/苏氨酸/酪氨酸激酶活性、跨膜受体蛋白激酶活性、非膜跨越蛋白酪氨酸激酶活性、磷酸酶结合、羧酸酯水解酶活性、蛋白磷酸酶结合、组蛋白激酶活性、胰岛素受体底物结、SH2结构域结合、碳氧裂解酶活性、水解裂合酶活性、裂合酶活性、钙依赖性磷脂酶A2活性、核受体活性、转录因子活性,直接配体调节的序列特异性DNA结合和磷脂酰肌醇3-激酶结合,这充分表明本论文选取的黄酮类化合物是通过多种生物学途径发挥治疗2型糖尿病的作用.
通路富集分析发现,201个交集基因显著富集在了159条通路上(P<0.05,FDR<0.05),选取排名前20位靶基因功能信息,详见图6(柱状图中柱形区域越长,表明该通路富集的基因越多;颜色越红,表示P值越小,结果越显著)、表4.
图6 KEGG通路富集柱状图(排名前20名)
表4 KEGG通路富集分析表(排名前20名)
由表3可知,KEGG通路富集中,与肿瘤相关的有14条,分别是:前列腺癌、Ras信号通路、胰腺癌、急性髓样白血病、非小细胞肺癌、癌症中的蛋白聚糖、VEGF信号通路、神经胶质瘤、磷脂酶D信号通路、ErbB信号通路、HIF-1信号通路、癌症的中枢碳代谢、黑素瘤、结直肠癌;与2型糖尿病有关的通路有3条,分别是:PI3K-Akt信号通路、EGFR酪氨酸激酶抑制剂耐药性、内分泌抵抗;与炎症相关的通路有2条,分别是:花生四烯酸代谢、神经营养蛋白信号通路;以及其它1条信号通路:脂质与动脉粥样硬化.图7是与2型糖尿病关系最为密切的PI3K-AKT信号通路完整示意图.
图7 PI3K-AKT信号通路图
文中应用网络药理学的方法探究了实验室分离得到的黄酮类化合物与2型糖尿病相互作用的机制.通过相关数据库的筛选与预测,获得了化合物与疾病的靶基因,进一步得到了两者的交集基因;通过Cytoscape软件构建了蛋白-蛋白相互作用网络图(PPI)与成分-疾病-靶点网络图;通过R语言半编程程序对交集基因进行生物功能富集与通路富集分析,发现这些黄酮类化合物是通过多种生物学途径及影响多条信号通路来发挥治疗2型糖尿病的作用,明确了黄酮化合物在基因水平上作用于2型糖尿病的机制.相关的较为重要的信号通路有PI3K-Akt信号通路、EGFR酪氨酸激酶抑制剂耐药性,接下来就以上述通路具体展开说明其作用机制.
磷脂酰肌醇3-激酶-蛋白激酶B(phosphatidylinositol 3-kinase and protein kinase B,PI3K-AKT)信号通路是一条十分重要的通路,该通路不但可以调节机体的胰岛素信号传导,而且是胰岛素下游的信息通路,有效参与机体内一些生物学途径,例如:细胞生长、增殖、分化、凋亡及葡萄糖转化等.如果PI3K-AKT信号通路出现异常,那么人体中的胰岛素合成及释放信号就会受到影响,从而导致胰岛素不能正常唯机体所使用,进一步诱发机体罹患2型糖尿病[25].人体内有很多重要的信号蛋白,胰岛素受体底物-2(IRS-2)是其中一种,该蛋白可使胰岛β细胞保持良好的生物学活性,能促进胰岛β细胞的新生与复制,关系到胰岛β细胞的存活与凋亡.当胰岛素与相关受体特异性结合后,会使得IRS-2酪氨酸位点磷酸化,进而与PI3K的P85调节亚基发生结合,这样一来下游的PI3K分子将被活化,产生磷脂酰肌醇二磷酸和磷脂酰肌醇三磷酸;与此同时,活化后的 PI3K 分子可以充当第二信使的身份,诱导产生AKT 活化效应.活化后的 AKT 可导致FoxO1磷酸化失活,FoxO1是胰岛β细胞团的关键调控因子,其一旦失活,机体内的G6P基因和PEPCK表达就会受到影响,糖异生途径受到抑制,血糖因此而降低[26-27].
多数研究表明,糖尿病和肺癌发病率增高有关[28].表皮生长因子受体(epidermal growth factorreceptor,EGFR) 的靶向治疗是非小细胞肺癌(NSCLC)的主要治疗手段之一,目前临床上最常用的非小细胞肺癌靶向治疗药物之一就是EGFR酪氨酸激酶抑制剂,其中比较有代表性的药物有第1代的厄洛替尼,第2代的阿法替尼,第3代的奥西替尼等.通过查阅相关文献和报道,发现厄洛替尼可以降低血糖,并且能逆转胰岛素抵抗.Costa 等[29]报道了1例72岁的NSCLC老年女性患者,确诊肺癌时已有两年糖尿病病史,在服用了厄洛替尼后并进行医学检测,发现该患者的血糖和糖化血红蛋白(ALC)指数明显降低;此外,针对EGFR酪氨酸激酶抑制剂耐药性,也有学者做了相关研究:众所周知,二甲双胍是一类降糖疗效出色的药物,一些研究学者认为二甲双胍可逆转肺癌细胞对EGFR酪氨酸激酶抑制剂的耐药性.杨翠等[30]研究认为二甲双胍能够逆转肺腺癌耐厄洛替尼细胞A549ER耐药性.另外,上文中提到的PI3K-AKT 通路是 EGFR的主要下游靶点.
综上所述,本研究中通过网络药理学的方法构建了黄酮类化合物治疗2型糖尿病的成分-疾病-靶点网络图及PPI图,明确了6个黄酮类化合物通过多靶点、多通路治疗2型糖尿病的作用机制.