中药网络药理学药效成分筛选与靶标预测的研究进展

2019-01-25 07:31刘志强王博龙
中成药 2019年1期
关键词:靶标药理学靶点

刘志强, 王博龙

(宜春学院化学与生物工程学院, 江西 宜春336000)

中药是指在传统中医药理论、 辨证施治指导下, 用于预防和治疗疾病的一类药物[1-2]。 中医药在医药产业、 替代医学等众多领域发挥着不可替代的作用, 但因其化学成分复杂、 药理作用机制不甚明确, 又受中药材品种、 产地和制剂加工技术等因素的影响, 使得其在药理研究、 质控监管以及现代化、 国际化发展中面临巨大阻碍[3-4]。 传统的药理实验为证明药物对某个疾病的线性因果关系, 通常是设置对照试验、 施加单一药物因素, 研究其对某个靶蛋白的高亲和力、 高特异性相互作用, 以揭示药物对疾病的作用机制[5]。 但这与中医药辨证论治、 整体观、 系统观的医疗理念, 以及中药“多组分、 多靶点、 多通路” 系统作用机制的研究理念是相悖的。 而且, 现代医学研究表明肿瘤、心血管系统疾病、 神经精神系统等诸多疾病是由多种遗传、非遗传因素, 多个靶点、 通路引起的复杂性疾病, 传统的“一个靶点, 一种疾病, 一个药物” 的研究模式, 已很难系统、 整体地阐明中药药效物质基础及其对复杂疾病的药理作用机制[6-7]。

2007 年, Hopkins[8]首次提出了网络药理学的概念,2011 年, 李梢[9]又提出了网络靶标等概念。 网络药理学等新理念相继提出, 为中药研究带来了新的技术与方法, 其系统性、 整体性的研究理念与中药复方多组分、 多功效、协同作用等特点是不谋而合的。 目前, 网络药理学在中药药理机制研究、 新药发现、 药物重新定位、 老药新用以及不良反应、 毒副作用研究等方面取得了良好成效[10-11]。 张尊建等[12]运用代谢组学技术在疾病诊断、 网络靶标发现方面取得显著成效; 程肖蕊等[13]发现网络药理学实验技术具有高通量、 可定量、 快速、 灵敏、 准确等特点, 除基因组、蛋白质、 代谢组等组学外, 高通量/高内涵技术、 双高通量技术基因表达测序技术和分子相互作用技术在网络药理学研究中也有较好的应用前景。 中药成分挖掘及靶标预测是网络药理学研究的基础工作, 运用公共的中药化学数据库、 靶标数据库、 基因组数据库、 知识发现工具, 化合物-蛋白互作网络及一站式中药网络药理学分析平台, 挖掘中药药效成分、 预测其潜在功能靶标, 构建“药物-靶点-疾病” 网络,阐明其“多组分、 多靶点、 多途径” 的药理机制, 已成为中药网络药理学研究中必不可少的内容。 鉴于中药成分挖掘与靶标预测技术在网络药理学领域的重要性, 现就其常用的技术方法原理及在中药研究中的应用情况进行总结。

1 中药有效成分挖掘

中药药效物质基础是其所含有的有效化学成分, 但其所含成分十分复杂, 有效成分与非有效成分难以区分。 因此, 研究中药有效成分的提取分离方法、 构建中药化学成分数据库, 对中药网络药理学研究有重要意义[14]。 近年来, 国内外许多科研院所、 课题组已成功建设了一批数据多元化、 涉及内容广的中药、 天然药物化学成分数据库,并广泛应用于中药、 中药及方剂的网络药理学研究。 目前常用的中药、 天然化学成分数据库, 见表1, 包括TCMSP[15]、 TCMID[16]、 TCMD[17]、 TCM@ TAIWAN[18]、 Herb-BioMap[19]、 HIT[20]、 TCMGeneDIT、 CHCD、 BPCD 等[18,21]。

TCMSP、 TCMID 是应用较多的2 个中药化学数据库与网络药理学分析平台。 TCMSP 是由西北农林科技大王永华团队研发的一款系统药理学分析服务器, 其通过文献挖掘和数据库整合, 得到500 味常用中药、 30 069 个中药化合物的药物代谢动力学、 药物化学和药物-靶标蛋白网络-疾病网络的基本信息[15]。 TCMSP 构建的中药化学分子库较为全面, 在纳入皂苷类中药化合物时, 还特意区分加入了皂苷去糖形式的化合物, 编号M11043 的人参皂苷Rh2与编号为MM11044 的人参皂苷Rh2-qt 就因一个糖基的差别(图1、 表2), 而造成化学参数的巨大差别。 TCMSP 特别将两者区分, 分别纳入, 使其中药化学库更加准确全面。

表1 中药化学成分数据库

图1 人参皂苷化合物结构

表2 TCMSP 与TCMID 数据库对比

TCMID 数据库通过整合HIT、 TCM@ TAIWAN 等数据库及文本挖掘等方法收集中药化合物信息, 并利用STITCH、 HIT 数据库、 文本检索等方式预测化合物靶标,利用HPRD 构建蛋白互作网络, 构建的一款中药综合数据库[16]。 以中药成分阿魏酸为例比较TCMSP、 TCMID 提供的信息功能, 见表3。 TCMSP 数据库提供了包括中药分子氢受体、 供体、 血脑屏障通透性等药化、 药动学参数, 及其对应的潜在靶点、 疾病和中药来源, 还包含一个mol2 格式三维结构文件, 就单一中药化学成分信息而言, 比TCMID 数据库内容更加全面。 但TCMSP 数据库总体上收录的中药品种不多, 浮小麦、 血竭、 五灵脂等常用药均未收录, 也不包含中药方剂的信息, 因此实际运用中应综合考虑TCMSP、 TCMID 数据库。

TCMD 是由创腾科技公司和中科院过程工程研究所分子设计课题组联合开发的综合性中药化学数据库, 包含6 735种植物、 23 033 个中药化合物, 每个中药化合物含有CAS 号、 分子式、 来源、 药理活性、 物理化学性质等11 项数据[17]; TCM@TAIWAN 是由台湾中国医科大学研发的一款中药筛选平台, 收录有352 味中药的37 170 个化合物[18]。 2018 年, 霍晓乾等[22]在研究大黄利胆片网络药理机制时, 利用TCMD、 TCM@ TAIWAN 两个数据库收集到大黄利胆片中229 种大黄成分、 254 种余甘子成分以及21种手掌参成分, 并运用靶标预测技术、 蛋白互作网络、 聚类分析技术, 阐释了大黄利胆片在对免疫系统的综合调节和对机体的营养代谢调节等方面发挥协同作用的配伍机制。

HerbBioMap 是一套集成数据库, 搜录整合了包括中药信息数据、 中药成分数据、 中药药对信息、 方剂信息数据、证候等多种信息数据, 包含636 种常用中药及10 838 种中药成分等的基本信息[19]。 李梢团队曾利用该数据库, 成功揭示了葛根芩连方治疗2 型糖尿病的网络药理机制[23]。HIT 则是收集Pubmed 数据库中药成分及其靶点信息, 并与TTD 靶点库、 DrugBank 药物数据库、 UniProt 等数据库整合连接组建的中药成分靶标数据库, 但该数据库存在化学成分数据量 少、 信息不 足 等 缺点。 同 样, TCMGeneDIT、CHCD、 BPCD 3 个数据库也因其收录的信息少、 相关报道不多, 在网络药理学研究中应用较少。

2 靶标预测

高效、 准确地预测中药及其药效成分潜在靶标是中药网络药理学研究中的一个关键问题, 随着药物-靶标预测技术的发展, 许多旧的靶标服务器、 靶标预测工具已经停止运行, 但越来越多的新的靶标预测工具已开始用于中药网络药理学研究[24]。 靶标预测方法主要包括数据挖掘、 知识发现工具应用、 化合物-蛋白质相互作用网络构建、 药效团模型匹配、 正反分子对接技术、 药物-靶标相似性算法等,几种方法各有利弊, 具体还要结合实际情况综合分析利用[25]。 2016 年, 霍梦琪等[26]在研究川芎嗪治疗冠心病的网络机制时, 综合运用疾病化学生物数据库Chemprot、 化合物-蛋白相互作用分析平台STITCH 4.0、 药效团虚拟筛选等三种靶标预测方法, 发现川芎嗪能作用于白细胞介素8、过氧化物酶体增殖物激活受体γ、 血红素加氧酶1 等10 种潜在靶标, 通过调节免疫、 炎症反应、 细胞凋亡信号通路调控及血液循环等7 种途径发挥治疗冠心病的效果。 目前常用的靶标预测工具见表3, 包括网络药理学分析数据库(TCMSP、 TCMID 等数据库的检索挖掘)、 Arrowsmith 知识发现工具[27]、 STITCH[28]、 ChEMBL[29]等化合物靶标分析平 台; PharmMapper[30]、 DRAR-CPI[31]、 idTarget[32]、 HTDocking[33]等反向分子对接服务器; AutoDock Vina[34]、 Discovery studio[35]等 分 子 对 接 软 件; drugCIPHER[36]、BATMAN-TCM[37]、 TargetHunter[38]等靶标预测工具。

表3 靶标预测工具

2.1 靶标数据挖掘 TCMSP、 TCMID 等数据库在提供中药成分信息时也提供了部分其潜在靶点信息, 但这些数据库仍存在对应靶标不全等情况, 人参皂苷Rh2、 天麻素等重要活性成分的靶点信息, TCMSP 数据库就未能提供。 因此在研究化合靶标信息时, 还需要综合考虑多种数据库和挖掘工具来收集其潜在靶点。 Arrowsmith 芝加是哥大学Swanson 教授[27]研制的基于非相关文献的知识发现工具,为研究中药靶标及其药理毒副机制提供了新思路。 2017年, 王仁杰等[39]通过构建龙血竭A 集合和缺血性脑卒中C集合, 运用Arrowsmith 工具发现两者密切关联的B 集合中含有环氧合酶-2、 一氧化氮合酶、 电压门控性钾通道等5个靶标, 推测以上靶点可能是龙血竭治疗缺血性脑卒中关键因素。 STITCH、 ChEMBL 化合物靶标作用平台是用于预测已知的化合物和蛋白质相互作用关系的平台, STITCH 服务器能通过置信度打分精确化合物与蛋白质相互作用的关系强度, 以川芎嗪为例, 设置相互作用蛋白为“Homo sapiens” (智人), score 为“medium confidence 0.400”, 发现川芎嗪能对应CFTR、 TNF、 IL8、 HIF1A 四个潜在靶标(图2)。 2014 年, 任真真等[54]以三七皂苷为研究对象, 利用STITCH、 ChEMBL 平台和药效团模型匹配方法, 并通过蛋白互作、 MCODE 聚类分析发现三七皂苷有189 个潜在靶点, 药效作用与环磷酸腺苷代谢、 血管伸缩、 血液凝固等生物过程密切相关。 此外一些化学、 药物数据库, 如Pub-Chem[55]、 DrugBank[56]等也可以挖掘一些天然化学成分的药物及其靶标信息。

图2 STITCH 平台的川芎嗪潜在靶标

2.2 反向分子对接与药效团匹配 正反分子对接技术、 药效团模型匹配是中药化合物靶标预测中不可或缺的重要工具。 早期的反分子对接软件, 如新加坡国立大学的INVDOCK[57]、 蒋华良团队的Tarfis Dock[58]等, 在药物靶标预测研究中均获得了良好的应用效果[59-60]。 在此基础上,蒋华良等推出了新一款药效团匹配反向找靶工具Pharm-Mapper, 该服务器整合了Target Bank、 Drug Bank、 Binding DB 和PDTD 四大数据库, 能快速获得药物的潜在靶点信息。 2018 年, 李静等[61]运用PharmMapper 成功预测款冬花止咳化痰主要活性成分的作用靶点, 并探讨了其多成分-多靶点-多通路的作用机制。 DRAR-CPI 是上海交通大学Bio-X研究所杨轮等采用DOCK 中的算法, 通过重叠球体定义受体分子潜在结合位点, 将药物分子与多个蛋白结合位点进行反向对接的服务器, 主要用于药物-靶蛋白相互作用的模拟研究, 该服务器规定Z′-score<-0.5 时化合物与靶点有潜在结合的可能性, 以川芎嗪为例, Z′-score<-0.5 的潜在靶标(同一靶标、 不同结合方式的, 仍按一个靶标计算,1T40_ 2 与1T40_ 1 为一个靶标) 共计101 个, 排名第二的靶标为与凝血密切相关的凝血因子X (PDB ID: 1FOR),其Z′-score =-2.31562, 见 图3。 国 立 台 湾 大 学 研 发 的idTarget 服务器是一款含7 864 个靶点的预测服务器, 也常用于中药化合物靶标预测, 但其运算速度较慢且2017 年12月维护后一直未能恢复运行, 与以上服务器相比不具优势。HTDocking 是一款基于二维结构和靶蛋白特征的反向对接服务器, 白雨等[51]用HTDocking 和PharmMapper 预测罗格列酮复方的靶标, 发现基于三维结构的PharmMapper 可能比二维结构式HTDocking 预测结果更有效。 对比以上几款反向分子对接、 药效团匹配服务器, PharmMapper 和DRAR-CPI 的综合性能可能更佳。

图3 川芎嗪与凝血因子X 反向分子对接

2.3 分子对接技术 除了现有的反向分子对接技术服务器、 分析平台外, 还可以在靶标数据库、 疾病基因组数据库挖掘与某个疾病相关的靶标、 基因, 构建疾病对应的靶标库, 利用分子对接软件进行靶标预测。 AutoDock vina 是Molecular Graphics 实验室开发的一款免费软件, 与该实验室早期产品AutoDock 相比, Vina 摒弃了拉马克遗传算法,回归了梯度优化寻找最小点, 精度更高、 运算速度也更快;Discovery studio (DS) 是Accelrys 的一款药物辅助设计软件, 其对接程序采用特征性算法, 在运输速度、 精度上优于Vina 软件, 但由于Vina 属于开发型软件, DS 为收费软件, 两者在推广使用上互有利弊。 史海龙等[62]在PDTD 药物靶标数据库收集了36 个抗肿瘤靶标, 利用AutoDock vina软件将土贝母皂苷甲与抗肿瘤靶标分子对接, 发现土贝母皂苷甲可能通过抑制酪蛋白激酶Ⅱ、 金属基质蛋白酶-8、胸苷酸合成酶以及微管蛋白等的活性, 发挥抗肿瘤作用。除AutoDock vina、 DS 软件外, Surflex、 DOCK、 iGemdock等软件也常用于靶标预测工作, 实际运用中也各有利弊。分子对接软件在研究化合物与潜在靶点相互作用时, 比反向分子对接服务器更为细致, 例如用AutoDock vina 探索川芎嗪与凝血因子X (PDB ID: 1FOR) 的相互作用情况, 见图4, 发现两者相互作用的亲和力为-5.3 kcal/mol, 能与结合的GLU-97、 THR-98、 TYR-99 等17 个0.4 nm 以内氨基酸残基相互作用, 但分子对接软件通过自建靶点库预测靶标的方法, 与反向分子对接服务器相比, 存在靶标少等缺点, 实际运用中应综合权衡考虑。

图4 川芎嗪与凝血因子X 分子对接

2.4 相似性靶标预测 利用药物-靶标相似性算法寻找中药化合物潜在靶标, 也是常用的靶标预测方法之一。 李梢等[36]构建的drugCIPHER 是一款利用相似性线性回归模型,并结合药理空间和基因组空间关联算法的靶标预测工具,在预测葛根芩连方治疗2 型糖尿病的网络药理机制时, 表现了良好的预测性能[23]。 BATMAN-TCM 服务器是由刘中扬等组建开发的一款一站式网络药理学平台, 其靶标寻找方式是基于Perlman 等[25]的SITAR 概念, 利用药物之间的结构、 副作用、 ACT 分类系统、 药物诱导基因表达、 化合物相互作用分数的相似性。 以及靶点之间氨基酸序列、 蛋白互作网络接近中心性、 GO 功能富集的相似性, 利用逻辑回归、 “弃一法交叉验证” 构建的一种靶点预测工具, 曾预测了芪参颗粒治疗冠心病的多靶点药理机制, 并在实验验证中得到了很好的证实[63]。 TargetHunter 是一款能根据化合物2D 结构相似性, 整合ChEMBL、 文献、 PubMed 信息, 反向挖掘化合物靶标的服务器。

2.5 药物靶标数据库 生物信息学、 分子生物学的发展,促生了许多药物、 蛋白质、 基因组数据库的产生, 正是在这些数据库的基础上, 新一代靶标预测工具才能层出不穷,日渐应用于网络药理学的研究。 同时, 各种组学技术、 网络药理学、 系统药理学的发展, 也对药物、 蛋白质、 基因组数据库提出了更高的要求, 进一步推进了数据库的构建与发展。 信息比较全面的药物靶点、 基因组数据库包括TTD[64]、 GeneCards[65]、 CTD[66]、 DrugBank[56]、 OMIM[67]、PDB[68]、 Uniprot[69]、 Binding DB[70]等, 见表4。

表4 药物靶点、 基因组数据库

3 结语

网络药理学分析平台、 中药数据库、 靶标预测技术的构建发展, 为研究中药药效物质基础及作用机制, 阐明其疗效好、 安全性高、 多组分、 多靶点的作用特点带来了新的思路和策略, 也为中药现代化与国际化现代化发展指明了新的方向[71-72]。 传统的研究方法主要依靠药化、 药理实验, 存在通量低、 精度不高、 周期长、 费用大等问题, 利用生物信息学、 计算机技术与实验相结合的方法研究中药的药效成分、 潜在作用靶点, 突破了传统研究的不足, 更加快速灵活, 准确率更高, 目前已广泛应用于中药网络药理学研究。

但现存的一些中药网络药理学分析平台、 中药成分数据库、 靶标预测技术仍有一定不足, 有待发展。 中药成分数据库提供的化学成分信息, 多为体外分离提取的成分,未涉及体内药代动力学、 血清药化学领域内容, 但中药真正发挥药效作用物质是其血中移行成分[73]。 秦建平[74]利用UPLC-Q-TOF-MS 技术, 推断出天舒胶囊中24 种血中移行成分, 其中13 种为原型成分, 11 种为非原型成分。 若仅以中药体外分离成分为研究对象, 进行靶标分析、 网络药理学研究, 难免会与药物实际效果产生一定偏差。 李圣耀等[75]通过挖掘清心解瘀方中入血成分, 利用BATMANTCM 平台进行网络药理研究, 发现清心解瘀方能治疗多种心血管疾病, 并对慢性阻塞性肺病、 抑郁也有一定药理作用, 与其实际适应症基本相符。

药物-靶点预测技术是网络药理学研究的核心内容之一, 但不论是数据挖掘、 药靶相似性算法, 还是正反向分子对接技术, 都存在诸多问题, 如数据挖掘时药物命名复杂, 数据源信息假阳性误差; 相似性算法精度不高, 药物与靶点关联性差; 反向找靶标预测工具所依赖的靶标数据库信息不全或假阳性, 靶蛋白三维结晶精度不高, 模拟分析与体内实际情况差距大[76-77]。 因此, 开发新一代高标准、 高精度、 高智能化的中药化学数据库、 靶标预测工具,综合使用多种成分、 靶标挖掘技术, 并结合相关实验验证,是今后中药网络药理学研究的主要发展方向之一。

猜你喜欢
靶标药理学靶点
纳米载体可缓解农药对靶标作物的负作用
基于药理学分析的护理创新实践探索
基于网络药理学探讨血府逐瘀汤治疗失眠的作用机制
维生素D受体或是糖尿病治疗的新靶点
“百灵”一号超音速大机动靶标
基于网络药理学探讨搜风愈喘方拆方“祛宿痰方”调控儿童哮喘的作用机制
温经汤治疗原发性痛经的网络药理学作用机制
肿瘤免疫治疗发现新潜在靶点
基于一致性学习预测药物-靶标相互作用
纳米除草剂和靶标生物的相互作用