赵苗青,李丰,石彬彬,李燕
(1.河南工程学院土木工程学院,河南 郑州 451191;2.大连理工大学化工学院,辽宁 大连 116024;3.郑州元草珍中医药研究院有限公司,河南 郑州 450000)
系统药理学,即从系统的水平研究药物与有机体之间的相互作用规律和作用机制的一门学科。该新兴学科从分子、网络、细胞、组织、器官等不同水平上研究药物是如何引起机体功能变化来治疗疾病的,从而建立起药物对于机体的作用从微观(分子、生化网络水平)到宏观(组织、器官、整体水平)的各水平间相互关联的学科[1]。2008年和2010年,在第一、二届定量与系统药理学研讨会上,科学家们讨论是否能够通过将系统生物学与系统药理这两个学科之间的交叉,融合出一个新的学科定量与系统药理学。2011年,美国国立卫生(NIH)发布的《定量与系统药理学》白皮书中将定量与系统药理学定位为转化医学的核心学科,该成果标志着系统药理学新学科的诞生,该学科的成立引起了科学界的研究热潮。中药当前研究的主要障碍在于物质基础不清、作用机理不明[2]。组分的多样性、靶点的不确定性以及药物之间、靶点之间复杂的相互作用,使得中药研究面临巨大的困难。中医药作为一个体系庞大的复杂系统,单纯地采用实验方法实现中药系统的、完整的、科学的评价是一项非常困难的工程。显然,解决复杂问题最好的一条途径就是计算机技术和实验技术的结合使用,这也就是中药系统药理学的核心任务。到2012年国内外首个系统药理学数据库TCMSP数据库出现,该数据库提供的数据为该学科学者的科学研究提供了极大的便利。TCMSP(Traditional Chinese Medicines Systems Pharmacology Platform)数据库是一个全新的、以系统药理学为基础的中药研究平台及数据库。笔者从TCMSP数据库的基本情况、应用及影响对该数据库进行论述。
2012年9月30日,由西北大学王永华教授所在的计算生物学实验室建立的系统药理学分析平台——TCMSP数据库版本1.0正式诞生,此后的两三年内,该数据库不断升级换代,经历了自纠,ADME参数升级,增加功能模块等多个过程。在2013年9月补充了一些重要药代学参数,如BBB、 HDon、Hacc参数。2013年11月对数据库进行了优化,数据库更新成2.0版本的TCMSP数据库。2014年1月加入了FASA-、TPSA、RBN和Half-life等重要参数。2014年3月到2014年5月,数据库更新成为TCMSP2.3版本,并沿用至今。TCMSP可以给出《中国药典》收录中草药的活性组分、重要的ADME参数的数值、类药性、分子在体内的作用靶点、能调控的通路,以及涉及到相关的疾病。该数据库可以帮助使用者方便且准确地找到某一味中草药的各类物理化学性质,该数据库能用于化学、生物学和药理学方面对中草药机理的深入研究、新药的开发以及中医药基础理论的科学解释上。另外,TCMSP还包含了一些网络图水平上的中医药理论可视化分析工具,将有助于医药研发学者开发新的候选化合物、揭示中药各成分和各靶点之间的互作关系。数据库界面如图1所示。
1.2.1 TCMSP数据库内容
TCMSP数据库能从草药成分、疾病和靶点等方面提供系统药理学研究必需的信息。从中草药成分来看,该数据库给出了中药组分的结构及其相关的ADME性质。ADME是指机体对外源化合物的吸收(absorption)、分布(distribution)、代谢(metabolism)及排泄(excretion)过程,是药物的转运和转化[3]。该数据库在分子水平上研究中药成分的成药性,提供了多达12种最为重要的药物性质如(物理化学性质,药代动力学性质)包括口服利用度[4](OB)和半衰期(HL)以及类药性(DL),FASA[5],透过性(Caco-2),血脑屏障(BBB)和分子性质参数:AlogP、Hdon (氢键供体数)与Hacc(氢键受体数)、RBN(可旋转键数)、TPSA (拓扑分子极性表面积)和MW (分子量)。这些参数对于药物分子来说是十分重要的药代动力学参数。针对这些问题,目前生物科学界已经开发了一些预测能力很好的预测模型,包括P-糖蛋白底物识别模型、口服药物吸收模型、小肠吸收以及代谢模型等[6-15]。以OB(oral bioavailability)为例,对于口服的药物来说,药物必须在胃、肠道被吸收,才能进一步进入血液循环发挥疗效,合适的肠液溶解性、肠膜渗透性具有关键意义。因此,口服生物利用度是评价药物能否开发的一个重要指标。该数据库应用口服利用度系统OBioavail1.1,将P-糖蛋白吸收、代谢稳定性、血浆蛋白结合等多种ADME过程耦合起来,采用多层决策技术,最终实现了OB参数的预测[4]。该数据库提供的这些ADME参数可以为研究者评估药物分子的药代动力学性质提供了很大帮助。
该数据库给出了多达3 311个靶点蛋白的相关信息。根据化合物-靶点的对应关系和靶点-疾病的对应关系,该数据库给出了两个方面的内容,一是实验已验证的药物-靶点组合,二是对于没有实验数据支持的药物-靶点组合,采用数据库特有的WES模型进行预测[16]。在药物开发和药物重定位研究中,解密药物直接靶标的过程十分重要,但这一过程总是费时费力。因此,开发出一种可靠的计算方法来预测药物的直接靶标对于药物研发来说非常重要。加权系综相似度法(Weighted Ensemble Similarity,WES)能预测药物和靶标的结合。该预测方法对药理学最相关的结构参数赋予权重,保证了WES模型可以得到较高预测精度。另外,WES模型从系综的角度对药物的相似度进行了定量刻画,认为一个靶标结合的分子群构成一个系统,这比传统的单独比较单一分子之间的相似度具有更高的适用性和鲁棒性。实际上,WES模型是当前世界上规模最大的、基于超过900 000个蛋白-靶标结合关系实现的、并同时进行了实验验证的数学模型。这些优良性能将必然保证WES 模型在药物靶标识别以及药物重定位中发挥重要作用[17]。
除了活性成分和靶点信息之外,该TCMSP数据库还提供了分子和靶点对应的837个涵盖了生活中最常见的相关疾病信息,如可传染性疾病、免疫源性疾病、代谢病、内分泌疾病等。其中癌症和心血管疾病是危害人类身体健康的两大类疾病,TCMSP数据库还附加了癌症和心血管两个疾病数据库。
1.2.2 TCMSP数据库的功能,特点和优势
TCMSP数据网页包括六大部分,即主页、搜索指南、TCMSP用户手册、浏览、下载和参数信息。用户可以通过在主页输入中药名称、组分化学名称、InChI-key、CAS号、靶点名称或者疾病名称进行搜索,该数据库的功能:目前国内外查找中药化合物成分的数据库还有TCMID[18]、CHEM-TCM[19]、HIT[20]、TCM database@Taiwan[21]但是通过多个方面的比较,综合来讲TCMSP数据库是最优的。TCMSP数据库其特别的价值在于:
1)TCMSP首次囊括了《中国药典》(2010)注册的所有499种中草药,和其所含的共29 384个成分化合物,13 144个分子(不包含中草药之间的重复成分)。
2)查询药材包含的成分及其结构信息,并且为药材成分提供多种关键的药代动力学性质,如口服生物利用度、血脑屏障、肠上皮通透性、脂水分配系数等。可根据化合物成分反向筛选包含该成分的各种中药材。根据靶点蛋白反向查找其对应的药物分子成分以及对应的药材信息。
3)TCMSP为每个化合物提供了作用靶点及相关疾病信息;信息的反向检索也可以实现,即从靶点到分子的检索。
4)根据靶点查找对应的相关疾病,并进行靶标和疾病关联分析。
5)构建中草药的成分-靶点药理学网络和靶点-疾病药理学网络,以进行网络药理学机制分析。使用者通过建立化合物-靶点互作图,靶点-疾病互作图,可以深入研究中医理论和中药材的作用机制。
6)TCMSP数据库是唯一可以对根据中药成分的各种药理学性质来筛选药理学性质较优成分的数据库。TCMSP数据库平均为每味中草药提供了58个活性成分,是所有数据库中最高的,说明TCMSP数据库为中草药提供的组分更全。其他数据库的数据要么是不能下载、要么是部分可下载,而TCMSP数据库的数据是全部可以免费下载的。此外,TCMSP还提供了一个独特的网络药理学功能,能帮助使用者自动构建和生成药物-靶点及靶点-疾病网络,为采用系统药理学方法对中草药和复方作用机理进行解析提供了捷径。
1.3.1 CancerHSP——系统药理学抗癌中药数据库
天然产物是目前抗癌药物开发和癌症治疗中的巨大资源,然而,目前尚缺乏抗癌天然产物的潜在的药理机制方面的研究及其抗癌数据,这给攻克癌症带来了巨大阻碍[22]。该平台还附加了一个非常实用的系统药理学抗癌中药数据库(CancerHSP,Anticancer herbs database of systems pharmacology),该数据库一共收录3 575个抗癌活性成分。在分子方面,数据库提供了分子的9个ADME参数以及对应的药理学抗癌活性参数包括IC50、ED50等,并标注了分子所作用的癌症细胞系(610个不同的细胞系)。此外,数据库提供了通过模型预测和文献搜索得到的抗癌活性分子对应的靶标。CancerHSP 有助于揭示天然产物抗癌的机制,促进抗癌药物发展,尤其在抗癌新药开发以及药物重定位方面提供巨大的便利,给广大中医药科研工作者提供了极大的便利和帮助,数据库界面如图2所示。
图2 CancerHSP数据库主界面
1.3.2 CVDSP——心血管疾病系统药理学数据库
目前,心血管疾病是威胁人类生命健康的另一大类疾病。心血管疾病是指由于心脏和血管病变而引起的一系列疾病,包括心律失常、高血压病、冠心病和心绞痛等,其发病率、死亡率、复发率高,并发症多,对人体健康危害极为严重[23]。关于心血管疾病的治疗,西药和手术治疗疗效很好但是药物有很多不良反应。而中医药由于药效稳定、作用可靠而越来越受到重视,在心血管疾病治疗中的应用越来越广泛[24]。CVDSP(Cardiovascular Disease Systems Pharmacology database)是基于TCMSP数据库数据基础上开发的另外一个提供心血管药物药理学信息的专业数据库。CVDSP数据库在TCMSP数据库的基础上收录了254个心血管药物、206个与心血管治疗相关的靶点、268个心血管疾病相关基因和98种心血管相关疾病。此外,该数据库创新性地探索了药物-靶点互作关系、基因-疾病互作关系、药物-指标互作关系和靶点-基因互作关系,以及相关的衍生网络(比如药物-药物网络和基因-基因网络),为治疗心血管疾病相关的中草药和复方开发研究提供了极大的便利。数据库主界面如图3所示。
图3 CVDSP数据库主界面
2.1.1 获取中药材结构研究中药材的物质成分基础和药理活性作用机制
众所周知,中药材的一大特性就是含有多种结构各异且种类不同的化合物。仅一味中药就可能含有几十种,甚至上百种成分。因此,获取中药材的具体成分也是中药研究的一大难点。而TCMSP给出了常见的499种中草药的成分,涵盖了从黄酮类、萜类、有机酸、甾体、生物碱等十几种的化合物,极大的提高科研工作者的工作效率。以新疆藏红花的研究为例,林昶使用水蒸气蒸馏法提取新疆红花的挥发油,通过气相色谱-质谱(GC-MS)联用法测定了新疆红花中的挥发油化学成分的相对含量[25]。使用了TCMSP数据库确定化学成分的分子结构并在线下载了mol2文件,基于这些结构分析了红花的关键成分和重要靶点,进一步分析了该药材药理作用机制,为该药材的临床应用及进一步开发提供了理论依据。
2.1.2 获取ADME性质和成分对应靶点
ADME性质评估是药物发现和优化过程中的关键步骤[26-27]。为能够预测一个化合物的类药性,TCMSP整合了大量的ADME性质,为药材成分查询多种提供关键的药代动力学性质,如口服生物利用度、血脑屏障、肠上皮通透性、脂水分配系数等。使用数据库可以很容易地筛选出满足这些性质的分子。例如,有学者在系统药理学方法研究白花蛇舌草抗非小细胞肺癌的工作中,使用到该数据库提供的数据获取了白花蛇舌草成分的ADME药代动力学数据[28]。在OB≥40%和DL≥0.18两个判据下,该作者获取了白花蛇舌草的活性成分并预测了活性成分的靶点。在后续的实验验证中,山奈酚明显的抑制了RAW264.7细胞株中脂多糖诱导的炎症,证实了该成分具有很好的药理活性。实验结果还确定了山奈酚能作用在靶点NOS2,NOS3和PTGS2上,该实验结果也符合数据库中给出的结果[28]。
2.1.3 新药开发和复方改良
中药复方是指由两味及以上中药材组成的,按照规定的加工和使用方法的,针对相对确定的病证而设的方剂,是中医方剂的主体。中药复方的特点是其所含化学成分复杂、药理作用具有多靶点多层次的特点,而且干扰因素众多。因此中药复方药理作用研究是一个典型的涉及到多成分、多靶点、多通路的综合的作用过程,研究难度颇大[29]。TCMSP数据库为中药活性物质的发现,新复方的开发和复方改良提供了重要依据。基于该数据库的成分和靶点数据,李鹏首先构建了心血管相关的药-靶网络,靶-靶网络和药-药网络,根据TCMSP数据库中已有ADME参数和反向药物靶点筛选功能,构建了心血管疾病有关的药物分子及其药理学数据库,并最终筛选出了丹参,红花和山楂三味药材作为治疗心血管疾病的新复方“红山丹”[30]。王景辉基于TCMSP数据,对依木萨克方中进行了药理分析,经研究对比发现,有无动物药对该复方的药理活性影响不大,考虑到维药依木萨克方中的动物药都十分珍贵,因此,该作者认为依木萨克方剔除动物药后对药效的影响不大,从而对该复方进行了改良[31]。
2.1.4 探索中药材以及复方的作用机制
中药及其复方的多成分、多通路、多靶点的特点使得其在分子作用机制中呈现出多效性和复杂性,因此,研究中药的分子作用机理非常困难。在TCMSP所提供的充分的药理数据和技术支持下,研究者可以更加深入地研究中药材和中药复方的药理学机制。例如,有学者整合了类药性分析、口服生物利用度的模型,通对著名中药材杜仲做了系统药理学研究,借用了数据库的相关活性数据,最终解释了杜仲治疗高血压和提高免疫力的内在机制[32]。有研究者基于TCMSP数据库进行了银杏叶的神经保护机制研究,研究发现银杏叶的大部分成分具有很好的类药性且活性成分的亲水性较好更容易被吸收[33]。Western blot实验和ELISA实验研究发现,银杏叶治疗心脑血管疾病的机理在于其活性成分GDJ对IL-6和TNF-α炎症因子具有抑制作用,该成分具有很好的抗炎活性。缺血再灌注实验证实了GDJ是通过激活PI3K/AKT信号通路,抑制TLR通路和NF-κB信号通路来最终发挥对缺血性卒中的神经保护作用的。有学者对心脑欣丸复方治疗心脑血管疾病的药理学和药效学为例子来剖析中药治疗复杂疾病的机制,该作者基于TCMSP数据库集成了文本挖掘、化学计量法、化学基因法和靶点定位组合方法,从分子到系统水平论证了整体医学在治疗复杂疾病中的效力[34]。因此,该数据库可以帮助专家学者更加深入地研究中医药的药理学机制。
2.1.5 揭示中医药理论的本质
揭示中医药理论的复杂性、神秘性和科学性是每个中药研究者追求的终极目标。TCMSP分析平台可以极大地帮助研究者实现这一目标。事实上,采用系统药理学体系,已经有若干研究尝试,成功地揭示了若干基础中医药理论,如补气、补血或者是 “君-臣-佐-使”理论等的本质[35]。有研究者基于此数据库并结合系统药理学方法,解释了气血的本质,阐明了人参等补气中药,当归等补血中药的分子基础和作用机制[36]。同样基于TCMSP提供的数据和技术,传统名方藿香正气治疗胃肠疾病的研究给出了该复方“君-臣-佐-使”配伍则的现代医学解释。具体为,广藿香具有广泛的生物活性对于胃肠疾病来说有直接的抗炎效果,是君药。紫苏和白芷有很好的抗菌效果并能治疗一些伴随症状比如腹胀、恶心、呕吐等,是臣药。甘草是引经药,不仅能提高其他药材成分的ADME性质促进其他成分的吸收还是很好的解毒剂,是使药[37]。这些研究为深入的理解中药药理学性质提供了新的机遇,也促进了新药的研发。
该数据库是国内外首个也是迄今唯一一个(基于系统药理学所建立的)中草药作用机制分析平台和数据库。自2014年被广泛应用至今,TCMSP数据库已在国内外引发广泛、深入研究和高度好评。单单对该数据库的建立、应用及推动中医药发展的意义进行详细报道的文章——“TCMSP: a database of systems pharmacology for drug discovery from herbal medicines”一文到2018年12月为止在全世界广泛传播[38],并达到了在科学界219次的高引用率。
由于在系统药理学技术出现之前,对具有“多成分、多靶点”特点的中草药及其复方的研究,无论从其药效(或活性)成分的筛选、作用靶点的探寻、作用机制的解析都是“盲人摸象”的做法,在黑暗中盲目摸索的耗时、耗力、耗材,但成效甚微的做法,这为中药现代化、国际化的推进和相应的药物开发设置了巨大屏障。随着系统药理学学科的出现和技术的崛起,其专门针对中药系统的复杂作用机制机理的研究技术迅速得到学习和推广。而TCMSP正是基于该技术基础上构建的第一个集合了中药的“成分-药代动力学性质-筛选-靶点鉴别-相关疾病”等多种信息整合的数据库,为系统、科学地研究和诠释中药作用机制,推动中医药发展和药物开发提供了巨大契机。基于该数据库对中草药研究带来的这种重大意义,目前全世界范围内有大量的中草药研究专家和学者都在使用该数据库提供的数据。图4为自2014年该篇介绍TCMSP数据库的英文文章问世以来,国内外使用该数据库数据和技术所发表及引用的文献情况,其中红色和蓝色分别为中、英文文章篇数。
图4 TCMSP数据库的引用情况
由图4可见,该数据库自2014年之初就被11篇英文文章引用,之后其被引英文次数后逐年、快速、稳步上升。至2018年10月其当年引用率为103篇英文。迄今为止,已经有259篇英文文章使用到数据库的数据。对于中文文章来说,该数据库的被引情况也基本呈现逐年上升趋势。2018年内有102篇中文论文应用到该数据库的数据,到目前为止,共有203篇中文文章(158篇期刊,45篇硕博学位论文)应用了TCMSP数据库的数据。另外,一些专门研究TCMSP数据库内容和系统药理学技术的讲学、培训班也应运而生,也促进了国内学术界和医药研究者对系统药理学技术和TCMSP数据库的重要性的认识和学习有关。此外,国内外使用TCMSP数据库和系统药理学技术来进行药物研发、中草药复方科学解析、中医药理论诠释的机构和单位也越来越多,如图5所示,目前已有109家国内单位包括各个中医药大学,各种药物研发机构和医院研究所使用该数据库获得了一定的科研成果。其中,从一级单位归属来看,中医药大学、医科大学和医学院有27所,医院、中医药研究所和药物研发公司有36所,其他大学和研究机构有36所,其使用TCMSP数据库所发表的研究成果篇数分别如图5(A)、(B)、(C)所示。
图5 引用TCMSP数据库的国内机构
以上数据均说明,该数据库自2012年面世以来,已经引起了科学界越来越高的重视。并为全世界越来越多的科学家和医药从业者、开发者所使用。TCMSP数据库也由此受到了业界的很多赞誉。值得注意的是,韩国科学家黄相月,肯定了TCMSP数据库的效果,并指出中国TCMSP数据库对于多种处方、中草药提供了具体的信息和成分方面的信息。该文献认为TCMSP数据库为中药复方和单味药材提供了非常丰富的成分、靶点以及相关疾病方面的资料,该数据库包含了对传统药物的有效性和安全性的多重研究。该文章为韩国引入了TCMSP数据库和系统药理学研究方法,认为这两者为基础展开“药物-成分-靶点-疾病”等各要素之间的相互关系的网络分析的研究,能填补传统药物基础研究领域的一些空白[39]。在数据库刚刚报道之初,新加坡国立医院的教授Yeh Ching Linn就在Evidence based complementary and alternative medicine上高度认可了TCMSP数据库,说:“在中国,研究者开发了一个中药系统药理学数据库。它是一个包含了中草药的药物化学及药代动力学等特性的综合信息的分析平台,为促进中草药来源的药物开发工作提供了帮助。”德国学术刊物《Zeitschrift für Chinesische Medizin》则在数据库报道的第一时间在其刊物的扉页上做了专题报道[40]。
TCMSP数据库通过基于复杂结构、组学和网络的系统分析来探索有效成分和目标,整合和系统化所有传统的中医药宝贵资源和知识,推动治疗复杂疾病的新药开发,推动系统药理学在整个中医学科中的作用。TCMSP具有大量含ADME特性的中草药条成分,以及识别药物靶网络和药物酶网络的能力,这将揭示中草药的作用机制,揭示中医理论的本质和发展 新的中草药导向药物。通过TCMSP,研究者可以方便、准确地找到中药的各类性质,并将其用于中药机理的深入研究、新药开发或中医药基础理论的科学解释上。在TCMSP之后的版本中,将逐渐添加更多的药物以及药理学、毒理学数据,希望为读者深入研究中医药理论和实践提供更多借鉴和帮助。
1)添加更多的药物和药理学数据,例如药物作用模式:刺激和抑制,各种疾病的药物组合等(迄今,已更新至所有最常用的800多种中药,添加超5 000多个中草药分子。
2)补充更多的物理、化学和药代动力学性质参数。
3)将实施基于生理学的药代动力学(PBPK)方法,以提供更真实地描述物质在各种组织和器官中的行为。