补血中药研究热点与发展前沿的知识图谱分析*

2019-10-22 03:06张倩茹李光耀曲靖雯廖清清胡元佳郑传痴张婉婷
世界科学技术-中医药现代化 2019年7期
关键词:四物汤方剂聚类

张倩茹,李光耀,曲靖雯,廖清清,胡元佳,郑传痴,张婉婷**

(1.遵义医科大学药学院 遵义 563000;2.澳门大学中华医药研究院 澳门 999078;3.遵义医科大学附属医院药剂科 遵义563000)

补血中药指具有滋养营血功效的补益类中药,包括地黄、当归、何首乌、阿胶、白芍、鸡血藤、枸杞子、桑葚、大枣、桂圆等临床常用药材[1,2]。补血中药及其复方在临床上常用于治疗多种疾病,包括多种类型贫血[3-5]、冠心病[6]、肺纤维化[7]、放化疗引起的骨髓抑制[8]等。随着补血中药相关研究的日益深入,文献信息量迅速增长。因此,文献的手动检索已难以展现研究领域的全貌和进程。

科学知识图谱是科学知识的可视化呈现,能从时间及空间维度发掘、绘制、分析、归纳、揭示知识结构和知识领域[7]。本研究基于科学知识图谱,以中国知网(China National Knowledge Infrastructure,CNKI)为文献数据来源,利用CiteSpace 软件[8,9]可视化分析补血中药二十年间的研究进展与现状、研究领域的空间动态分布,从而揭示研究热点和前沿趋势。

1 数据与方法

1.1 数据

以CNKI 为数据来源,检索从1998 年1 月1 日至2017 年12 月31 日期间,发表在SCI 来源期刊、EI 来源期刊、中文核心期刊上的补血中药的相关文献(检索截止时间:2018 年5 月4 日)。检索方式包括主题词、关键词、篇名3 种。学科领域为全部领域,检索策略为(“补血”or“养血”or“血虚”or“营血”)and(“中药”or“药材”or“中草药”or“中成药”or“方剂”or“复方”or“中西医”)。

1.2 方法

1.2.1 数据处理

从CNKI 中导出1253 篇文献数据,并保存为“Refworks”格式。导出的数据文件包含题名、作者、机构、关键词、摘要、年份、期刊等信息。通过CiteSpace软件内置的格式转换器将文献数据文件转化为“download_***.txt”格式。进一步去除综述、评论、报告等类型文献以及重复文献,最终有1182篇纳入分析范围。

图1 近20年补血中药相关研究论文发表情况(1998-2017年)

1.2.2 参数设置/分析条件

用CiteSpace v5.2.R2 对补血中药相关研究的关键词(keywords)进行共现性分析。设置CiteSpace参数条件如下:①时区范围(time slicing)为1998 年-2017 年,时区选择(year per slice)为1 年;②阈值(top N per slice)为10% ,即在每个时区中选择前10% 、但少于100个的高频关键词。

1.2.3 知识可视化分析

以文献的关键词为节点、关键词在文献之中的共现关系为连线,构建补血中药相关研究的关键词共现网络。通过分析关键词共现网络的关键节点和聚类结构,揭示补血中药的研究热点以及演化前沿。研究热点的具体表现为重要的、关注度高的关键词,关键词在网络中的重要性可用网络中心性(centrality)进行评价,而关键词短时间内受关注的程度可用突现性(burst)进行衡量。另外,为探讨相关研究的演化趋势和最新前沿,基于对数似然率算法(Log-Likelihood Ratio,LLR)方法对关键词进行聚类分析。

2 结果

为使关键词共现网络的分析结果清晰而规范,对同义但不同表述的关键词进行人工合并,如“熟地”、“熟地黄”合并为“熟地黄”、“于术”、“白术”为“白术”、“中西医结合治疗”、“中西医结合疗法”、“中西医结合”合并为“中西医结合疗法”等;排除常规词汇如“薄层板”、“供试品”、“展开剂”等以突现重要关键词。通过统计20年间的文献发现(图1):2007年、2015年、2016年的文献发表量最多,分别为91篇、80篇、78篇,共占发表总数的21.1% ;2004年、2007年、2015年出现的高频关键词最多,分别为43个、24个、21个,共占总数的23.9% 。

关键词共现网络由170 个节点和671 条边所构成。节点采用历史年轮的方式以表示关键词出现的时间和频次。节点年轮的颜色从蓝渐变为红,表示关键词出现的历史由远(1998年)及近(2017年);年轮厚度与关键词出现频次成正比,厚度越大则关键词出现的频次越高,反之亦然。边代表两个关键词的共现关系,边的颜色代表关键词聚类的情况,边的粗细反映两个关键词在文献中的共现频率(图2),边越粗,表明关键词的贡献频率越大。

2.1 关键词共现分析

关键词是对文献内容的高度概括和凝练,可集中反映研究的核心思想和重要信息[12]。利用CiteSpace v5.2.R2分析关键词的网络中心性和时间突现性,可有效探寻研究核心问题。通过文献高频关键词分析,发现补血中药的研究内容主要包括:药材及方剂的质量标准(71)及质量评价(8)、用药规律(40)及配伍规律(20)、生物机制(27)、药材炮制加工(8)等;21 种研究较多的中药,其中频次大于10 的有当归(188)、白芍(99)、何首乌(54)、黄芪(29)、川芎(25)、丹参(12)、赤芍(12)、地黄(12)、阿胶(11);中药方剂及中成药共16种,主要有四物汤(33)、当归补血汤(22)、归脾汤(14)等;相关疾病有21 种,包括骨髓抑制(4)、不孕症(4)、失眠(4)、卵巢早衰(4)、银屑病(4)等;补血中药的生物机制研究涉及免疫抑制(6)、细胞凋亡(5)、免疫功能(4)、抗氧化(4)、免疫应激(2)、细胞增殖(2)等8种。

2.1.1 中心性分析

节点在网络中的重要性由中介中心度(Betweenness centrality,CB)表示,CB越大则节点越重要。一般认为,高中心性关键词(CB>0.1)在网络中具有重要意义[8]。如表1 所示,补血中药的关键词共现网络中发现了10个高中心性关键词(CB>0.1),其对应的节点在网络图中用紫色轮廓线进行强调(图2)。结果表明,当归、白芍和何首乌是补血中药的重要研究领域;以四物汤为代表的方剂研究是当前重要研究方向。另外,“当归”(#2)、“用药规律”(#2)、“方剂”(#3)、“活血化瘀药”(#3)、“补血药”(#1)、“何首乌”(#1)等重要关键词分布于网络的不同聚类,从而成为连接不同研究领域的重要枢纽。

2.1.2 突现性分析

图2 补血中药的关键词共现网络

关键词突现性(burst)系关键词在文献中出现频次的变化率,代表关键词在短时间内受关注的程度,突现性越大则受关注程度越高,进而可呈现出研究领域的演进。1998年-2017年,补血中药文献中共有25个突现关键词,能清晰揭示研究热点的转移情况(表2)。在突现关键词的气泡图中(图3),横坐标(x轴)为关键词出现的最终年份,纵坐标(y轴)为关键词的突现率,气泡大小表示关键词突现的时间跨度。另外,以2000年和2010 年为时间节点为突现词起始年份划分时间区间,25 个突现词被分为3 个时区:1998-1999 年(8个)、2000-2009年(6个)、2010-2017年(11个)。由气泡图可知,“方剂”的突现率最高(19.52),“中西医结合疗法”的持续时限最长(9年)。

突现关键词的气泡图直观反映了25 个突现词在短时间内受关注程度的变化,揭示了研究热点的演化进程(图3)。分析补血中药研究在三个时区的演进特征可发现:①1998-1999 年,“方剂”的突现性最高(19.52)、“中西医结合”的时间跨度最长(9年),表明此时段的研究热点是收集整理方剂/医案、观察中药/方剂的临床疗效;②2000-2009年,“高效液相色谱法”的突现性最高(15.55)、“含量测定”、“薄层色谱法”的时间跨度最长(7 年),说明化学成分分析和质量研究是研究的主要内容;③2010-2017年,“聚类分析”的突现性最高(15.55)、“关联分析”和“药对”的时间跨度最长(7 年),表明该时段的研究热点是中药配伍规律。研究热点的演化,可表明补血中药研究领域在不同时期的核心问题,也有助于预测未来一段时期内的研究趋势。依据突现词的初始年份和持续时长进行判断,“何首乌”(4.6093)和“数据挖掘”(9.3132)可能会是今后两个较为重要的研究热点。

表1 前10位重要关键词(CB ≥0.1)

图3 25个突现关键词的气泡图

表2 关键词共现网络的聚类汇总表

2.2 聚类分析

网络聚类分析有助于发现研究领域的分布情况和科学前沿。补血中药关键词共现网络有6 个聚类,分别用不同的色框表示节点的聚类范围(图2)。聚类中的关键词越多,表明该聚类越重要。#0是规模最大的聚类,其聚类标签为“高效液相色谱法”,突出反映了该聚类所代表的研究领域以质量评价、质量控制等化学成分研究为主(表2)。

聚类系数Q 和平均轮廓值(mean silhouette,S)是网络聚类分析的两个关键参数,用于分析网络聚类质量。用CiteSpace 软件分析关键词共现网络聚类的质量,聚类系数Q为0.4415(>0.3),表明网络聚类的划分具有显著性。6 个聚类的轮廓值范围在0.6-0.9 之间(>0.5),表明网络聚类的质量较好(表2)、同一聚类中成员的同质性较高,不同聚类之间可进行相互区分。聚类6的轮廓值最高,其次依序为聚类3和聚类4(表2)。

中间年(mean year)是聚类中关键词出现年份的中间值,提示不同研究领域的演化历程。聚类的中间年份表明,补血中药研究领域近20 年来的演化进度为:前期研究以中药方剂的临床应用和中医药理论探索为主,即聚类1、3、4;中期研究以质量评价和质量控制(聚类0)和生物作用机制(聚类6)等为代表;近期研究则以安全性和有效性评价(聚类5)、用药规律挖掘(聚类2)等为主导。

2.3 时间线视图

网络聚类代表不同的研究领域。时间线视图(图4)可视化呈现每个聚类的时间跨度以及不同聚类之间的关联,从而能清晰展示补血中药研究的演化进程。时间线视图的横坐标(x轴)为文献发表年份、纵坐标(y轴)为聚类编号。聚类0(0.659,“高效液相色谱法”)、聚类2(0.681,“当归”)、聚类4(0.773,“辛凉解表药”)的时间跨度最长,聚类5(0.648,“四物汤”)代表的研究领域,其时间跨度从2000年延续至今(图4)。

3 讨论

3.1 研究热点

图4 时间线视图

本研究综合分析关键词的重要性和突现性,探讨补血中药的研究热点和研究热点的演进历程。通过综合分析关键词的中介中心度和突现性,发现六个关键词(“方剂”、“补血药”、“四物汤”、“何首乌”、“活血祛瘀药”和“用药规律”),同时具有较高的网络中心性和突现性。表明它们既在补血中药的研究中占据重要地位,也在短时间内受到广泛关注。尤为重要的是,“何首乌”(2015-2017年)和“用药规律”(2012-2017年)是近年来的研究热点和科学前沿。

何首乌是常用补血中药,具有降血脂及抗动脉粥样硬化、抗脂质过氧化、增强免疫功能、心肌保护、调节神经内分泌系统、改善记忆、增强造血功能、抗炎等药理作用[13,14]。然而随着何首乌临床应用的普及,其肝毒性有关报道日益增多。国家食品药品监督管理总局于2014年发布通报,提醒口服何首乌及其成方制剂有引起肝损伤的风险,超剂量、长期连续用药等可能会使风险增加[15]。自2015年起,何首乌成为补血药的研究热点,主要研究内容包括肝毒性/肝损伤物质基础、药材质量控制、药理活性和生物作用机制等。

补血方剂“用药规律”研究基于数据挖掘和数据分析方法,深入探索补血方剂的用药特点、组方规律和配伍关联。主要内容包括应用计算机技术建立中药特征数据库[3]、用数据挖掘方法分析方剂用药规律[16]、定量研究药对配伍相互作用[17]、药对在方剂中的配比与所治疾病之间的关系[18]等。探讨补血方剂的用药规律,有助于发现补血方剂临床用药的规律特征,揭示不同流派学说指导下方剂的共性组方原则,发掘药材配伍关系,阐释中医药理论与临床用药的关联,并为中药新药研发提供有力依据。

3.2 科学前沿及趋势

关键词的网络聚类可反映补血中药研究的科学前沿。在关键词共现网络中,聚类2 的中间年(2011 年)是距今最近的年份,具有规模较大、同质性较好的特点。并且聚类2中有6个突现词(“当归”、“配伍规律”、“用药规律”、“药对”、“聚类分析”、“中医传承辅助平台”)和2个重要关键词(“当归”、“用药规律”),因此聚类2可能成为补血中药研究的新领域。当前补血中药的科学前沿主要集中在:①当归药材的质量评价与质量控制;②阐释中医药理论的科学内涵;③基于数据挖掘及数据分析方法研究中药的用药规律。

当归是著名补血活血中药,具有补血活血、调经止痛、润肠通便功效,临床上常被用于与活血药、补气药配伍,起到协同增效作用。当归的质量评价、药对协同作用机制是重要的前沿趋势。杨扶德等[19]基于熵权TOPSIS 模型,以8 种成分的含量为指标构建多指标评价体系,综合评价当归药材质量,为当归的质量控制提供参考。刘丽芳等[20]对当归中二氧化硫残留量进行动态检测,并用UPLC-QTOF-MS/MS 对不同硫磺熏蒸时间当归中的含硫衍生物进行半定量测定,统计结果表明,二氧化硫残留与含硫衍生物含量可作为硫磺熏蒸当归的质控指标。邓常清等[21]分析黄芪-当归对骨髓造血功能的影响,发现当归促造血活性强于黄芪,两者配伍可起到协同增效作用。段金廒等[22]比较当归-川芎药对3种血虚动物模型的补血作用,证实当归-川芎药对与单味药相比,在外周血指标、免疫器官及能量代谢酶调节方面均体现出不同程度的增强。金益等[15]采用响应曲面分析法定量研究补血中药配伍的相互作用,阐明了当归-红花药对大鼠急性血淤模型活血效应相互作用的范围、性质与程度,为药对研究提供了新思路和新方法。

四物汤是补血和血的中医经典方剂,由地黄、当归、白芍、川芎四种药材组成,临床上可随证加减衍化为桃红四物汤、血府逐瘀汤、少腹逐瘀汤、香附四物汤、芩连四物汤等。四物汤及其类方研究的主要内容有药理作用、活性成分及作用机制、药材配伍规律等。万东等[23]观察四物汤对贫血大鼠模型的影响,发现四物汤能明显改善贫血大鼠的外观、提高脾指数和胸腺指数,即与模型组相比,HGB和PLT升高(P<0.05),WBC显著升高(P<0.01);此外,四物汤能有效提高骨髓增殖能力,上调EPO mRNA 的表达。宿树兰等[24]采用网络药理学方法预测四物汤类方主要活性成分的分子作用机制,通过网络分析探索其“多成分-多靶点-多通路”的复杂关系,发现四物汤中的藁本内酯、正丁烯基酜内酯、川芎内酯、阿魏酸、没食子酸、芍药苷、焦地黄素A、梓醇等主要活性成分,可能涉及神经-内分泌-免疫等相关的51 条通路。段金廒等[25]基于“以药类方”的思路和方法,从中医方剂数据库中获得含四物汤中任意3 味药材的方剂共5842 首,用Apriori 算法分析四物汤类方中的药材配伍关系,发现当归是类方的关键环节,“当归-地黄”药对为核心药对。

本文基于科学计量学方法分析了补血中药的研究现状,通过纳入近20 年发表的1182篇研究型文献,较为明晰地呈现出相关研究领域的演进趋势和当前热点。补血中药的研究在药材/方剂的化学成分分析、生物机制、验方分析、方剂配伍规律等多个方面已获得突破性进展,然而一些问题也随之产生。当前研究面临的挑战主要集中在:①“补血”中药在临床上广泛应用于多种疾病治疗,但临床有效性和安全性依然需要大量可靠数据的支持;②补血中药当前研究热点以化学成分分析及含量测定为主,而药理、药效、活性机制等方面的研究则相对薄弱;③名老中医临床验方的统计分析积累了海量数据,为探索补血中药的临床用药经验起到重要作用,但由于缺乏对不同验方的整体性、综合性分析,还不能完全揭示补血中药的核心用药规律;④方剂配伍规律研究有助于发现重要药材、潜在药对,但还需要构建合理的数学模型和体内外实验方法,或在临床上对预测结果加以验证。

依据知识图谱分析结果,我们针对当前补血中药研究中出现的问题提出以下建议:①由于中医“血虚”、“补血”的观点还不能为现代医学所完全解释和接受,因此需要加强临床补血中药治疗效果评价及相应的药理学和生物学研究,并借此阐明中医药相关理论的科学内涵;②随着人们对补血中药的需求和应用日益广泛,以何首乌滥用导致药源性肝损伤为代表的药品不良事件也逐渐增多,因此迫切需要建立和完善补血中药的质量控制和评价体系,加强对补血中药临床使用安全性和有效性的全面监控以及用药指导;③补血中药(尤其是动物来源药材)的药效活性成分、毒性成分并不明确,因此还应借鉴不同学科的研究方法和研究思路,特别是系统生物学、计算机技术等前沿学科,对补血中药的生物活性物质及药效活性、毒副作用、体内代谢过程展开系统而深入的研究;④由于中药方剂是中医对病人进行个性化治疗的主要手段,具备了大量性、多样性、时效性等大数据特征,因此可采用大数据分析方法并依据中医药理论基础和临床应用,从系统层面建立合理、精准、可靠的数学模型以发现中药材配伍及组方的潜在规律,为中药新药的研发提供理论支持。

猜你喜欢
四物汤方剂聚类
基于基因表达谱相似性的四物汤重定位及抗乳腺癌有效成分群辨识
中医医案方剂多维相似度算法设计与探索
《金匮要略》黄芪类方剂探析
基于K-means聚类的车-地无线通信场强研究
柴胡汤类方剂用于肝恶性肿瘤治疗进展
论方剂的配伍环境
四物汤有效成分的关联性分析
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法