基于CiteSpace的中医药治疗高血压知识图谱可视化分析※

2022-03-22 08:18王佳博蒙元洁冯甜甜许世洁吴建军樊景春
中医药通报 2022年3期
关键词:发文图谱聚类

王佳博 蒙元洁 冯甜甜 李 静 许世洁 吴建军,2,3 樊景春,2,3▲

高血压是常见的慢性病,也是心脑血管疾病最主要的危险因素,脑卒中、心肌梗死、心力衰竭及慢性肾脏病是其主要并发症[1-2]。目前,由于西药治疗高血压达不到治疗要求,严重影响了患者的生活质量,故目前有较多患者采用中药进行治疗[3-4]。最新调查显示,以140∕90 mmHg 为临界值,2015 年全球约有11.3 亿高血压患者[5],全球成人高血压患病率为30%~45%[6]。《中国心血管健康与疾病报告2019 概要》显示,国内大约有2.7亿高血压患者,每年新增1000万人以上[7]。中医强调整体观念和辨证论治,在防治高血压方面有其特殊优势,可多途径、多靶点、全方位地进行调节[8-9],其疗效已得到国内外研究者的普遍认可[10]。近年来,相关学者对中药治疗高血压进行了广泛的研究,对这些成果进行整理和归纳,有助于全面认识和把握该领域的研究情况。因此,本文应用CiteSpace 5.7.R2软件,对中医药治疗高血压的文献进行可视化分析,旨在把握该领域的研究现状、研究热点及发展趋势,为今后的研究指引方向,也为进一步挖掘中医药治疗高血压的优势提供证据。

1 资料与方法

1.1 数据来源本研究选用Web of Science 核心数据库和中国知识资源总库(CNKI)为数据源,分别代表国际与国内对中医药治疗高血压的研究情况,采用主题词进行检索。Web of Science 核心数据库中以“hypertension AND(chinese medicine OR chinese traditional medicine OR chinese herbal medicine OR materia medicine)”为检索式,文献类型选择All document types,格式选择纯文本Plain Text。在CNKI文献检索平台,采用高级检索方式,检索式为“高血压AND(中草药OR 中药OR 自然医学OR 天然药物)”。以上两个数据库的检索时间跨度均为自数据库建立至2020年12月31日。

1.2 纳入标准①中医药治疗高血压的相关文献;②文献类型可为临床研究、基础研究、名医经验、理论探讨;③文献资源类型为硕士、博士学位论文、期刊论文。

1.3 排除标准①重复发表的文献;②不能获取全文的文献;③会议论文、政府文件、科技成果。

1.4 研究方法将符合纳入标准的文献以Refworks格式导出,利用Excel软件对国内外文献年刊发文量、研究机构等基本情况进行统计;将Refworks格式文件导入CiteSpace 5.7.R2 软件,选择作者、机构及关键词为节点类型,分别绘制相应的可视化知识图谱,进行中医药治疗高血压领域作者和机构合作情况以及关键词共现、聚类和突现情况分析。由于CNKI 数据库文献数量较多,为了使图谱更加清晰及聚类效果最佳,CNKI 数据库参数设置中时间跨度从1960 年1 月至2020 年12 月,每5 年为一个时间切片;Web of Science核心数据库时间跨度从2008年1月至2020年12 月,每1 年为一个时间切片;选取频率由高到低排列的前50 项,即Top Nper slice 为50,剪切方式采用Pathfinder 和Pruning slice networks,形成可视化分析。图谱中节点圆圈大小代表频次,圆圈直径越大代表该节点频次越高,圆圈宽度代表不同的年份相关内容出现的频次,节点间连线代表共现频次,线条越粗代表出现频次越高,关系越密切[11-12]。

2 研究结果

2.1 文献概况经去重和剔除无意义的文献后,最终Web of Science核心数据库纳入文献841篇,代表国际发文量;CNKI 数据库纳入3182 篇,代表国内发文量。文献的发表时间可在一定程度反映该领域某阶段的研究情况,通过绘制两个数据库年发文量的折线图分析可得,国际最高年发文量达142 篇,发文量整体呈上升趋势,但在2014年和2016年有所下降;国内最高年发文量达236篇,1999年—2017年呈快速增长趋势,但在2018年和2020年均明显下降。见图1。

图1 国内外文献年刊发量

2.2 作者合作网络知识图谱分析以国际发文作者为网络节点,通过软件生成作者1 年内的合作情况,得到415个节点、515条连线,如图2(A)所示。节点大小表明XINGJIANG XIONG、JIE WANG、XIAOCHEN YANG 三位教授或团队发文量排名前三;节点连线表明该领域存在以WEI LIU、JIZHENG MA、XINLIANG DU、XINGJIANG XIANG、PENGQIAN WANG 等为主组成的5 个主要的作者合作群。以国内发文作者为网络节点,生成作者5 年内合作情况,得到456 个节点、500 条连线,如图2(B)所示。节点大小表明吕圭源、赵英强、李运轮三位教授或团队发文量排名前三;节点连线表明该领域存在以严灿、姚明江、李运伦、潘琳、雷燕、张宏等为主组成的6个主要的作者合作群。依据普赖斯定律可以计算核心作者的发文数量[13-15],计算公式为N=0.749×,npmax是统计时段内发文量最多的著者所发表的论文数量,发文量>N 篇的作者成为核心作者。本研究中国际作者的最高发文量为32 篇,通过公式计算可得N=4.237,故发文量≥5 篇的作者为核心作者,共有13位核心作者,发表论文总量为150 篇,占纳入文献总数的17.84%;国内作者的最高发文量为19 篇,通过公式计算可得N=3.265,故发文量≥4 篇的作者为核心作者,共有120 位核心作者,发表总数为671 篇,占纳入文献总数的21.67%。从整个图谱来看,虽然我国有很多作者在该领域进行了研究,但是整体结构松散,合作关系微弱。

2.3 机构合作知识图谱分析以Web of Science 核心数据库为数据源进行可视化分析,得到316 个节点、430条连线,如图2(C)所示。排名前三的研究机构依次为中国中医科学院82篇、北京中医药大学47篇、中国医科大学35 篇,说明中国的研究机构在该领域占有重要地位,从机构连线数量可以看出国际研究机构合作关系微弱。以CNKI数据库为统计源进行知识图谱分析,得到327 个节点、142 条连线,如图2(D)所示。国内研究机构发文量排名前三的依次为山东中医药大学、北京中医药大学、南京中医药大学,发文量排名前十的机构大都为中医药高等院校及附属医院,节点间连线表示有合作关系的机构大多存在附属关系,跨机构、跨地区间的合作较少。

2.4 研究国家知识图谱分析国家发文量代表一个国家在该领域的研究程度[16]。以发文量为依据,Web of Science核心数据库汇集了世界各国核心期刊,涵盖了所有学科与技术领域[17]。对Web of Science 核心数据库发文的国家绘制图谱,得到52 个节点、86 条连线,如图3。52个节点说明在该领域的发文国家有52个,从连线看出各国之间研究合作网络薄弱。将该领域国家发文量按中心性排名绘制成表格,如表1。

图2 作者、机构知识图谱

图3 主要研究国家共现图谱

2.5 共被引文献聚类知识图谱分析文献共被引聚类分析,可将聚类视图与核心文献结合。由于SCI 论文提供了被引参考文献检索途径,而CNKI 数据库收录文献不完全是SCI论文,所以CiteSpace 可视化软件不能对CNKI 数据库进行参考文献共被引分析[18-19]。利用CiteSpace可视化软件对Web of Science数据库进行共被引分析,得到3 个共被引集群,其中最大的集群为肥胖引起的高血压,第二集群为系统的检查,第三集群为早期生活,这三大聚类主要研究高血压的影响因素。为进一步分析研究主题的演进历程,将聚类视图转化为时区视图,如图4(A)。时区图将被引文献按时间的先后顺序进行分布,图中颜色依次为紫色、蓝色、绿色、橙色、红色,表示被引文献由远及近,同时代表该领域的研究主题也在发生变化。接着在聚类视图的基础上,分析该研究领域的经典文献,如图4(B),这些文献可作为该领域有重大影响力的关键文献。

表1 国际发文量

图4 文献共被引知识图谱

2.6 关键词可视化分析

2.6.1 关键词共现分析 关键词是对文献研究主题的高度概括,其频次可用来反映某个研究领域的热点[20]。对关键词进行共现分析,得到由425 个节点、1627 条连线组成的图5(A)和607 个节点、1256 条连线组成的图5(B)。对比国际与国内该研究领域的关键词,根据词频分布分别将排名前十的关键词进行整理,统计结果如表2。高血压及其同义词如高血压病、原发性高血压等提到的次数最多,然后以中医及其所涵盖的中药复方、中药治疗、中药疗法的中药在词频分布中次之。中介中心性是衡量节点在网络中信息交流能力的重要指标,通过对该领域关键词中介中心性(中心性≥0.1)的计算,得到4个高中心性关键词,代表目前中医药治疗高血压研究领域中关注度、影响力大的热点问题主要集中在氧化应激、中医药种类、大鼠模型、患者社会联系四个方面。

2.6.2 关键词聚类分析 关键词聚类分析说明了该领域的知识基础结构,在关键词共现网络基础上,对关键词进行聚类分析,聚类知识图谱中每个色块代表一个聚类,色块的节点都属于所在类的范围[21],为进一步分析研究热点绘制表3。通过LLR算法从关键词中抽取聚类标签,聚类标签的序号与聚类大小成反比,即最大的聚类用#0 来标记,国际与国内的研究共分别形成10个、18个主要聚类,见图5(C和D)。Modularity Q 和Mean Silhouette 是评价聚类的两个重要指标,Modularity Q 是评价聚类有效性的指标,Modularity Q>0.3说明聚类有效;Mean Silhouette是提示聚类同质性的指标,值越大说明聚类的同质性越好,Mean Silhouette>0.5 说明聚类合理,Mean Silhouett>0.7 说明聚类可信[22-24]。由图5(C 和D)可知,国际研究中,Modularity Q=0.4955、Mean Silhouette=0.773;国内研究中,Modularity Q=0.676、Mean Silhouette=0.8145,说明该聚类成员一致性很高,聚类结果可信。聚类标签是以相关文献题名显示,并部分列举,但都代表该标签下与之相关的研究主题方向,各聚类的平均轮廓值均>0.7,表明各类别研究主题比较集中。

由该研究主题下的关键词聚类图谱及列表能看出,目前中医药治疗高血压研究热点主要集中在以下三个方面。

(1)中医药治疗高血压临床疗效观察:目前中医药在治疗高血压中发挥重要作用,其疗效也受到越来越多医生和患者的关注和认可。从聚类#0、#3 和#4可看出临床多采用中药汤剂、中药敷贴等治疗方式,如黄连温胆汤、桃红四物汤、化痰祛瘀法、中药注射剂,已成为中医药治疗高血压的特色,临床应用广泛,治疗效果较好。

图5 关键词知识图谱

表2 中医药治疗高血压研究排名前十关键词分布

(2)中医药治疗高血压的生物学机制:聚类#2 虽然与#1 的标签名称一样,但聚类#2 是研究天麻舒心方对自发性高血压大鼠动脉管壁形态的影响,其标签下还包括β受体阻滞剂、ecv-304人脐静脉内皮细胞、高敏C反应蛋白和同型半胱氨酸,为临床应用提供客观依据。

表3 关键词聚类情况列表

(3)数据挖掘中医药治疗高血压临床用药规律:聚类#3 显示基于文献挖掘的中药辅助治疗高血压用药规律,结合临床文献分析、临床流行病学调查、网络药理学研究等分析给药时间、用药剂量、用药方式的临床效果也成为该领域的研究热点。

3 讨论

文献的数量直接反映知识量的变化[25],本次研究发现,国际和国内文献年刊发量从总体上看呈上升趋势,表示该领域受到国内外学者的关注度逐年升高,在此期间文献发文量于某几年会有所波动,如国内发文量在2018 年和2020 年均明显下降,这可能与当时的社会背景、经济状况、医疗水平等有关。在国际发文量较多的国家中,中国发文量超过其他国家,居于首位,说明中国在该领域占国际主导地位,这也与中国的历史文化息息相关。美国发表论文数量在国际居于第二位,说明美国医疗工作者对中医药治疗高血压的疗效表现出极大的重视。中国的发文时间虽然很早,但也大都集中在近20年。

从文献机构和作者相关知识图谱可以看出中国中医科学院、北京中医药大学、中国医科大学位于国际研究机构前列,说明中国研究机构在该领域具有代表性,研究较为深入,且国际研究合作化趋势明显。在国际上,XINGJIANG XIONG、JIE WANG、XIAOCHEN YANG 三位教授或团队发文量位居前三,国内发文量最高的是浙江中医药大学的吕圭源,其次为天津中医药大学的赵英强、山东省中医院的李运伦。虽然我国很多作者在该领域进行了研究,但团队之间的合作不够密切,有合作关系的机构大多存在附属关系,跨机构、跨地区间的合作较少,未形成有影响力的规模。提示研究人员在今后的研究中应加强团队、机构以及学科之间的合作,积极开展多中心的临床研究。

参考文献共被引分析可以利用知识图谱工具通过被引的频次来进一步判断所在领域中有重大影响力的核心文献[26],被引次数最多的是Xiong XJ学者,共计35次,结合上述发文机构分析可知,尽管国内机构在该领域发文量多且有一定的代表意义,但国际机构发表文献引用率较高,更具影响力。对被引文献进行聚类分析,形成3 个共被引集群,其中最大的集群为肥胖引起的高血压,第二集群为系统的检查,第三集群为早期生活,这都是高血压疾病的影响因素。用反证思维不难看出高血压的早期预防十分有意义,“早发现、早诊断、早治疗”即能降低高血压的患病率。在确诊后,积极改变生活习惯,血压也可控制在一个可观水平。由图4(B)可知,Chinese herbal formulas for treating hypertension in traditional Chinese medicine:perspective of modern science作为该领域的关键文献,值得研究者仔细研读。该文献中,中药方剂是一个重点研究领域,在整体观念和辨证论治理念的指导下,配方要根据患者的临床表现而定。

关键词是论文内容的实质和核心提示,共现和聚类图谱能够反映中医药治疗高血压的热点及前沿趋势。在关键词知识图谱中发现高血压及其同义词如高血压病、原发性高血压等提到的次数最多,以中医及其所涵盖的中药复方、中药治疗、中药疗法的中药在词频分布中次之。国际研究中关键词“大鼠”“中西医结合”“基因表达”出现的次数也较多,体现了该领域研究主题的变化过程。从关键词的聚类图谱可看出,目前中医药治疗高血压研究方向可以概括为三方面:(1)中医药治疗高血压临床疗效观察;(2)中医药治疗高血压的生物学机制;(3)数据挖掘中医药治疗高血压临床用药规律。由此可见,中医药治疗高血压涉及临床疗效观察、生物学机制、用药规律、配方有效成分、经验传承、数据挖掘等各个方面。关键词聚类图谱中有多个聚类重叠,提示该部分聚类间联系紧密,即对中医药治疗高血压的相关研究虽各有差异,但主题集中。由于高血压具有非常复杂的病理过程,大部分学者认为中西医结合治疗可能是更好的选择[27]。

在临床应用过程中,建议根据高血压的分级、症状的复杂程度、病人的体质状况、发病的年龄、患者性别等具体情况,确定使用中医、西医、中西医结合等治疗方法。对于症状严重且影响生活质量的患者,建议以药物干预为主,针灸、穴位贴敷、足浴等治疗为辅;对于病情相对稳定的患者,建议用适宜的中药对证治疗。最近,在中药治疗高血压的作用机制研究中,方剂有了很大的进展,已经制定了相关条例和原则。中药复方不仅能稳定、抑制血压,而且对失眠、便秘、疼痛等血压无法控制的因素也有抑制作用,从而改善临床症状,提高生活质量,逆转高血压相关危险因素,保护靶器官,增加长期生存机会。中医药在治疗高血压方面有一定的优势与特色,但目前基础研究不够充分,临床应用证据仍显薄弱,医生难以准确把握、精准治疗。对于中药降压作用机制的研究,应从多角度、多层面对单味中药、复方中药进行系统、多层次、多效应的系列研究。运用先进的科学技术,从体征、器官、细胞甚至分子水平研究着手,筛选出更有效的中药复方及其有效成分。

4 结论

本文以Web of Science 核心数据库和CNKI 数据库为数据源,借助CiteSpace 5.7.R2软件对纳入文献的作者、机构、国家、共被引文献、关键词进行可视化分析,得到相应的知识图谱,揭示了中医药治疗高血压的研究历程和发展动态。知识图谱分析表明,目前中医药治疗高血压领域正处于蓬勃发展时期,各国学者对中医药治疗高血压兴趣浓厚,而中国在该领域占国际主导地位,但各机构、团队之间合作不够密切。针对现状,建议不同研究机构及团体加强合作,整合资源,将中医药治疗高血压疗效证据化,作用机制明确化。

猜你喜欢
发文图谱聚类
七部门联合发文 进一步完善和落实积极生育支持措施
一种傅里叶域海量数据高速谱聚类方法
基于图对比注意力网络的知识图谱补全
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
图表
校园拾趣
爷孙趣事
以牙还牙
主动对接你思维的知识图谱