2002-2021年中医药数据库研究文献可视化分析

2023-08-23 10:39丁萌萌田紫煜陈媛媛齐大河王可欣钱莹孔令博
中国中医药信息杂志 2023年8期
关键词:发文聚类中医药

丁萌萌 ,田紫煜 ,陈媛媛 ,齐大河 ,王可欣 ,钱莹 ,孔令博

1.北京中医药大学东直门医院,北京 100700; 2.中国中医科学院针灸研究所,北京 100700

中医药在疾病预防、诊疗及预后等方面有完整的理论体系,将中医药与现代技术融合,守正创新,展现中医药特色与价值,促进中医药现代化发展成为趋势[1-2]。数据库作为管理数据的技术与方法,传统技术与底层理论基本成熟,数据库的改进与突破也在开展中[3]。中医药数据库将中医药知识数字化、便捷化,简化相关知识的检索与查阅,促进中医药与科技协同发展,有益于中医药知识传播及使用,是科技助力中医药传承创新发展的重要体现。本研究梳理2002-2021年中医药数据库相关文献,运用CiteSpace软件对其进行文献计量分析,分析该领域发展现状与发展趋势,为相关研究提供参考。

1 资料与方法

1.1 数据来源与检索策略

计算机检索中国知识资源总库(CNKI)、中文科技期刊数据库(VIP)、中国学术期刊数据库(万方数据)、中国生物医学文献数据库(CBM),选用主题和关键词精确检索。检索式为:(“中医”OR“中药”OR“中医药”OR“中医古籍”)AND(“数据库”OR“知识库”OR“数字化”OR“数字化资源”)。检索范围包括学术期刊、学术辑刊与会议论文。检索时间范围为2002年1月1日-2021年12月31日。检索日期为2022年3月31日。

1.2 文献筛选标准

纳入标准:①中医药数据库相关公开发表的中文期刊文献;②研究内容包括中医药数据库的基础研究、底层设计、方法探讨、发展问题现状、对比研究等;③研究对象为中医药相关数据库。

排除标准:①新闻报道、征订启事、杂志简介、重复文献等;②综述、Meta分析等非原始研究文献;③自建自用型私人数据库相关内容;④无法获取全文或缺少其他关键信息的文献。

1.3 数据筛选与处理

初步检索所有相关文献,并进行整理、归纳。对结果进行二次筛选,即根据文献筛选标准,排除明显不符合标准的文献资料。进一步阅读剩余文献的摘要及全文,再次排除不符合标准的文献,对其进行3次筛选,明确最终纳入文献。提取最终纳入文献的标题、发表年份、作者、单位、来源期刊、基金、关键词等信息,导出为Refworks格式。多项基金项目支持的统计时选取首位基金项目录入。

1.4 数据分析

运用CiteSpace5.8.R3对Refworks格式文件进行转化,对数据进行可视化分析。Time Slicing(时间分区)设定为2002年1月1日-2021年12月31日,时间切片为1 年;Selection Criteria(选择标准)选择g-index,设定k值为25,其余为默认值。Node Types(节点类型)依次选择Author(作者)、Institution(机构)、Keyword(关键词),形成“中医药数据库”领域作者、机构、关键词共现网络。关键词共现网络中采用LSI算法进行聚类分析,将Burstness中γ值设为0.6,其余值为默认,形成关键词突现图。关键词是论文的核心词汇,也是论文所涉及领域的体现。通过对关键词的研究分析,能够合理解释该领域的现状,并且一定程度上可以预见前景与发展方向[4]。

2 结果

初检获得文献1 740篇,查重、整合并按照文献筛选标准进行筛选,初步剔除931篇文献,仔细阅读剩余809篇文献的摘要及全文,进一步剔除不符合标准的文献,最终纳入文献372篇。

2.1 发文时间

纳入文献发文时间分布见图1。2002-2008年发文量呈明显上升趋势。2009-2014年发文量增势减缓,年均发文量约26篇,其中2014年发文较多(32篇),提示中医药数据库得到部分研究者关注,可能与数据库技术发展迭代有关。2015-2021年发文量呈缓慢下降趋势,提示中医药数据库研究热度略减。2002-2021年该领域发文总体偏少,研究较局限,需加大科研力度,深入研究,鼓励新思路、新想法、新角度、新合作等突破发展。

图1 2002-2021年中医药数据库领域文献发文时间分布

2.2 来源期刊

纳入文献来源于254种期刊,发文量≥5篇的期刊见表1。发文量最高的期刊为《中华医学图书情报杂志》(18篇,4.84%)。中医药数据库相关文献主要发表于医药卫生科技、信息科技相关领域期刊,提示该领域关注度虽不高,但为各类期刊普遍接受。选题总体而言较新颖,有较大发展空间。

表1 2002-2021年中医药数据库领域文献来源期刊(发文量≥5篇)

2.3 作者

该领域作者共现网络见图2,包括417 个节点、704条连线,网络密度为0.008 1。发文量≥2篇的作者70位,发文量≥10篇的作者8位。发文较多的作者有李敬华(21篇)、于琦(15篇)、于彤(14篇)、刘静(13篇)、刘丽红(13篇)、田野(12篇)、李兵(12篇)、孙海舒(10篇)等。该领域形成以李敬华、于琦、于彤等为代表的作者合作群,其所属机构为中国中医科学院中国中医药信息研究所,为该领域核心研究团队,但其合作较局限,与其他团队交流偏少。

图2 2002-2021年中医药数据库领域文献作者共现网络

2.4 研究机构

纳入文献涉及282个研究机构,其中发文量≥5篇的机构8个,发文较多的机构有中国中医科学院中医药信息研究所(63篇)、黑龙江中医药大学(19篇)、南京中医药大学(14篇)、北京中医药大学(7篇)、成都中医药大学(7篇)、山东中医药大学(6篇)、中国中医科学院中国医史文献研究所(6篇)、辽宁中医药大学(5篇),上述机构共发文127篇(34.14%)。机构共现网络见图3。该领域研究以中国中医科学院中医药信息研究所为核心研究机构,但机构间连线较少,仅存在少量合作关系,提示各研究机构相对独立,多数以小组为研究团队,缺少跨单位、跨机构学术交流。

图3 2002-2021年中医药数据库领域文献研究机构共现网络

2.5 基金项目

372篇纳入文献获基金资助的有227篇(61.02%)。发文量前9位基金项目见表2。中国中医科学院基本科研业务费自主选题项目资助文献最多,此外也涉及国家级及各省、市、校级基金项目。可知,中医药数据库领域基金支持情况尚可,相关研究受到一定关注。

表2 2002-2021年中医药数据库领域文献基金项目(前9位)

2.6 关键词

2.6.1 共现聚类分析

关键词共现聚类网络包含372个节点、691条连线,网络密度为0.01。共形成12个聚类,重点关键词包括中医古籍、数据挖掘、图书馆、特异性症状、中医文献、软件开发等,见图4。

图4 2002-2021年中医药数据库领域文献关键词共现聚类网络

2.6.2 聚类时间线分析

关键词聚类时间线可直观展示该领域研究发展动态,见图5。网络聚类结果较好,“数据库”“中医药”贯穿整个研究时间段,是研究的主体内容及本质,对中医药数据库的构建与运用等方面均有一定研究。其余如“中医古籍”“数据挖掘”等关键词聚类持续时间较长,为该阶段研究重点,提示在该方面有一定经验与思考并取得一定阶段性成果。而关键词“图书馆”“软件开发”聚类持续时间较短,提示在这些方面研究进度较缓,或成果较欠缺,尚待进一步研究。

图5 2002-2021年中医药数据库领域文献关键词聚类时间线

2.6.3 突现分析

突现关键词可显示该领域的活跃程度与发展趋势,前7位突现关键词见图6。2002-2005年该领域研究尚不活跃,2006-2014年研究以信息技术、数据挖掘、中医古籍为主,2015-2021年研究以图书馆、知识库等信息技术研究为主,基本符合该领域的特点。

图6 2002-2021年中医药数据库领域文献突现关键词(前7位)

3 讨论

本研究运用CiteSpace 软件对2002-2021 年中医药数据库领域文献进行文献计量分析,探讨中医药数据库的发展现状与发展趋势。2002-2014年,中医药数据库领域研究增多,发文量波动增加,而2015年后该领域发文量缓慢减少,该领域取得一定的阶段性成果,尚待深入研究。该领域尚未形成核心研究发文期刊,来源较分散。该领域涉及417位作者,重要学者有李敬华、于琦、于彤等。重点研究单位为中国中医科学院中医药信息研究所及各大中医药院校。从基金项目角度看,该领域得到的基金支持力度尚可,且目前中医药相关领域总体基金支持呈增长趋势[5],由此可见,中医药数据库领域具有良好的发展前景。

数据库作为知识传递的载体,发展至今已有较为健全的构建框架[6]。自20世纪80年代起中医药数据库的相关研究工作开展[7],发展至今我国现有中医药数据库呈现数量增长而总体质量一般态势[8]。虽然现有中医药数据库功能相对完备,具有多种类型[9]、多种功能[10]以满足不同需求,但质量与效益关系未得到足够重视[11],缺少前瞻性。同时,在中医药数据库领域,尤其是中医古籍类数据库存在重复建设与资源浪费问题[12]。可能与各机构多以小组为单位进行相关研究有关,虽取得一定的成果,但缺少机构与机构之间的合作,信息沟通不充分,整体使用率较低。期待今后在相关部门支持与各研究机构的管理部署下,促进机构合作,共建共享,互利共赢,从构建、启用、运营维护等方面协同发展中医药数据库。

中医药数据库领域发展至今已取得一定成果,目前该领域研究主要集中在中医古籍、中医文献方面,软件开发方面也有初步研究,但尚未取得突破性成果,有待进一步探索。鉴于目前中医药数据库主要运用于理论学习,笔者建议可进一步研究探讨基于中医药数据库形成临床辅助决策方案、罕见病医案分享等内容,将应用面扩大至临床,多角度促进中医药数据库的提升与发展。将中医药与数据库技术相结合,推动中医药现代化发展及数据库技术革新。

猜你喜欢
发文聚类中医药
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
基于DBSACN聚类算法的XML文档聚类
从《中医药法》看直销
基于高斯混合聚类的阵列干涉SAR三维成像
中医药立法:不是“管”而是“促”