2000-2021年证素研究文献可视化分析

2023-02-15 06:23曾小珂孙贵香孙豪娴毛欣邱丽婷张冀东张千旭孙光荣
中国中医药信息杂志 2023年2期
关键词:证素发文中医药大学

曾小珂 ,孙贵香 ,孙豪娴 ,毛欣 ,邱丽婷 ,张冀东 ,张千旭 ,孙光荣

1.湖南中医药大学,湖南 长沙 410208; 2.国医大师孙光荣学术经验传承工作室,湖南 长沙 410208

“证”是中医学对疾病进程中某一阶段机体整体反应状态所作的病理概括。中医辨证是根据中医学理论,对证候(症状、体征等)及相关资料进行分析,并作出思维诊断的过程[1]。辨证论治是中医诊疗的基石和特色,在中医药现代化发展进程中,由于中医诊疗的非线性思维方式和医师个体差异,规范化和标准化的难度较大。

湖南中医药大学朱文锋通过对证分解出辨证诊断的最小单位,在古今文献系统整理研究的基础上,提出证素学说(曾用“辨证要素”一词),建立了“加权求和浮动阈值运算”数学模型,以及由证候-证素-证名形成的“三阶双网”证素辨证结构[2],为统一辨证体系提供了思路。自2000年朱文锋首次在论文中提到“辨证要素”一词[3]以来,证素理论已发展20余年,作为中医学研究领域的热点,诸多慢性内科疾病、危重病和传染病结合证素开展了相关研究,证素作为中医人工智能框架和模型还推动了中医智能辨证的发展[4]。本研究采用文献计量学方法对2000-2021年证素的研究内容进行分析,探索该领域核心作者和研究机构,了解证素研究的热点与前沿,并对分析过程中发现的问题进行讨论。

1 资料与方法

1.1 数据来源

检索中国知识资源总库(CNKI)、中文科技期刊数据库(VIP)、中国学术期刊数据库(万方数据)、中国生物医学文献数据库(CBM),以主题“证素”OR“辨证要素”为检索条件,时间范围为2000-2021年。

1.2 文献筛选标准

纳入标准:符合证素或辨证要素主题的有效中文学术期刊文献。

排除标准:①重复文献;②非医学学科文献;③访谈发言类文章;④文摘、索引、综述和文献分析等非原始研究文献。

1.3 数据处理

将所选文献题录从各数据库导出为NoteExpresss格式,在NoteExpress3.5.0.9054中对题录进行清洗和整理,对年发文量进行分析,并保存为Excel格式文件备用。将所有题录导出为Refworks文件,在此文件中进一步进行数据清洗,将研究院校二级院系及医院科室合并至一级单位,机构曾用名替换为现用名,如将“湖南中医药大学中医学院”替换为“湖南中医药大学”,将“福建中医学院”替换为“福建中医药大学”。其中Refworks文件以“download_**”格式命名保存至input文件夹,并运用CiteSpace5.7.R1内部Data程序将文件转换为其可读取的格式。

1.4 数据分析

VOSviewer是一款由荷兰莱顿大学的Van Eck与Waltman共同研发的信息可视化软件[5],可以分析作者、引文、关键词项目中节点的聚类关系,并将结果以图谱的方式呈现出来[6]。CiteSpace软件是一款基于JAVA程序语言编写的可视化分析图谱软件[7],由美国德雷克塞尔大学陈超美教授研发,广泛应用于分析某研究领域的研究热点及趋势[8]。

在已导出的题录Excel格式文件中,按照发文年份对题录信息进行排序,对每年发文量进行统计,将结果在Excel中转化为折线图,并选择显示数据标签,修改坐标名,选择显示趋势预测线,可得到发文量变化趋势。

使用VOSviewer1.6.17对作者合作网络进行分析,选取相应Refworks文献,在窗口分析类型(Type of analysis)中选择共同作者(Co-authorship),分析单元(Unit of analysis)选择作者(Authors),计数方法(Counting method)为全计数(Full counting),其他选项选择默认项。根据普赖斯定律公式[9]MP=的计算结果,则MP=8.76,四舍五入取整后,可认为该领域核心作者的发文量最少为9篇,则设置作者发文量最小阈值为9,最后导出图谱。

使用CiteSpace5.7.R1绘制机构关系图谱,在窗口的分析单元中选择机构,时间跨度设置为2000-2021年,以1年为时间切片单位,数据阈值设定选用TopN模式,设置N=50,修剪方式选用Pathfinder,并选择Pruning the merged network对数据进行进一步提炼,其余保持默认选项。

继续运行CiteSpace,在窗口的分析单元中选择关键词,时间切片、数据阈值、修剪方式均与机构共现设置相同,点击运行后导出关键词共现图谱。保持关键词共现视图窗,在控制面板中选择Burstterms,最少突现时间选择2年,导出关键词突现图。关键词聚类图是在关键词共现基础上选择K聚类,采用对数似然比(LLR)算法导出聚类结果,Q(Modularity聚类模块值)>0.3表示聚类结构显著,S(Weighted Mean Silhouette聚类平均轮廓值)>0.5表示该聚类是合理的。保持默认选项,在CiteSpace控制面板中另选Timeline导出时间线图,并对时间间隔进行调整。

2 结果

2.1 发文时间分布

经筛选,纳入1 964篇期刊文献,发文时间分布见图1。2000-2021年证素主题论文年均发文量约89篇,22年里发文量呈波动上涨趋势。2000-2005年为证素学说理论创立与起源阶段,朱文锋2000年发表的论文[3]为最早提出证素理论的论文,2001年创立了证素学说的前身“辨证统一体系”[10],基本包含了证素的内容,此时称为“辨证要素”。2004年开始证素研究文献发文量呈明显上升趋势,与证素辨证学的正式创立相关。2006-2011年发文量持续增长,在此期间出版的第一本证素学说著作《证素辨证学》,为证素学说打下理论基础,证素研究的新方法和理论不断被提出和讨论。2012-2017年是发文量快速增长时期,占发文总量的44%,也正是在2012年证素被写入“十二五”国家规划教材《中医诊断学》。2018-2019年是证素学说的平台期,发文量增长幅度减缓,甚至在2018、2019年发文量下降,而2020年发文量达到峰值,为190篇,2021年的发文量较2020年有所下降。根据趋势预测线显示,发文量呈上升趋势。

图1 2000-2021年证素研究文献发文时间分布

2.2 作者合作网络

VOSviewer对每位作者最早发文时间进行了描述,筛选出86位主要作者构成合作网络,产生18个聚类丛,见图2。该图谱提示,证素研究已形成多个核心作者集群,福建中医药大学李灿东与其他作者共现次数最多、合作作者数量最多,该集群内作者的主要研究方向为基于证素辨证的慢性非传染性内科疾病,研究内容较丰富。第2大集群为朱文锋及合作作者,研究方向主要为证素辨证的理论研究,2个集群之间互有学术合作。河南中医药大学李建生为首的作者集群为第3大集群,主要研究方向为呼吸系统疾病,与李灿东、朱文锋作者集群之间无明显合作。图中尚有8位研究者的节点呈独立存在的状态,与其他节点无连线。

图2 2000-2021年证素研究文献核心作者共现网络

发文量最高的7位作者依次是李灿东(137篇)、朱文锋(86篇)、李建生(55篇)、林雪娟(48篇)、黄碧群(41篇)、高碧珍(39篇)、杨朝阳(39篇)。核心作者发文量见表1,与核心作者合作共现网络有可参照性。

表1 2000-2021年证素研究文献核心作者

作者对学科的影响力还需通过所发表文章的被引次数来看,对证素研究文献进行人工判读,整理出被引次数前10位文献,见表2。其中朱文锋发表7篇,占据排名前4位,朱文锋和李灿东等共同发表的文章[11]体现了2位作者早期研究的合作。

表2 2000-2021年证素研究高被引文献(前10位)

2.3 机构合作网络

机构合作关系见图3,福建中医药大学、湖南中医药大学、北京中医药大学3所高校及其附属医院是证素研究领域的核心机构。其中福建中医药大学及福建省有关科研机构省内合作较多,与其他地区机构合作较少。福建地区的机构研究方向有慢性胃炎、毒品成瘾、代谢综合征、围绝经期综合征、健康管理。湖南地区机构研究方向多为证素基础理论、舌象与证素、数字辨证。北京地区科研机构主要研究方向是慢性阻塞性肺疾病、新冠肺炎、支气管哮喘等病症。发文量80篇以上的机构共6个,发文量由高到低依次是福建中医药大学(275篇)、湖南中医药大学(193篇)、北京中医药大学(130篇)、南京中医药大学(84篇)、北京中医药大学东直门医院(84篇)、广州中医药大学(83篇)。从发文时间看,湖南中医药大学发文最早,其次是福建中医药大学、南京中医药大学和北京中医药大学,见表3。

图3 2000-2021年证素研究文献机构共现网络

表3 2000-2021年证素研究高发文量机构

2.4 关键词

2.4.1 共现分析

关键词是一个领域研究的核心与高度概括,通过对关键词分析,可了解证素研究的主要内容(见图4)。证素的主要研究方法是文献研究和数据挖掘,研究最多的病症是冠心病、代谢综合征、慢性胃炎、2型糖尿病。病位和病性2类证素的研究中,病位研究较多。在关键词共现图中值得注意的是“证候要素”一词,其出现频次较多的原因一方面是与“证素”词条较为类似,同时也因部分研究者对两个理论的混用和并用。

2.4.2 突现分析

突现分析可反映证素研究不同时期的关注热点,见图5。2000-2021年至今产生了25个突现关键词,其中12个关键词集中于2015-2018年突现,分别是病性、病位、痰证、名老中医、病机、病因、中医证素、证型、聚类分析、文献研究、围绝经期、关联规则。其中,2015-2018年的“病性”和“病位”为一组,在当时的临床研究中通常会同时提及。“病因”“病机”“名老中医”为一组,2016-2018年,基于名老中医临床经验研究某一疾病的病因病机和证素规律的论文较多,是这段时间的研究热点。在近几年爆发的关键词中,痰证、聚类分析、围绝经期、关联规则、分布规律和数据挖掘延续至2021年,代表证素研究的前沿。

注:节点表示关键词,圆点面积越大代表出现频次越高;节点间连线表示合作关系,连线越粗代表联系越紧密

图5 2000-2021年证素研究文献突现关键词

2.4.3 聚类分析

对关键词进行聚类后,Q=0.805 4,可判断聚类结构显著,S=0.573 6,证明该聚类合理。根据运算法则,所有关键词共形成11个聚类,见图6。#0~#10依次为中医证候、中医证素、临床调查、频权剪叉算法、辨证要素、中医证型、诊断、辨证分型、稳定型心绞痛、辨证论治、病因病机。

图6 2000-2021年证素研究文献关键词聚类

2.4.4 时间线分析

图7依据11个关键词聚类中所包含的关键词出现时间进行排序,可以直观看到,证素研究早期多以中医诊断理论研究、现代数字辨证理论研究为主,研究方法包括计量诊断、贝叶斯网络、频权剪叉算法、数理模型、数据挖掘等。中后期研究更多倾向于对疾病临床研究和规律研究,包括慢性疾病如代谢综合征、2型糖尿病、慢性萎缩性胃炎;传染性疾病如艾滋病、新冠肺炎、病毒性肝炎、手足口病;危重病如脑梗死、急性心肌梗死;还有一些特殊情况如毒品成瘾、药物依赖等[12]。出现最晚的危险因素、慢性萎缩性胃炎、新冠肺炎等是证素研究潜在热点。

图7 2000-2021年证素研究文献关键词时间线

3 讨论

证素辨证学是通过对中医辨证系统这一非线性复杂巨系统降维,将较为抽象的中医辨证论治转化为具象计算模型,把定性描述整合为定量分析的学说[13],从初次被提出发展到现在,证素在理论研究和临床研究中取得了许多成绩,积累了丰富的研究内容,但证素研究目前还存在一些有待改善的问题,限制了证素的发展。通过对发文量、作者、机构、关键词等信息的可视化分析以及对证素主题文献的阅读,确认了证素研究的主要作者和机构,以及近年来的研究前沿和最新热点,对存在的问题和发展方向进行探讨。

2000-2021年发文最多的作者有李灿东、朱文锋、李建生、林雪娟、黄碧群、高碧珍、杨朝阳,朱文锋是被引次数最多,最具学科影响力的作者。朱文锋和李灿东之间有研究合作,同时前者是后者的博士生导师,在对证素的研究上一脉相承。依据机构合作网络共现图,福建中医药大学、湖南中医药大学、北京中医药大学及其附属机构是主要的研究机构。结合作者共现与机构共现图,发现证素研究在地域上呈现一定的局限性,同一省份的机构和作者研究方向都比较类似,形成了固定的研究内容。而与其他地区机构的作者合作或许能为证素研究创新课突破口。成都中医药大学许强等[14-15]依据证素辨证开发了基于有向图的病机归因辨证系统(ISO-R归因辨证系统),南京中医药大学国医大师周仲瑛基于证素思路提出了病机辨证这一新体系[16],在理论方法上进行了再造创新,可见传统的优势研究机构应向更多不同地域的机构寻求合作,有助于打破框架,开拓思路。

证素在慢性疾病和内科疾病中运用较多,如高血压病、糖尿病、代谢综合征、慢性胃炎、心脑血管疾病、癌症[17-21]等都结合证素进行了探索,研究最多的是冠心病。在其他专科如五官科、皮肤科、骨科等方向的证素研究目前还比较少见,具有研究创新空间。研究方法中,文献研究和数据挖掘是证素研究的主要手段,因子分析和聚类分析为其次,这些研究方法是联系临床病症和证素研究的桥梁。

从关键词突现情况看,痰证、聚类分析、围绝经期、关联规则、分布规律和数据挖掘是延续至2021年的突现词,代表证素研究的前沿。其中“痰证”一词主要作为代谢综合征的病性证素[22]被研究所以突现。围绝经期的研究[23]主要是对围绝经期失眠症肝郁的证素和用药规律进行分析。聚类分析和分布规律在研究中常相伴而行,有时还与因子分析一同出现,如运用因子分析和聚类分析方法研究某一疾病的证素分布规律[24-25]。数据挖掘是研究证素常用的手段,多用于临床疾病的证素分布规律、关联规则或用药规律研究。

危险因素、慢性萎缩性胃炎、新冠肺炎等是证素研究的潜在热点。危险因素出现在2020年,主要是对心脑血管风险预测[26]的研究。近年慢性萎缩性胃炎的证素研究较多且有递增趋势,预计将成为今后研究热点。2019年起证素理论在新冠肺炎[27-28]的应用,证明证素对于新的临床热点有良好的兼容性。

关键词共现得到的结果中,“证候要素”一词频次过多,通过阅读文献,发现有部分学者对证素理论与证候要素理论存在混用和概念模糊的情况,因两个理论概念和应用上非常接近,如证素分病性证素和病位证素,而证候要素有证候靶点作为病位补充理论,所以也有病性要素和病位要素[29],使二者在名称和内容上趋同,甚至有学者提议将证素、证候要素和证候靶点统称为证候要素[30]。梁昊等[31]认为两个理论同属一源,但“证”与“证候”二词存在内涵差异,概念定性上不尽相同。同时实际运用中两者各有优劣,研究者仍需厘清证素与证候要素之间的分别。

许多学者对于证素能否规范中医辨证和证候研究存在很大争议,但随着云计算、大数据计算不断成熟,证素辨证学作为中医学和计算机学以及数学交叉应用的学科,在发展数字中医药上确有优势。湖南中医药大学邓文祥在WF文锋-Ⅲ中医(辅助)诊疗系统的基础上设计了“TCMGO”中医智能辨证机器人[32],利用安卓平台和微信小程序创造智能交互,通过分析证素实现对用户的云诊疗。伴随着大健康时代到来,中医诊疗智能化、数字化的脚步逐渐加快,证素学说有望在大健康领域取得更多成果。

综上所述,证素辨证学说是中医诊断学里程碑式的研究成就,也是现代中医药理论研究的重大成果。但证素概念不清晰在一定程度上限制其推广运用。从理论创新到临床病症的研究,证素仍然处于探索发展的上升时期,今后应在基础理论研究上继续精进和明确,同时开展皮肤、五官、骨伤等外科的临床研究,拓展研究范围,并不断尝试新的算法在证素研究的应用,加快智能化和数字化的进程。

猜你喜欢
证素发文中医药大学
陕西中医药大学附属医院肾病二科简介
糖尿病前期中医证型及证素特点分析
2型糖尿病合并肥胖患者的相关危险因素和中医证素分析
基于因子分析及聚类分析的241例感染后咳嗽中医证素证型研究
《江中中医药大学学报》简介
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
中医药大学本科生流行病学教学改革初探