石英杰 李宗友 赵攀 杨硕 刘成源
摘要:目的 分析我国近40年中医计算机辅助诊断研究的相关文献,探索该领域发展现状、研究热点及前沿动态,为后期研究提供参考和借鉴。方法 检索中国知识资源总库(CNKI)自建库至2020年10月31日发表的中医计算机辅助诊断研究相关文献,运用CiteSpace v.5.7.R2软件对发文量、作者、发文机构、关键词进行分析挖掘,并绘制相关科学知识图谱。结果 共纳入文献428篇,最早关于中医辅助诊断研究的论文发表于1981年。近40年来,中医计算机辅助诊断研究有2个研究高峰时期,分别为1989-1992年和2001-2010年。主要合作团队有吕汉兴团队、李海鲲团队、杨学智团队和温川飙团队,形成以北京中医药大学、湖南中医药大学、南京中医药大学为核心的研究机构网络,研究机构之间合作较少。中医类研究机构占比44.40%,非医学类研究机构占比36.51%。研究内容集中在中医专家系统、中医电脑诊疗系统、中医辨证论治模型、中医诊断客观化、中医诊断智能化5个方面;前沿热点主要集中在中医药的知识发现、人工智能、机器学习、神经网络、知识图谱研究等方面。结论 随着信息技术的进步和大数据、人工智能技术的广泛应用,中医计算机辅助诊断逐渐客观化、精确化、智能化,其研究深度和广度也不断拓展和延伸。
关键词:中医;辅助诊断;CiteSpace;科学知识图谱;热点;演变趋势
中图分类号:R2-03 文献标识码:A 文章编号:2095-5707(2021)02-0011-08
DOI: 10.3969/j.issn.2095-5707.2021.02.003 开放科学(资源服务)标识码(OSID):
Knowledge Map Analysis on Research Hotspots and Trends in Computer-aided Diagnosis of TCM in China
SHI Ying-jie1, LI Zong-you1, ZHAO Pan2, YANG Shuo1, LIU Cheng-yuan3*
(1. Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. Eye Hospital, China Academy of Chinese Medical Sciences, Beijing 100040, China; 3. Service Center of National Administration of Traditional Chinese Medicine, Beijing 100027, China)
Abstract: Objective To analyze the relevant literature of research on computer-aided diagnosis of TCM in the past 40 years in China; To explore the development status, research hotspots and frontier trends of this field; To provide reference for further research. Methods Research related literature on computer-aided diagnosis of TCM published by CNKI from its establishment to October 31, 2020 was retrieved. CiteSpace v.5.7.R2 software was used to analyze and mine the amount of articles, authors, publication organizations, and keywords, and
中医药是中华民族的原创科学,数千年来为中华民族的健康做出了巨大贡献。2019年10月,习近平总书记对中医药工作作出重要指示,强调要遵循中医药发展规律,传承精华,守正创新,加快推进中医药现代化、产业化[1]。利用计算机技术构建中医药知识体系,探索与发现中医药规律,实现基于中医辨证论治的个性化诊疗,是有效解决中医药传承、发展和创新问题的方法之一。中医辅助诊断系统通过现代化的诊疗设备进行中医四诊信息客观化、量化,可以提升临床工作者的辨证准确度、减少人为医疗错误[2]。
在多学科交叉融合快速发展的大背景下,科学知识图谱工具可以幫助学者弥补对跨学科领域认识的不足。本文通过文献计量学方法和知识图谱可视化工具,对中国知识资源总库(CNKI)已发表的中医计算机辅助诊断研究的期刊论文及硕士、博士学位论文的发文量、作者、发文机构、关键词等进行分析,挖掘中医计算机辅助诊断的研究热点及研究趋势,期望发现中医辅助诊断研究的发展脉络及未来发展的方向。
1 资料与方法
1.1 数据来源与检索策略
以中国知识资源总库(CNKI)为数据来源,运用主题检索方法,检索式为:SU=('辅助诊断' + '辅助诊疗' + '辅助辨证' + '智能诊断' + '智能诊疗' + '诊断系统' + '诊疗系统' + '专家系统' + '问答系统' + '辅助决策' + 'CDSS') * '中医'。检索时间范围自建库至2020年10月31日,检索时间2020年11月1日。
1.2 纳入与排除标准
纳入标准:⑴中医计算机辅助诊断相关研究,包括理论研究、辨证论治模型研究、专家系统相关研究、辅助诊断相关技术应用及实验研究、辅助诊断系统临床验证研究等;⑵文献类型为期刊论文、硕士及博士学位论文。
排除标准:⑴与中医计算机辅助诊断研究无关的文献;⑵纪实报道,缺少作者或机构信息,综述、会议论文及成果展示等文献。
1.3 数据处理
将检索到的文献以Refworks格式导出,保存为download_***.txt文档,内容包括作者、发文机构、论文题目、发表年份、关键词、摘要、期刊、卷次、起止页码等。
在导出的.txt文档中,对标点、分隔符等进行校对,避免因源数据格式不规范影响数据挖掘结果的准确性。发文机构以论文实际标注为准,考虑到标注的机构名称分级差异较大,对机构名称进行适当整理,如将“上海医科大学附属肿瘤医院中医科”统一为“上海医科大学附属肿瘤医院”。因存在研究机构更名情况,本文保留原始名称进行分析。
1.4 研究方法
采用CiteSpace v.5.7.R2软件将文献转换为download_***_converted.txt格式,在“功能与参数”页面建立“New Projects”——中医辅助诊断,参数设置为默认值。
数据分析参数设置:时间跨度1981年1月-2020年10月,时间切片为1。“Node Types”(节点类型)选择Author(作者),TopN取值为50%,未选用网络裁剪;“Node Types”选择Institution(机构),TopN取值为100%,未选用网络裁剪;“Node Types”选择Keyword(关键词),g-index中k=30,网络裁剪选用寻径网络算法(Pathfinder)。其余参数为默认值。
2 结果与讨论
根据检索策略检索文献663篇。按纳入与排除标准筛选后,最终共纳入428篇,包括期刊文献278篇、硕士学位论文119篇、博士学位论文31篇。
2.1 发文时间分布
中医计算机辅助诊断研究论文发文量随时间变化曲线见图1。从图中可以发现,最早关于中医辅助诊断研究的2篇论文发表于1981年[3-4],说明20世纪80年代初已有学者开始从事中医计算机辅助诊断的研究。1989-1992年关于中医计算机辅助诊断的研究达到了第1个高峰期。但是从1993年开始发文量明显减少,1998年发文量仅有1篇,说明该领域研究热度明显下降。2001-2010年,中医计算机辅助诊断研究再次成为研究热点,其中2008年的年发文量达34篇,是近年来发表论文最多的一年。2011-2019年,年均发文量19篇,研究热度处于稳步升温的过程。由于2020年数据不完整,本研究不进行分析。
2.2 作者分布
發表中医计算机辅助诊断研究论文的作者共663位,其中发文≥4篇的作者共12位,占1.81%(见表1);发文≥3篇的作者共34位,占5.13%。
对发文作者进行共现分析,见图2。图谱中的节点代表作者,节点半径越大表明发文量越多;节点间的连线代表2个作者的共现关系,连线越粗表示合作越密切。结果显示,节点数N=63,连线数E=78,表明共出现作者63位,作者之间合作关系78个,模块值(Q值)=0.826 3,平均轮廓值(S值)=1。一般Q值越接近1说明聚类效果越好,S>0.5表明聚类合理,S>0.7表明聚类可信[5]。
根据图谱和共现作者发文量分析,发文作者形成了4个较稳定的核心团队:吕汉兴团队来自华中科技大学,属非中医类团队,主要从事中医专家系统研究,发文主要集中在20世纪80年代末,是中医计算机辅助诊断研究最早的代表团队;李海鲲团队来自合肥工业大学,属非中医类团队,主要应用不同理论模型研究中医辅助诊断及专家系统,发文主要集中在2001-2010年,是中医计算机辅助诊断研究第二次成为热点时的核心团队;杨学智团队来自北京中医药大学,主要研究四诊合参辅助诊疗的数字化和智能化,发文时间在1999-2019年,研究持续达20年,是一个稳定的中医类团队;温川飙团队来自成都中医药大学,主要应用人工智能技术研究中医计算机辅助辨证论治,发文集中在2015-2020年,是近年来新的核心团队。而图谱中其他几个团队如李肇夷、杨健、陈国宁、陈曦、刘健等在发文1~2篇后再无相关研究,说明未形成稳定的研究团队。以上4个稳定的团队所处时间跨度较长,并且团队之间合作较少,中医和计算机专业团队还未形成成熟的跨学科合作模式。
2.3 发文机构分布
对研究机构进行共现分析,见图3。共现图谱中的节点代表发文机构,节点半径越大表明该机构发文量越多;节点间的连线代表2个机构的共现关系,连线越粗表示合作越密切。结果显示,节点数N=241,连线数E=89,Q值=0.931 6,S值=1,表明共出现研究机构241个,机构之间共有89个合作关系,机构之间合作较少,主要以中医药院校和其附属医院合作为特点,形成了以北京中医药大学、湖南中医药大学、南京中医药大学为核心的研究机构网络。发文量前2位的研究机构为北京中医药大学(11篇)、湖南中医药大学(5篇),见表2。
2010年之前,北京中医药大学各学院及其附属医院的研究主要以数字化中医诊断系统研究为主,2010年之后,中医四诊合参的数字化和量化研究发文逐渐增多,成为研究的主要方向。湖南中医学院于2006年更名为湖南中医药大学,2个机构共发文9篇,仅次于北京中医药大学。湖南中医药大学中医计算机辅助诊断研究具有时间上的连续性,2010年以前主要研究中医专家系统及以朱文峰团队为核心开发的WF文锋-Ⅲ中医(辅助)诊疗系统;2010年以后引入人工智能技术研究智能化辨证方法。南京中医药大学相关机构集中在专病的专家系统或辅助诊断系统研究,研究时间为1999-2020年。
通过统计分析发现,中医药院校和科研机构发文量较大(见表3)。医学类研究机构共153个,其中中医类研究机构107个,占总体的44.40%。中医计算机辅助诊断研究不仅涉及医学类研究机构,而非医学类研究机构占比达到了36.51%,说明中医计算机辅助诊断研究在计算机领域也引起了普遍关注和研究,属于交叉学科研究领域。
综合发文作者与发文机构的数据发现,发文量较大的研究机构与研究团队,只有北京中医药大学和成都中医药大学的研究团队相对应,而非中医药类研究机构虽然开展计算机辅助诊断研究较早,但研究方向与发文持续时间不够稳定,参与的机构和人员分布比较分散。
2.4 中医计算机辅助诊断研究热点分析
通过CiteSpace v.5.7.R2软件进行关键词聚类分析,生成关键词聚类图谱。共计出现关键词739个,关键词之间的共现关系有1439个,聚类分析后Q值=0.789 1,S值=0.927,表明关键词聚类效果较好,结果可信。出现频次≥6的关键词见表4,生成的关键词聚类图谱见图4,在“Cluster Explorer”中选取前12个聚类标签,通过LLR算法提取聚类标签词。聚类号与聚类大小成反比,最大聚类以#0标记,同时选取出现频次≥3的关键词形成表5。
通过对表4、图4、表5结果进行分析,排除中医、中医药等中医类关键词后,将中医计算机辅助诊断研究内容归纳为以下几点:
⑴中医专家系统研制。相关关键词有人工神经网络、不确定性推理、模糊数学、推理过程、专家系统工具、中医诊疗、中医专家、老中医、系统研制。中医专家系统的研究从20世纪80年代开始至今[6-7],一直是研究的热点之一。在研究名老中医学术思想和挖掘名老中医经验的基础上,借助计算机技术,构建中医专家数据库,应用数学理论和推理模型研制中医专家系统并应用于临床辅助决策和中医诊断教学中,是中医药传承和现代化的有效途径。
⑵中医电脑诊疗系统的研究。相关关键词有知识库、数据库、知识表示、知识获取、知识图谱、模式识别、模糊逻辑、知识工程、知识发现、辨证、伤寒论、证素、中医辅助诊疗系统、临床应用、中医体质、大数据、高血压。电脑诊疗系统不同于专家系统,而是以中医药知识工程为基础,构建中医药知识库,在知识表示和知识获取的基础上,研究中医药知识发现,同时引入了知识图谱、数据挖掘等新技术,将中医临床辅助诊断的适用范围从临床诊疗延伸到健康管理等领域中。中医电脑诊疗系统是对中医专家系统的扩展和延伸,以实现更多的功能[8-12]。
⑶中医辨证论治模型研究。相关关键词有粗糙集、神经网络、关联规则、属性约简、支持向量机、中医辅助诊断。中医辨证论治模型是对中医认知模式和中医辨证论治的模型化表示,通过借助数学模型和算法、信息化技术,构建辨证论治模型,应用于中医辅助诊断系统中,辨证论治模型是中医计算机辅助诊断系统运行的核心[13-17]。
⑷中医诊断客观化研究。相关关键词有中医辨证、脉诊、推理机、分类、中医舌诊专家系统、传统中医、诊断、计算机中医诊疗系统、经络。传统中医的辨证诊断主要以定性为主,较多依赖主观因素,较少借鉴客观化、量化指标[18]。计算机的数据处理需要精确的数据支撑,因此,中医诊断的客观化和量化研究也是举足轻重的。目前以舌诊、脉诊和经络诊断的量化、客观化研究为主[19-23]。
⑸中医诊断智能化研究。相关关键词有人工智能、机器学习、人机交互、中医按摩机器人、数据挖掘、四诊合参辅助诊疗仪、属性偏序结构图、智能诊断、亚健康、案例提取网、健康管理、智能问答。随着信息技术的进步,大数据、人工智能技术的广泛应用,越来越多的学者开始研究人机交互的智能诊断、智能问答、中医领域知识图谱构建等新兴的解决方案,并且在亚健康、体质学饮食、中医按摩等方向开展了研究,这些主题将会是今后的热点主题[24-27]。
2.5 突现词分析
通过CiteSpace的时区图可以發现研究热点随时间的演变,对关键词进行突现分析可以发现高突现值的关键词热点,推测中医计算机辅助诊断研究的前沿主题和发展趋势。对关键词进行时区分析,见图5。结果显示,节点数N=361,连线数E=580,聚类分析后,Q值=0.77,S值=0.897 9。
在图5基础上分析突现词,选取Top22的关键词进行分析,见图6。
由图5可以看出,中医计算机辅助诊断研究的第1个高峰期(1985-1995年),主要围绕中医专家系统和中医知识库的研究,侧重于数据模型和推理,并且提出了人工智能在中医诊断中的应用。第2个高峰期(2001-2010年),研究重点为数据挖掘和知识表示在中医辅助诊断中的应用,侧重于诊断模型的构建。第3个阶段(2011年-至今),时区图中关键词以知识发现、大数据、机器学习、知识图谱、智能问答为核心。
近期前沿热点和趋势主要围绕中医药的知识发现、人工智能、机器学习、神经网络、知识图谱研究,说明近期和未来一段时间的研究热点有可能侧重于以中医药大数据为基础,通过机器学习、神经网络、知识图谱等新技术和新方法,助力人机交互的智能化中医辅助诊断研究。
3 小结
本文通过CiteSpace软件对CNKI发表的中医计算机辅助诊断研究相关论文进行文献计量学和知识图谱可视化分析,通过发文量统计、作者及研究机构的知识图谱和关键词的共现与聚类图谱数据,了解中医计算机辅助诊断研究领域研究主题随时间的演变,可以清晰看出2个该领域研究的高峰及研究主题的变化,随着计算机和信息技术的不断更新迭代,机器学习、神经网络、知识图谱等新方法的出现,以中医药大数据为基础的人工智能研究很有可能成为将来的研究热点。
参考文献
[1] 新华网.习近平对中医药工作作出重要指示强调 传承精华守正创新 为建设健康中国贡献力量 李克强作出批示[J].(2019-09-25) [2020-11-01].http://www.xinhuanet.com/politics/leaders/2019-10/25/c_1125151959.htm.
[2] 姚敬心,邓文祥,李静,等.中医辅助诊疗系统在医疗活动中的应用现状及发展分析[J].中国中医药现代远程教育,2019,17(15):55-57.
[3] 陈道灼,孙建嵩,林炳承,等.林如高骨伤电脑诊疗系统骨折部分研制简介[J].福建中医药,1981(4):12-15,8.
[4] 陈德济,张景芳,朱学增.中医痹证计算机辅助诊断系统[J].计算机应用通讯,1981(0):1-5.
[5] CHEN C M, CHEN Y, Horowitz M, et al. Towards an explanatory and computational theory of scientific discovery[J]. Journal of Informetrics, 2009,3(3):191-209.
[6] 年玮.脏腑辨证专家系统在中医诊断教学中的使用研究[J].电子世界,2013(21):163-164.
[7] 彭春龙,付卓,庞玉文,等.一个能从病例中自动获取知识的中医专家系统生成软件[J].微型机与应用,1989(1):27-29.
[8] 程良铨,孫德保,吕汉兴,等.数据库及知识工程在中医专家系统中的应用[J].华中理工大学学报,1989(5):15-20.
[9] 罗计根.面向中医领域知识图谱构建的关键技术研究及应用[D].南昌:江西中医药大学,2019.
[10] 杨永锋.大数据在中医领域中的应用[J].甘肃科技,2020,36(15): 14-16.
[11] 杨丽.基于知识推理的中医临床诊疗决策支持方法研究[D].北京:北京交通大学,2014.
[12] 赵文,李书楠,徐佳君,等.智能化中医辅助诊疗系统模型构建[J].中华中医药杂志,2020,35(5):2421-2424.
[13] 党春艳.新属性约简算法在脾胃辨证分型中的应用研究[D].广州:暨南大学,2010.
[14] 邹伟伟.中医儿童性早熟智能诊断算法研究[D].上海:东华大学,2012.
[15] 王合山.基于遗传算法的模糊神经网络及其在中医类风湿性关节炎诊断中的应用研究[D].昆明:昆明理工大学,2005.
[16] 秦中广.基于粗糙集的交叉研究及其在中医诊断的应用[D].广州:华南理工大学,2002.
[17] 李四海,吕晓云.D-S证据融合的中医辨证模型[J].计算机工程与应用,2014,50(15):240-243.
[18] 李家星,林凌,宋俊生,等.中医证候定量诊断的研究现状与思路概述[J].中医杂志,2010,51(10):950-952.
[19] 栾景民.基于属性偏序结构数学原理的中医数量化辨证诊断辅助系统研究[D].秦皇岛:燕山大学,2014.
[20] 李慧,张尚尚,芦煜,等.2型糖尿病中医数字化、量化的四诊特征研究[J].云南中医学院学报,2015,38(2):43-46.
[21] 张莹莹.基于知识图谱的舌像诊疗系统研究与构建[D].成都:电子科技大学,2019.
[22] 王燕.中医脉象客观定量化理论方法研究[J].世界科学技术-中医药现代化,2005,7(1):118-122,143.
[23] 王光文.人体经络数据库及辅助诊疗系统的研究[D].济南:山东大学,2010.
[24] 李江平,韦玉科.亚健康中医诊断系统[J].计算机工程,2005, 31(15):222-223,231.
[25] 付德坤.基于模糊决策的体质学饮食推荐建模及其系统实现[D].成都:电子科技大学,2013.
[26] 刘玲云.中医按摩机器人专家系统的研究[D].济南:山东建筑大学, 2016.
[27] 任薇,彭宁,范会丽.基于传统规则的中医知识智能问答系统研究[J].电脑知识与技术,2019,15(32):200-201.
(收稿日期:2020-11-25)
(修回日期:2020-12-28;编辑:郑宏)