文 卉 刘英杰
(湖北中医药大学图书馆,湖北 武汉 430065)
数字人文概念最先出现在2004年的《数字人文指南》, 其最初的核心特征之一就是使用计算机来解决传统人文研究中遇到的、传统手段无法解决的问题[1],而不是单纯地将人文学科内容进行数字化存储。 中医先圣李时珍的代表作《本草纲目》,曾被达尔文誉为“中国古代的百科全书”,因此对《本草纲目》、李时珍及其医学思想等进行研究的文献种目繁多,例如,莫亮波等从阴阳五行、天人相应、培元固真及脏腑学说四个方面考辨《本草纲目》对《黄帝内经》的继承与发挥[2];李载荣在其博士论文中详细比较了《本草纲目》流传过程中的三个不同版本体系及其在欧亚的传播[3];王剑等从李时珍的家庭影响、求学经历、生活时代处着手,剖析其“天人和通”的医道文化思想[4];赵方舟等提出李时珍的《濒湖脉诀》中首创以阴阳属性来分类脉象[5],还有其他学者研究李时珍生平、医德或者考证著作《本草纲目》的附方、释名等。 然而对于此类文献的定量研究却比较少, 为进一步了解李时珍医药文化研究的热点及区域分布情况, 本文基于文献计量学理论及信息可视化技术的运用,以中国知网(CNKI)平台1970年至2020年的李时珍医药相关文献为研究对象, 从数字人文角度对李时珍医药研究文献的热点及演化进行分析,根据关键词挖掘研究热点及聚类归纳研究方向。
本文数据来源于中国知网(CNKI)数据库,在中国知网数据库“期刊”文献检索栏(跨库:学术期刊、博硕)使用专业检索,检索式为SU=(李时珍+本草纲目+奇经八脉考+濒湖脉诀)AND KY=(东璧+濒湖+李时珍+本草纲目+奇经八脉考+濒湖脉诀)AND TI=(东璧+濒湖+李时珍+本草纲目+奇经八脉考+濒湖脉诀), 时间跨度为1970年01月01日至2020年07月01日, 检索时间为2020年11月12日,得到中文数据1362条,其中学术期刊1002条,学位论文32条,按统一剔除标准(剔除无作者文献、创刊词、会议通知、蕲春地区发展类文献等)手动删除不相关数据后,共得到有效数据1181条。
本文从数字人文角度, 以定量与定性相结合的方法,深入剖析李时珍医药文化的研究热点与区域分布。在定量研究方面,将在中国知网(CNKI)数据库选取的全部文献以Endnote格式导出(停用李时珍|时珍|本草纲目|《本草纲目》,高频字段显示个数100,矩阵大小设计100),导入文献题录统计分析工具软件SATI4.0[6],得到去重后文献1156篇, 对全部有效文献进行在线可视化分析,挖掘研究热点、归纳研究方向。
2.1.1 年发文量
某一研究领域的全年文献发表量能反映出该领域的研究发展趋势及其受关注的程度。本文以一年为一个时间段进行统计, 在CNKI收录的1970—2020年这段时间里,有关李时珍医药文化研究领域的全年文献发文量有四个明显的峰值, 分别是1983年36篇,1994年47篇,2006年56篇,2018年60篇。
2.1.2 重要发文机构
全部有效文献的发文机构总数共920个, 独立机构数682个。其中总发文量>5的机构有17个,利用SATI软件制作高频机构知识图谱(高频网络节点:频次排名大于或等于矩阵大小100), 进行去除噪点处理后,可以观察到8个互有关联的研究群体, 其中以湖北中医药大学、 中国中医科学院中国医史文献研究所、北京中医药大学为首的三个研究群体最为突出。
2.1.3 文献来源
本文研究的1156条有效文献来源于424种期刊,其中发文量大于10篇的有18种,已形成比较稳定的文献发表期刊群体。
1156 篇文献总作者数1738位,其中独立作者数1247位。 发文量大于等于5篇的作者有30位。 利用SATI软件制作高频作者知识图谱 (高频网络节点:频次排名大于或等于矩阵大小100),可以看出作者群体中出现四个明显的作者团体:一个以王剑、梅全喜等为主;一个以张冰等为主;以郑金生、张志斌等为主;最后一个袁一平等为主。同一作者团体提示研究内容或者主题相近,或研究领域出现密切关联。
图1
1156 条有效记录中有基金支持的文献去重后为53篇,分别来自19项基金支持,其中发表文献量超过5篇的基金有三个:国家自然科学基金(16篇)、国家重点基础研究发展规划(973计划)(9篇)、湖北省教育委员会科学研究计划项目 (5篇)。 以时间为序来观察,2019年获得基金支持达到顶峰,年发表文献15篇,其中药物防毒警戒思想方面达5篇, 提示2019年中药毒理研究、药物防毒警戒为热点研究项目。
关键词是一篇文献浓缩后的精华,可以从一定程度上反映出该文献的研究中心与主题。利用SATI软件将1156篇文献的关键词进行聚类分析 (停用关键词李时珍、时珍、本草纲目、《本草纲目》),根据高频关键词来发掘李时珍医药文化研究的热点。从关键词聚类分析表中发现,李时珍医药研究主要分为2个聚类,第一个是以本草、中药、版本、考证、王世贞、目录学等词为主的聚类;第二个是以中药学、植物药、中医学、学术思想、张仲景、太医院等词为主的聚类。以上两种聚类方式可以归纳出,李时珍医药文化研究主要分为两个方向:一个是从校勘正误的角度对李时珍的《本草纲目》进行版本、医药、本草等的考证与补充;第二个是从历史的角度对李时珍及其著作的出版、 内容、医学理论传承、经历等进行研究。
本文唯一的数据来源是中国知网(CNKI)平台,因此在统计结果上必然不是完全精确的。但是依据现有结果,依旧可以看出《本草纲目》作为李时珍的巅峰巨著,对研究者有极大的吸引力,无论是它的版本流传,还是正误辨析,或者是补充拓展,都有相当数量的文献研究。 而在李时珍研究的发文方面,发文机构和交流平台亦已形成自己的领域,都聚集了一批高产作者长期致力于李时珍研究。遗憾的是无论是研究机构还是作者本身,相互间的信息流动都略显不足,绝大多数还是处于研究孤岛的封闭式探索,出现重复研究或者资料采集困难的现象。本文运用定量方法对李时珍研究进行热点分析, 可以看出数字人文研究方法,尤其是某些计算机软件的运用,不仅创新了传统研究方法,也提供了新的研究视角。