基于知识图谱的国内数字人文研究现状分析∗

2020-04-08 08:47:04
图书馆学刊 2020年1期
关键词:可视化人文数字

陈 琳

(济宁学院图书馆,山东 曲阜 273155)

数字人文最早起源于人文计算一词。在深度数字化的时代,人文计算已经不能客观地反映其内涵,逐渐被数字人文所取代,成为其更恰当的表述[1]。作为数字技术与人文学科交叉的学术领域,近年来数字人文成为国内外热点研究方向之一,其研究开始于欧美,它的发展推动了人文研究的变革与创新,同时也受到了图书馆界的密切关注。在国内,也取得了突破性的进展,北京大学、南京大学等相继举行了数字人文专题研讨会与学术交流活动,北京大学从2016 年开始连续三年相继举办数字人文论坛,分别探讨数字人文概念、实践与反思[2]、数字人文与史学研究的互动与共生关系[3]及需求驱动下的数字人文项目;2017 年7 月,南京大学举办“数字人文:大数据时代学术前沿与探索”学术研讨会[4]。

1 数据来源与研究方法

笔者以中国知网学术资源总库学术期刊为数据来源,检索式为“主题=(数字人文)or(人文计算)”,研究的时间范围限定为2005—2018年,检索结果为343 条,利用中国知网的“导出/参考文献”功能导出所选文献,剔除不相关结果29条,得到有效文献314篇。

本研究选择CiteSpace 软件[5]和中国引文数据库作为分析工具,采用词频分析与引文分析的方法,从所选文献中提取关键词、作者、研究机构、出版期刊等数据,对国内数字人文研究的整体状况、研究热点及前沿趋势进行可视化分析。CiteSpace是美国德雷赛尔大学陈超美[6]教授开发设计的,本研究采用的版本是5.3.R8.12.30.2018。

2 基本数据统计分析

2.1 发文量年度分析

通过绘制文献发表的年度分布趋势曲线图可以直观地展示该学科研究领域所处阶段、研究发展速度及研究水平[7]。从所选文献数据中抽取数字人文研究文献的年度数据,对2005年至2018年所发表的文献数量进行年度可视化分析,如图1所示,国内学者真正关注这个领域则是在2005 年之后,特别是在2009 年,王晓光发表论文《“数字人文”的产生、发展与前沿》,首次对数字人文的概念、内容、发展历史、研究现状和前沿方向进行了综合介绍[8],2015年是国内数字人文研究的探索时期,这一时期,国内学者的研究主要集中在国外数字人文应用的项目运作、前沿实践、技术研究及在图书馆中的服务创新方面;2016年开始,我国数字人文研究开始进入繁荣时期,以北京大学、清华大学、南京大学等高校为首,围绕数字人文的前沿问题与应用项目,多次举办数字人文研讨会,将数字人文技术与史学、文学、地理学及艺术学等密切关联,推进数字人文项目在国内的实践与创新。

图1 2005—2018年发文量年度趋势

2.2 高产作者图谱分析

文献作者的发文情况反映了该领域研究的力量分布与活跃程度。图2 是通过中国知网可视化工具绘制的高产作者发文趋势图谱,作者位次不进行区分计算,图中发文量≥3 的作者有29 名,以第一作者且发表于核心期刊的作者发文量≥4的为鄂丽君、曾子明、夏翠娟,文章发表时间主要集中在2016年至2018年之间,这些国内学者的研究侧重于国外案例调研与国内实践项目研究。鄂丽君以英美高校图书馆为主要调查对象,研究其数字学术支持现状,特别是研究图书馆协会ARL 成员馆的数字学术支持[9],为国内大学图书馆开展数字学术支持提供参考和借鉴[10];曾子明从数字人文视觉资源研究、移动视觉搜索等主题为切入点展开研究[11][12];夏翠娟则是在数字人文项目的建设与实践中不断探索,如以上海图书馆的开放数据应用开发竞赛为例,提出面向数字人文的图书馆开放数据服务框架[13];关联数据在上海图书馆家谱数字人文服务中的应用等[14]。

图2 高产作者发文图谱

2.3 高产研究机构图谱分析

图3 是由中国知网可视化工具绘制的高产研究机构发文情况图谱,发文量≥9 的研究机构有五家,主要是高校,且以南方院校居多,公共馆匮乏,只有上海图书馆一家。自2016 年开始,以上海图书馆为代表的图书馆界也不断在数字人文的应用中取得实践性进展,上海图书馆家谱知识服务平台基于关联数据技术,重新组织和利用已有的馆藏资源和研究成果,实现针对普通大众的常识普及和智慧寻根服务,针对人文研究学者的知识发现和知识挖掘服务[15]。上海记忆项目之“从武康路出发”利用数据技术,从上海图书馆藏资料中挖掘事实、数据和知识,重现城市在不同时间、空间、视角上的历史风貌,将不可移动的物质文化遗产与文化记忆资源深度融合,展现城市文化遗产的独特魅力,同时体现现代图书馆兼具公共性和人文关怀的重要价值[16]。

图3 高产研究机构发文图谱

2.4 高产出期刊图谱分析

期刊登载某一学科文献的数量反映了期刊对这一学科领域关注的程度,这项数据可以为关注这一学科领域文献的读者选择阅读期刊提供参考[17]。图4 是发文量前10 名的期刊及发文数量,历史发文量最高的是《图书馆论坛》,共计发文30篇。由图可以看出,前10 名高产出期刊中,除了《山东社会科学》,全部是图情学科刊物,图书馆是数字人文项目的孵化器,进一步整合人文学者和数字技术工程师的需求[18],国内学者对此深信不疑,并在数字人文的研究与实践中不断探索。

图4 高产出期刊分布情况

3 研究热点分析

3.1 热点关键词图谱分析

高频关键词是论文中出现频率较高的关键词,利用CiteSpace 软件对文献中的关键词进行词频统计、聚类分析,选出高频关键词并进行分析,可以获得该领域研究热点及其发展趋势[19]。在CiteSpace 软件中,设置结点类型“Node Types”为“Keywords”,“Selection Criteria”选择 Top N 为 50,得到热点关键词的知识图谱,如图5所示。

图5 热点关键词知识图谱

该图包含82 个结点,199 条连线,图中十字型图形代表以高频次关键词为结点的知识聚类图,字体和图形大小体现了该关键词的相对热度。从图5 中可以看出,国内数字人文研究主要围绕“数字人文”“图书馆”“高校图书馆”“数字学术”“人文计算”等关键词。样本文献中共出现了82 个词频≥2的关键词,其中词频为5次以上(包括5次)的关键词有18个,如表1所示。

表1 热点关键词频次排序

3.2 研究热点主题分析

通过对关键词词频的统计分析,可以得出数字人文研究领域的热点主题分布,掌握研究主题的成熟度、知识结构、研究的规模等状况[20]。国内数字人文研究主要包括以下3 个方面的研究热点主题。

3.2.1 国外数字人文研究的调研与借鉴

数字人文的概念起源于欧美国家,国内学者自2010 年开始不断调研国外数字人文研究状况,将国外先进的理念与经验引入中国,特别是以美国为关键词的数字人文调研性文章有11篇。如朱华顺以布朗大学、纽约公共图书馆为例,对美国图书馆数字人文项目进行研究并给出启示[21];邓要然等对美国高校数字人文中心进行调研,探究其运营机制[22],并对图书馆领域数字人文项目进行归类,分析其应用热点、运行和管理特征[23];鄂丽君通过分析ARL《SPEC Kit350:支持数字技术》调查报告,深入了解北美高校图书馆的数字人文支持现状[24],给我国高校图书馆以启示。目前,国内只有武汉大学、北京大学、南京大学三所高校建有数字人文研究中心,这也促使学者们要不断提高对于数字人文中心建设的关注度。李巧明、王晓光通过对欧美日及中国台湾的17家数字人文研究中心从项目状况、人员组成与组织结构、教育职能和活动开展4个方面进行调研,提出数字人文研究中心的发展要坚持项目运作模式,创新组织建设,以教育为本,靠活动助力等建议[25]。赵生辉、朱学芳对国内外高校数字人文中心的建设状况、模式特征等进行比较分析,提出构建高校数字人文项目资助体系、评价与认证体系以及数字人文领域复合型人才的培养等建议[26],对我国数字人文中心的发展具有借鉴意义。郭金龙、许鑫指出文本挖掘方法是数字人文研究的一个研究热点与趋势,并介绍了欧美发达国家文本挖掘应用于数字人文研究的前沿实践[27];崔春、毕强通过对美国普瑞特信息与图书馆科学学院的关联爵士项目的项目内容、开发步骤、实现功能等梳理,认为关联数据技术的出现为数字人文的发展提供了新的机遇[28];张宸等对北美高校图书馆将大数据智能可视化技术应用到数字人文研究、服务数据挖掘、图书馆服务评估进行调查与特征分析,为国内高校数字人文应用研究提供案例借鉴[29]。

3.2.2 数字人文的应用实践研究

数字人文的应用实践范围非常广泛,从目前国外数字人文研究趋势来看,应用实践主要包括历史学方面的基于GIS的历史地理可视化,文学方面的文本挖掘与TEI标准,语言学方面的基于大型语料库的语料库语言学,舞蹈方面的视频捕捉、运动分析与虚拟现实再现,以及考古学方面的图像分析、色彩还原和数字重建等[30]。国内学者关于数字人文的应用实践研究主要集中在可视化、数字图书馆、数字学术、人文学科、人才培养几个主要聚类。可视化聚类包括GIS、文本挖掘、数字史学、古籍数字化等关键词研究热点,如胡悦融等介绍了文学类文本的“远距离可视化阅读”理论与实践[31];董政娥等在调查中外纺织史文献资源馆藏状况基础上,提出从文本挖掘、GIS技术、文本可视化和语料库4 个方面进行纺织史数字化开发和馆藏补给[32];严承希、王军以宋代政治为例,借助符号分析方法对哈佛大学中国历代人物资料库进行实证探索与可视化分析,为研究宋代党争政治格局提供了一种新的思考方式[33]。数字图书馆聚类包括关联数据、移动视觉搜索、文本分析等关键词研究热点,如曾子明、秦思琪结合数字人文视觉资源研究现状和移动视觉搜索技术研究前沿,构建了面向数字人文的MVS 体系架构,为用户提供高效的面向数字人文的MVS 服务,拓宽了数字人文视觉资源的研究思路[34]。数字学术包括科研数据、数字学术中心、研究型图书馆等热点关键词,国内学者对这一聚类的研究主要集中在英美等国外图书馆、数字学术中心等应用实践的调研总结与分析上。人文学科聚类则是以人文研究、数字媒介等关键词为中心,针对数字人文在文学、史学等人文研究领域的应用方法、实践探索的研究与探讨。人才培养聚类包括数字素养、数字人文教育、学术图书馆等热点关键词,是近年来新兴的热点研究,我国在有关数字人文教育方面尚未形成系统的运行体系,徐孝娟等国内学者以英美高校为例,从课程方案、课程结构、课程层次和培养目标4 个维度对数字人文课程设置进行透视,结合我国数字人文相关领域的教育现状,提出数字人文课程及人才培养建议[35]。

3.2.3 数字人文在图书馆领域的研究

数字人文研究的论文分布非常广泛,涉及多个学科,且呈现交叉跨学科的特点。分布较多的前20 个学科分类如图6 所示,排在首位的是图书情报档案学科,数字人文研究关键词排序中,图书馆也是高频关键词之一,由此可以看出,图书馆是数字人文研究的最重要的研究领域。无论环境怎样变迁,图书馆作为服务部门在信息获取、内容数字化与策展、数字保存以及内容发现与传播等领域都有着不可替代的关键功能[36]。国内学者也深刻认识到图书馆在数字人文研究中的重要作用,在对国外图书馆支持数字人文研究进展、数字人文素养培训等方面进行调研与借鉴的同时,结合国内图书馆自身资源、技术与服务优势,在史学方面深度挖掘史学文献与大规模史料,进行文本化及数据集建设,如国家图书馆的“华夏记忆”项目,北京大学的“中国基本古籍库”项目,浙江大学的“中国历代墓志数据库”等。在语言学领域,在一定规模文本和教学科研需要下进行文本深度挖掘和智能分析,如“全唐诗分析系统”“全宋诗分析系统”等。在人文艺术领域,利用GIS、数据可视化等进行历史档案、考古地理资讯及城市发展史等进行分析与展示,如“淡新档案诉讼关系图”“宋人与宋诗地理资讯系统”等。

图6 数字人文研究文章所属学科分布

4 总结

数字人文是计算或数字技术与人文学科交叉的学术活动领域,它的发展推动了人文研究的变革与创新,成为国内外热点研究方向之一,同时也受到图书馆界的密切关注。笔者以中国知网学术资源总库为数据来源,以2005—2018年主题为“数字人文”或“人文计算”的检索文献为基础,借助CiteSpace 软件绘制知识图谱,通过对国内数字人文研究文献进行统计分析与内容挖掘,确定国内该领域的代表作者、高产研究机构及出版期刊,总结并得出国内数字人文研究的热点主题。目前,数字人文在国内的研究虽然还处于起步阶段,关注度却很高,特别是高校图书馆界,研究范围不再停滞在最初的国外数字人文研究的综述性探索,GIS技术应用、文本挖掘、古籍可视化、移动视觉搜索等新的研究主题成为热点,被更多的国内学者所关注,并逐渐在国内数字人文项目中应用与实践。在数字人文背景下,图书馆是作为数字学术研究与实践的拓展空间而存在的[36],图书馆作为信息与资源的集散地,首先,能够为数字人文研究者提供丰富的资源,也能够通过整合、标引等,为学者们揭示资源,提供服务支持;其次,为人文学者团队提供适宜的物理空间与虚拟化的共享空间,成为数字人文项目的孵化平台;再次,图书馆也将是数字人文的发展强有力的助推平台,能够从不同层面上对数字人文理念与项目进行推广宣传,促进学术沟通,提升数字人文学科的公众影响力。与此同时,图书馆参与数字人文项目的研究与实践也将面临一定的困境与挑战,如资源获取的版权问题、项目建设的标准统一问题、学科馆员能力参差不齐等,图书馆人应当保持冷静的头脑,对数字人文不要盲目跟从,要合理考虑数字人文项目需求与自身能力,发挥优势,寻求合作以弥补劣势,实现共同的目标。

猜你喜欢
可视化人文数字
人文
北京纪事(2024年1期)2024-01-03 03:16:55
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
传媒评论(2019年4期)2019-07-13 05:49:14
答数字
人文绍兴
中国三峡(2017年3期)2017-06-09 08:14:59
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12
人文社科
全国新书目(2016年5期)2016-06-08 08:54:10
让人文光辉照耀未来