苏芳荔 常人杰
数字人文,是对人文学科与计算之间的重合地带进行研究、创新的领域[1]26。从20世纪80年代初开始到20世纪末获得较快发展,主要集中在文本分析与编目、语言特征、教学支持和学习环境、结构化数据分析的影响等方面[2]190,如将古典文学资料转为数字形式的珀尔修斯项目、提出了文献在文化历史学家工作中的角色问题的暗影之谷(The Valley of The Shadow)项目等[3]55。数字人文的研究为人文学科提供新的视角,产生新的问题并进行解答。数字人文研究所涉及的领域较多,在研究对象方面也呈现着多学科特征。
知识的产生与传承离不开知识扩散,同时,知识扩散还可以促进知识创新。现在,我们处在互联网时代,信息需求量旺盛,所接触的数据大部分都来自于各种网站与数据库,可供选择的数据源较多且获取方便。对于大量的信息需求,研究知识扩散的规律可以帮助降低获取知识的成本,并大大提高效率。引用关系即代表知识扩散[4]31。 “ 基于引文的知识扩散 ” 是指知识在研究性文献中的转移[5]13。也有学者的研究把知识扩散分为组织知识扩散和学科知识扩散[6]48。总体而言,知识扩散可以帮助学科的知识传承并且还可以帮助学科创新。
1.数据选择与获取。Web of Science 是世界上最广泛的学术信息资源数据库,包括在各个研究领域影响力最大的核心学术期刊。以Web of Science 上2009—2018年收录的有关数字人文的文献为对象,从引文分析角度,对数字人文领域跨学科知识扩散的现状进行分析研究。
本研究选取Web of Science 核心合集为研究数据库,在主题字段中以 “ digital humanity ” or “ digital humanities ” 作为主题词进行检索,文献类型限定为 “ article ” ,时间范围限定为2009—2018,索引数据库包括SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、BKCI-S、BKCI-SSH、ESCI、CCR-EXPANDED、IC。共获得1710条文献数据,对检索所得文献记录进行下载,保存为原始文献集。原始文献总计被引6246 次,篇均被引3.65次,施引文献共4775 篇。打开原始文献检索结果页面引文分析中的施引文献记录,对施引文献记录进行下载,定义为施引文献集。
2.知识扩散指标。被引频次受时间因素影响较大,在进行知识扩散分析时还需要考虑到时间因素的影响。知识扩散指标包括知识扩散广度、知识扩散强度与知识扩散速度。
(1)知识扩散广度(KDB)。广度值是指某一领域文献被引用总次数与统计时间段内的年数的比值。公式为:
Ni为统计时间内的被引总数,Ypub表示从统计起点到终点的年数。学科的知识扩散是一个逐渐积累上升的一个过程,累积扩散广度KDB*反映了一个学科知识扩散的累积状况,其计算公式如下:
其中Ni为第i年的被引次数。该指标能够更好地反映出学科知识扩散广度的积累发展情况,根据公式计算得到数字人文领域的累积扩散广度KDB*。
(2)知识扩散强度(KDI)。A 学科被B 学科引用的数量除以总被引次数叫做A 学科对B 学科的知识扩散强度,简称KDI,其计算公式为:
其中Ni为A 学科被B 学科引用的数量,∑Ni为A学科的总被引次数。
(3)知识扩散速度(KDS)。知识扩散速度(KDS)的计算公式为:
其中,Pcit表示不同引用期刊总数,Ypub表示从统计起点到终点的年数。
1.跨学科知识扩散分布。数字人文领域扩散学科中,图书情报学、计算机科学等占有较大比重,学科扩散速度越来越快,扩散学科越来越多,扩散多样性好。学科交叉融合背景下,学科的边界正在逐渐被打破,通过互相合作实现学科间互利共赢、知识创新和优势互补,学科间的互相渗透能够细分出更多的交叉学科,实现学科的发展。学科知识的扩散不仅能通过合作等方式达成,也能通过引用和被引达成。一个学科通过引用其他学科的知识来发展自己的研究。数字人文知识扩散次数最多的学科多属于人文与社会科学领域,图书情报学对数字人文知识的吸收为19.23%,是最大的知识吸收学科,远远高于排在第二位的人文计算(374 次,9.58%),在知识扩散接收方中占据核心地位。2009—2018年,数字人文领域文献共被201 个学科引用,我国图书情报学学科交叉能力快速增长,但综合影响力仍然有限。
2.知识扩散测度。
(1)知识扩散广度(KDB)分析。知识扩散广度是从范围的角度对科研领域的知识扩散进行描述,指某一学科领域文献的被引用次数除以年数的商。学科的知识扩散是一个逐渐积累上升的过程,累积扩散广度KDB*是一个对于知识扩散的修正指标,反映了一个学科知识扩散的累积状况。通过该指标能够更好地反映出学科知识扩散广度的积累发展情况,根据公式计算得到数字人文领域的累积扩散广度KDB*。数字人文相关研究的年度知识扩散广度如表1。
表1 数字人文领域逐年知识扩散广度
可以看出,数字人文领域知识扩散广度在十年间总体呈现上升趋势,随着大数据时代的到来,学科之间的知识交流增加,越来越多的学者开始关注数字人文与学科的融合。
(2)知识扩散强度(KDI)分析。知识扩散强度是从指定路径上的频次的角度对知识扩散进行描述,指定路径上的扩散次数越多,知识扩散强度越大。Liu 和Rousseau 定义了 “ 学科扩散广度 ” ,A 学科被B 学科引用次数与总被引次数的比值为A 学科对B 学科的知识扩散强度。知识扩散强度可以体现本学科对其他学科的影响程度,2009—2018 十年间数字人文领域知识在不同学科的扩散强度如表2 所示(见下页)。
由表2 可知,受数字人文知识影响最大的学科是图书情报学,扩散强度达到了0.120,其次为人文计算、教育研究。总体来看,数字人文知识对人文与社会科学领域学科的影响程度较大。值得注意的是,计算机相关学科虽然没有排在扩散学科高位,但是计算机科学在数字人文领域知识扩散接收方中也占据着重要地位。
表2 数字人文领域知识扩散学科强度TOP20
(3)知识扩散速度(KDS)分析。知识扩散速度描述的角度是从单位时间内运动距离。对于扩散目标来说,所耗时间越短,扩散速度越快。知识扩散速度会影响到知识创新的进步,知识扩散的速度越快,会使知识共享与融合更加快捷和广泛,降低知识创新成本,从而加速科技发展。2009—2018年数字人文领域1710 篇论文共被2025 个不同期刊引用。数字人文领域2009—2018十年间的知识扩散速度见表3。
表3 数字人文领域每年知识扩散速度
知识扩散的速度可以用来衡量知识发展的快慢。加快知识扩散的速度,可以有效减少可用知识流失。提高知识扩散的速度可以减少获取知识所需的时间,提升知识利用效率。表3 表明,知识扩散速度整体呈明显的逐年增长趋势,知识扩散速度越快,代表数字人文领域知识的利用率越高。
主路径是在某一领域的引文网络中具有最高遍历值的一条引文路径,计算的是一篇文献与其他文献连接时的需要程度。主路径分析方法可以帮助有效地识别领域的知识变化,是一种基于 “ 连通性 ” 降低知识网络复杂程度,提取关键路径的定量和可视化方法,对于探测技术发展路径具有重要意义。
本文首先利用Histcite 中的Graph Maker 作图分析功能,采用搜索路径计数(SPC),识别出2009—2018年数字人文研究领域研究内容知识扩散的主路径主要有三条且较独立,包含12 个节点,大多处于知识扩散网络的核心位置。知识扩散的过程中,新知识产生后随着其不确定性的降低,知识接受者会先迅速增加然后逐渐下降,图中知识扩散主路径呈现由分散到聚合的趋势,表明数字人文研究逐渐成熟,界定更加清晰,形成核心研究领域。三条主路径的信息见表4、5、6(见下页)。
路径1:由数字人文研究的方法论到与历史学科结合的 “ 数字历史 ” 的变化。数字人文本就是一个数字技术在科学研究领域普及的背景下,人文学科开始使用快速发展的网络技术来进行研究而发展起来的跨学科领域。由表4 中可以得出路径1 的情况,原始数据时间段内,人文学科由如何与电子科学进行融合的方法论研究,数字化的趋势愈演愈烈,研究者需要相应的工具来进行研究工作,开始注重实践当中数字化研究的基础设施的发展方向,然后开始关注领域发展出现的问题与争议, “ 数字历史 ” 受到关注。众所周知,数字人文是一个文科与工科的交叉学科,其研究内容与范围受技术发展的影响很大。从目前国际数字人文研究趋势来看,基于GIS 的历史地理可视化是数字人文目前所受关注较多的研究方向。
路径2:由对数字人文领域学科的谱系研究到数字人文与图书馆的结合研究,与历史学科结合的数字历史的变化。该路径早期对数字人文进行谱系研究,探讨其发展等理论性研究,然后开始关注图书馆与数字人文研究之间进行融合的现实性研究。
路径3:由数字人文对人文学科的影响到数字人文学科与人文学科、图书馆的结合。早期关注点仍然在于数字技术与人文学科的融合方面,担心数字技术正在对人文学科产生不利的影响,然后开始关注数字人文是否能促进人文学科的发展以及数字人文与高等教育的关系,最后落脚点在图书馆与数字人文研究之间进行融合的现实性研究。
整体看来,数字人文领域的总趋势是由对学科自身特点及发展趋势等理论研究,发展为与学科进行融合发展的研究,如数字图书馆与数字历史。从目前国际数字人文研究趋势来看,数字图书馆、数字历史都是数字人文研究前沿。
数字人文领域知识扩散跨学科性越来越显著,到2018年已扩散至160 个学科。扩散速度也是呈明显增长趋势,呈现了活跃的知识扩散势头。数字人文领域知识扩散的路径主要有三种趋势,总趋势是由对学科自身特点及发展趋势等理论研究,发展为与学科进行融合发展的研究,如数字图书馆与数字历史。从目前国际数字人文研究趋势来看,数字图书馆、数字历史(历史地理可视化)都是数字人文研究前沿。数字人文领域的研究脉络在不断细分和深化,历史学相关研究集中度较高,并有研究逐渐深化的趋势。
表4 数字人文领域知识扩散路径1
表5 数字人文领域知识扩散路径2
表6 数字人文领域知识扩散路径3