张 莉
(南昌师范学院,江西 南昌 330032)
数字图书馆这一概念最早诞生于美国,1994年美国国家科学基金会(National Science Founda⁃tion,NSF)、国防部先进研究项目局(Advanced Re⁃search Projects Agency,DARPA)、国家航空航天局(National Aeronautics & Space Administration,NASA)联合资助美国六所大学的因特网技术基础设施即数字图书馆项目[1]。我国是从1995 年开始从国外引荐、描述和研究数字图书馆[2]。至今数字图书馆已经历25 周年的发展变迁。对数字图书馆研究现状、研究前沿和趋势进行文献计量分析,归纳最近五年境内外数字图书馆研究主题,对比分析境内外数字图书馆研究热点的异同,查找研究领域的遗漏,有利于了解自身的定位,明确我国数字图书馆研究和建设努力的方向。
采用文献研究法,从Web of Science(WOS)核心库中查找2015 年来有关数字图书馆的文献进行文献计量分析。以署名“Peoples R China”区分境内外文献,署名为“Peoples R China”的是境内文献。学科范围选择信息科学与图书馆学(IN⁃FORMATION SCIENCE LIBRARY SCIENCE)和计算机科学与信息系统(COMPUTER SCIENCE IN⁃FORMATION SYSTEMS)。境内文献WOS 检索式:((TS="digital library" OR TS="DIGITAL LI⁃BRARIES" OR TI=digital library) AND PY=(2015-2019)AND(AD="Peoples R China")AND(WC=IN⁃FORMATION SCIENCE LIBRARY SCIENCE OR WC=COMPUTER SCIENCE INFORMATION SYS⁃TEMS) NOT (TS="ACM Digital Library"))。境外文献WOS 献检索式:(TS="digital library" OR TS="DIGITAL LIBRARIES" OR TI=digital library)AND PY=(2015-2019) AND (WC=INFORMATION SCIENCE LIBRARY SCIENCE OR WC=COMPUT⁃ER SCIENCE INFORMATION SYSTEMS) NOT(AD="Peoples R China" OR TS="ACM Digital Li⁃brary")。检索语言选择英语(English),文献类型选择所有文献类型。引文索引选择Science Cita⁃tion Index Expanded(SCI-EXPANDED)、Social Sci⁃ences Citation Index (SSCI)、Arts & Humanities Ci⁃tation Index (A&HCI)。“ACM Digital Library”为过滤的无关文献,并手工进一步过滤无关文献。最终获得境外文献302篇,境内文献65篇。
分析工具采用SATI、Citespace 进行关键词共现分析、社会网络分析、聚类分析等知识图谱分析[3][4]。采用SATI 统计词频和绘制社会网络图谱,进行共词矩阵分析。运用Citespace 统计词频,计算中心度(Centrality),进行关键词共现分析以及聚类分析。中心度(Centrality)指节点在社会网络中的中心地位,取值范围为[0,1],其值越高该节点在网络中越重要,越可能是研究热点词。中心度的计算公式如下:
xij表示i 与j 有无关联,1 表示有关联,0 表示无关联。G表示节点数量。聚类分析是运用某种相似度计算算法将对象集合分组为若干类似的对象组成的多组分类的分析方法。本文采用对数似然比(log-likelihood rate,LLR)算法分析计算关键词和文献相似度并进行分组聚类,以便概括聚类文献的研究内容[5]。突发性(Burst)检测是Citespace根据Kleinberg于2002年提出的算法,按年度分别探测发文数量突然增加的情况,值较大表示关键词在该年度的研究热度上升[6]。本文采用突发性检测指标来探测研究热度上升的新兴研究领域的关键词,但均未显示出突发性,表明还没有在哪个研究领域形成突发的研究热潮。
2.1.1文献作者
境外共有685 位作者参与了数字图书馆研究,第一作者270位,第一作者发文量最高的作者是美国阿拉巴马大学(University of Alabama)的Albertson Dan,发文4 篇。他的主要研究领域是可视化信息检索、数字图书馆视频资源检索等。境内作者共有194 位,第一作者53 位,第一作者发文量最高的作者是武汉大学的查先进(ZhaX⁃ianjin),共发表6 篇文献。他的主要研究领域是社交媒体信息处理、移动图书馆(包含可用性、易用性、用户体验、移动上下文环境等研究)、电子服务质量(包含信息、系统和服务等)、数字图书馆技术接受模型等。以年度发文频次两篇以上为统计标准,绘制出核心作者合作网可视化图谱如图1、图2所示。境内最大的核心作者合作团队是武汉科技大学的严亚兰(Yalan Yan)、查先进等5人,3人以上的合作团队有2个。严亚兰主要研究数字图书馆信息获取自我效能感,并且与查先进的研究领域有合作研究。境外最大的核心作者合作团队是比利时根特大学(University of Gh⁃ent)的Erik Mannens 等5 人,3 人以上的合作团队有4个。Erik Mannens团队主要研究关联数据、语义检索、社交媒体等。可见以上团队都有各自的研究领域,核心作者团队的重要作用在于开拓领域研究的广度和深度、推动学科研究与发展。
图1 境内核心作者合作可视化图谱
图2 境外核心作者合作可视化图谱
2.1.2发文机构
表1 发文机构
发文量排名前5的机构如表1所示。绘制机构合作可视化图谱如图3、图4 所示。武汉大学发文量17 篇远超境内外其它机构,且中心度(Centrality)最高为0.13,与武汉科技大学和华中师范大学等11所机构具有合作关系,表明武汉大学在数字图书馆研究方面显示出绝对优势。由图3的图谱可见已经形成了两个较大的机构合作网,一个是以武汉大学和华中师范大学为中心形成了一支强大的机构合作网,另一个分支是以南京大学为中心的机构合作网。
图3 境内机构合作可视化图谱
图4 境外机构合作可视化图谱
2.1.3国家和地区发文分析
表2 国家和地区发文情况
图5 国家和地区合作可视化图谱
国家和地区的发文情况如表2所示。美国发文量123篇最高且远超其它国家和地区。中国境内发文量64篇排名第二,同时境内的发文中心度比较高,说明近年来中国境内与其它国家和地区的合作较为广泛。绘制国家和地区合作可视化图谱如图5 所示,紫色外圈表示中心度较强的节点,连线粗细表示合作强度,节点大小表示发文量。由图5可知美国、中国、西班牙和英国是数字图书馆领域研究的四个中心国家。中国境内与众多国家和地区存在科研合作关系,遍布亚洲、北美洲、欧洲、非洲、大洋洲等国家和地区,显示出境内注重与境外相互学习和研究的良好态势。
2.2.1 关键词共现比较分析
关键词共现分析是根据同一篇文献中关键词共现频率绘制以关键词为顶点、共现频率为边权值的复杂的关键词共现网络[7]。境内外文献高频关键词如表3所示,各取词频排名前25位的关键词。
表3 境内外文献高频关键词
interface pattern evaluation network impact experience search technology acceptance model mobile library higher education usability 2 2 2 2 2 2 2 2 2 2 2 0.37 0 0.41 0 0 0.06 0.05 0 0 0 0 ontology linked data usability technology behavior service user interface digital humanity institutional repository knowledge classification 8 8 8 8 7 7 6 6 6 5 5 0.05 0.04 0.05 0.06 0.03 0.07 0.02 0.01 0.06 0.03 0.03
境内外共同排在前几位的高频关键词是模型(model)、服务(service)、高校图书馆(academic library)、检索(retrieval)、系统(system)、技术(technology)、因特网(web)。模型(model)是中心度最高的热点关键词。与模型共现最高(即最相关)的关键词是在线(online,在线信息系统等)、科学论文推荐系统(scientific paper recommender system)、协同过滤(collaborative filtering)、元数据(metadata)、技术(technology)。对模型的研究表明数字图书馆正处于应用研究阶段,各种技术、系统、在线资源和服务模型有待探索、挖掘、验证和改进。与服务(service)共现频率最高的关键词是信息技术(information technology)、感知有用性(perceived usefulness)、采纳(adoption)、信息科学(Information sciences)、信息生态(Information ecology)。与高校图书馆(academic library)共现频率最高的关键词是电子资源(electronic re⁃source)、未来(future)、用户研究(user study)、满意度(satisfaction)、信息管理(information manage⁃ment)、数据分析(data analysis)。检索(retrieval)关键词具有较高的中心度,是与系统设计(de⁃sign)、用户(user)、信息查找行为(information seeking behavior)、搜索引擎(engine)最相关的研究。
学界探讨对知识(knowledge)的组织、分析和查找(search)[8]。数字图书馆的主要用户群体之一是学生(student),因此学界开展了大学学生数字图书馆使用行为[9],电子借阅等研究。学界分析研究用户界面(user interface),探讨人机交互、用户自我效能和减少信息负荷等[10]。影响(im⁃pact)是对数字图书馆技术、模型、服务等的用户使用影响因素进行调查和研究[11],是从用户使用的角度开展实证研究。可用性(usability)是对数字图书馆的可用性测试评价研究[12],它旨在改进数字图书馆应用系统的开发和服务设计。
分析境外不同的热点关键词,境内在一些领域研究不足需要加紧研究。用户研究(user study)应该放在数字图书馆建设的重要位置,体现以读者为本的服务宗旨。境内还应加强人机交互、使用日志、查询界面等研究,分析用户使用行为(behavior)[13]。加强数字图书馆数据管理(management)和分析的研究,如个人生成学习教育资源的管理[14]。加强数字图书馆技术研究,如元数据(metadata)、本体(ontology)、关联数据(linked data)、信息查询分类(classification)等研究。加强机构知识库(institutional repository)和数字人文(digital humanity)研究。
2.2.2 关键词聚类分析
(一)境内文献关键词聚类分析
运用Citespace 对境内文献关键词进行聚类分析并归纳研究内容,将关键词分成三组类别,各组S值大于0.7表明聚类内部联系非常紧密,聚类是高效率令人信服的[15],选取LLR算法处理后权值较大者为聚类标签,如表4所示。
表4 境内文献关键词聚类
聚类0,数字图书馆系统与服务研究。聚类1,信息处理和检索技术研究。聚类2,以用户服务视角研究数字图书馆信息获取服务。
(二)境外文献关键词聚类分析
运用Citespace 对境外文献关键词进行聚类分析和归纳,将关键词分成七组类别,各组S值在0.68以上,选取LLR算法处理后的权重较大的关键词作为标签,如表5所示。
表5 境外文献关键词聚类
聚类0,数字图书馆系统研究。具体可分为几个研究维度:(1)移动图书馆系统研究。(2)数字图书馆系统功能研究。聚类1,数字图书馆智能信息处理研究。具体可分为几个研究维度:(1)访问控制研究。探讨建立多级本体的数字图书馆体系结构,根据不同用户的权限进行不同领域概念的受控访问[16]。(2)推荐系统研究。(3)数字图书馆资源挖掘和利用研究,包含使用数据、作者、期刊、引文等的分析研究。聚类2,视觉和交互式检索研究。聚类3,在线图书馆资源和服务研究。具体可分为几个研究维度:(1)从图书馆员视角研究如何提供在线资源服务。(2)从用户视角研究在线图书馆资源及服务。(3)研究在线资源和服务的质量。聚类4,数字图书馆检索界面研究。具体可分为几个研究维度:(1)可视化、情境化界面研究。(2)分布式界面研究。聚类5,机构知识库研究。具体可分为几个研究维度:(1)机构知识库价值研究。(2)机构知识库数据管理、共享和重用研究。(3)机构知识库开放获取研究。聚类6,元数据、本体和语义标注研究。具体可分为几个研究维度:(1)运用元数据增强数字馆藏的可查找性和可交换性。(2)构建本体增强查询功能。(3)探索语义标注的数字图书馆语义web服务。
数字图书馆研究方兴未艾。对发文量、作者、研究机构、国家和地区的WOS 文献计量分析,多方位理清了数字图书馆前沿研究的现状,可作为相关机构或研究人员的参考。对境内文献的计量分析可以把握境内研究现状,查找研究差距。境内还有待向视觉和交互式检索、检索界面、用户、机构知识库、数据管理及利用、元数据、本体、关联数据、语义标注等研究领域进行深入研究。