基于知识图谱的国外智慧图书馆研究热点与前沿探析∗

2020-11-04 10:47何文珍江俊鹏
图书馆学刊 2020年10期
关键词:词频智慧图书馆

何文珍 江俊鹏

(1.绍兴文理学院,浙江 绍兴312000;2.中国科学技术信息研究所,北京100038)

1 引言

随着物联网、云计算、大数据、人工智能、区块链等新兴信息技术的快速发展,带来了智慧城市、智慧校园、智慧博物馆等的发展,同时也为图书馆的转型带来了新的机遇。2003 年,芬兰奥卢大学图书馆学者Aittola 在人机交互移动设备国际研讨会上发表题为《智慧图书馆:基于位置感知的移动图书馆服务》[1]的论文,文中首次提出“Smart Li⁃brary”的概念,指出“智慧图书馆”是一个不受空间限制且可被感知的移动图书馆服务,它能帮助用户找到所需的图书和资料。

近年来,随着智慧城市、智慧校园等的不断发展,国内学者对智慧图书馆展开了广泛的研究。在中国知网以“智慧图书馆”为主题进行检索,国内第一篇关于智慧图书馆的研究是华侨大学厦门校区图书馆的严栋于2010 年发表的题为《基于物联网的智慧图书馆》一文,该文将智慧图书馆定义为“以一种更智慧的方法,通过利用新一代信息技术来改变用户和图书馆系统信息资源相互交互的方式,以便提高交互的明确性、灵活性和响应速度,从而实现智慧化服务和管理的图书馆模式”。作者提出智慧图书馆=图书馆+物联网+云计算+智慧化设备[2]。初景利、段美珍[3]认为智慧图书馆是一种综合性的生态系统,人的智慧和智能化的设备是智慧图书馆的最基本也是最核心的构成要素,并认为智慧图书馆是图书馆发展的顶级形态。目前,国内关于智慧图书馆的研究主要集中于智慧图书馆的定义和特点、智慧图书馆的构建和应用设计、智慧图书馆的服务、馆员队伍的建设等方面[4]。

国外关于智慧图书馆的研究相对较早也相对成熟,笔者基于科学计量学的方法,以Web of Sci⁃ence 平台数据为基础,借助统计软件SPSS 和可视化软件Ucinet、CiteSpace对文献进行计量和可视化分析,通过解读知识图谱,分析智慧图书馆的概念被提出以来国际学者对智慧图书馆的研究热点,并发现智慧图书馆的研究前沿,以期为国内智慧图书馆的进一步研究和发展提供借鉴。

2 数据来源

在Web of Sceicne 平台上,笔者分别以“intelli⁃gent librar*”“wisdom librar*”和“smart librar*”为主题词进行检索,查看检索结果,发现主题词是“in⁃telligent librar*”和“wisdom librar*”的检索结果与智慧图书馆无关。故最终确定主题词为“smart li⁃brar*”,检索时间为2019 年9 月20 日,时间限定为2003—2019年,数据库选取SCI 和SSCI 数据库,共检索到相关文献1176 篇,检查检索结果发现很多文献都是生物医学方向的,因此手动对检索结果进行精炼,剔除与图书馆无关、无关键词的文献,得到有效文献共150篇,并下载相关文献题录信息。

3 研究热点分析

主题词和关键词是能够反映全文主题内容和信息的专业词汇或术语,能够反映研究成果的核心内容,关键词的变化可以体现学科研究的动态过程、特点和规律[5]。因此,笔者对智慧图书馆的研究热点的分析主要建立在对关键词分析的基础上,对关键词采用词频分析、社会网络分析和聚类分析研究方法,以揭示国际学者对智慧图书馆的研究热点。

3.1 关键词词频分析

一篇文献一般只有3-5个关键词,关键词是作者对文献的高度总结的专业词汇或术语,能够反映该文献的核心和精髓。因此,对某一学科或研究领域的文献关键词的词频进行统计分析,频次高的关键词能够从很大程度上代表该学科或研究领域的热点问题[6]。

对下载的题录信息中的关键词进行必要的处理:对单词的大小写、单复数、缩略词等进行统一、对同近义词进行归并等,得到关键词共555个。由于智慧图书馆是一个新型的研究领域,所以关键词的词频比较分散,笔者认为词频大于等于3的关键词(见表1)为高频关键词。高频关键词主要体现在图书馆、移动通信、大数据、因特网等方面,除去包含library 的关键词,词频比较多的关键词有RFID、Internet of Things(IoT,物联网)、Mobile Tech⁃nology(移动技术)、Big Data(大数据)、Mobile de⁃vices(移动设备)等,其中,RFID 的词频最多。此外,高频关键词体现国际学者对智慧图书馆研究涉及的领域主要有移动技术、大数据、计量、数据挖掘、智能手机、云计算、电子学习、信息素养等方面。

表1 高频关键词词频表(词频≥3)

3.2 社会网络分析

社会网络分析法是对社会关系结构及其属性加以分析的一套规范和方法,能够从定性和可视化方面对定量分析进行补充[7]。图书情报界学者广泛应用社会网络分析法对文献进行关键词共现分析、作者合著、机构合著、引文分析等方面。笔者采用社会网络分析法对关键词进行共现分析,从而揭示出国际学者对智慧图书馆的研究热点。

首先,对关键词进行必要的规范化处理,由于智慧图书馆是一个新的研究领域,尚未形成固定的研究方向,关键词比较分散,为更加全面地展示智慧图书馆的研究领域,截取频次大于等于2的关键词进行社会网络分析。利用VBA编程构建关键词共现矩阵,截取部分关键词共现矩阵,如表2所示。

表2 关键词共现矩阵(部分)

将关键词共现矩阵导入软件Ucinet,利用Net⁃draw 的可视化功能,将关键词的共现关系以网络图的形式展现(见图1)。图中每个节点代表一个关键词,节点的大小反映关键词的词频,节点越大说明关键词的词频越大,节点间的连线表示关键词之间共现情况,连线越粗说明关键词共现的次数越多,关键词间的关系越密切。

图1 关键词共现网络

根据节点与连线的特点,手动将图1 划分为4个类团,如图所示。这4个类团分别是:

(1)与大数据和图书馆服务相关,包括:data mining(数据挖掘)、knowledge discovery(知识发现)、Crowdsourcing(众包)、Data analysis(数据分析)、knowledge management(知识管理)、bibliomet⁃rics(计量)等。

(2)与移动技术相关,包括:machine learning(机器学习)、conversational agents(会话代理)、An⁃droid(安卓)、Mobile devices(移动设备)、Mobile learning(移动学习)、multimodal interaction(多模式互动)等。

(3)与RFID 和物联网相关,包括:Smart Book⁃shelf(智能书架)、library management system(图书馆管理系统)、Information and Communication Tech⁃nology(ICT,信息与通信技术)、ultra-high frequen⁃cy RFID(超高频无线射频)等。

(4)与数字图书馆和移动应用软件相关,包括:library apps(图书馆软件)、e-learning(电子学习)、Online learning(在线学习)、Apps(软件)、Com⁃munication technologies(通信技术)、Mobile Apps(移动软件)、Cloud Computing(云计算)、smart mobile phone(智能移动电话)等。

这4个类团之间界限并不是很分明,说明智慧图书馆是一个交叉领域,尚未形成特点分明的研究领域。

3.3 聚类分析

关键词共现网络图中显示的类团之间界限不明显,无法较准确地判断类团的个数及类团之间的关系,而聚类分析法则可以将关系比较密切的关键词聚在一起,能比较清晰地观察到聚到一起的类团。

首先,利用Excel 将高频关键词转化为相似矩阵,计算出Ochiia系数,计算公式为:

M(i,j)=c(i,j)/sqrt[c(i,i)*c(j,j)],对角线的值均为1。得到相似矩阵如表3:

表3 关键词相似矩阵(部分)

由于相似矩阵中元素0值过多,统计时为使误差过大,故用1 减去相似矩阵中的全部值,得出相似矩阵的相异矩阵(表4)。

表4 关键词相异矩阵(部分)

将相异矩阵导入SPSS,选择系统聚类,聚类方法采用Ward法,度量标准采用Phi方度量,得到关键词聚类图(图3)。此外,笔者使用因子分析中的碎石检验准则[8]确定应提取的因子数,即确定应分类的类数。由图2 碎石图可看出,当累积到第10个因子时,曲线开始接近平滑,因此,提取9个因子(曲线接近平滑的前一个点),即将关键词划分为9类最为合理,具体的分类见图3所示。

图2 关键词因子分析碎石图

由图3 可以看出,所有关键词都与图书馆、智慧图书馆、数字图书馆等几个重点关键词存在直接与间接的关系,9个大类都是围绕图书馆展开研究的,这9大类分别是:

(1)智能系统模型研究,包括conversational agents(会话代理人)、spoken interaction(口语互动)、multimodal interaction(多模式互动)等。

(2)移动设备研究,包括smart phone(智能手机)、Apps、Mobile Technology(移动技术)等。

(3)多媒体服务研究,包括microservices(微服务)、Crowdsourcing(众包)、WeChat Application(微信应用)等。

(4)智慧图书馆建设意义研究,包括Integrity(聚合)、Resource management(资源管理)等。

(5)数据分析研究,包括Data analysis(数据分析)、machine learning(机器学习)等。

(6)物联网技术应用研究,包括Tag(标签)、sensor Network(传感器网络)、Zigbee(紫蜂,一种新兴短距离无线通信技术)、RFID、Internet of Things(IoT,物联网)等。

3.3 有关部门缺乏足够的重视 保护区作为生物资源最丰富的区域,划定保护区目的就是要最大程度地保护生物资源,但是由于有部门对保护区的重要性认识不足,对保护区缺乏足够的重视,导致在保护区内的各种开发活动不断发生,对生物资源造成了较大的破坏。

(7)智慧图书馆应用研究,包括Library apps、technology acceptance model(TAM,技 术 接 受 模型)、Mobile Library(移动图书馆)等。

(8)虚拟技术研究,包括Smart Bookshelf(智能书架)、ultra high frequency RFID(高频射频技术)、GIS(地理信息系统)、Indoor positioning(室内定位)、Big Data(大数据)、bibliometrics(计量)等。

(9)知识发现研究,包括Cloud Computing(云计算)、Knowledge discovery(知识发现)、knowledge management(知识管理)等。

3.4 结果分析

通过阅读相关文献,并结合关键词词频分析、社会网络分析和聚类分析的图谱,可将国际学者关于智慧图书馆的研究热点总结为4 大类,分别是:第一类系统与设备,第二类技术,第三类服务,第四类意义与应用。通过阅读相关文献,对这4大类分别进行详细阐述。

图3 关键词聚类树状图

(1)系统与设备。对智慧图书馆的研究离不开对智能系统和智能设备的研究。斯坦福大学数字图书馆的Balabanovi和Shoham[9]提出Fab 推荐系统,该系统结合了CB 和CF 的推荐算法,即结合基于内容和基于协作的推荐算法,既可以向用户推荐其过去喜欢的项目的类似项目,也可以通过识别用户的口味进而推荐与他们偏好相似的项目。随着智能移动设备的普及和应用,以及数字图书馆的不断发展,人们通过智能设备就能比较方便地获得图书馆的在数字资源。移动设备的操作系统为开发人员提供了应用程序编程接口,便于开发图形界面、传感器控制和语音交互等不同的解决方案,人们可以通过移动设备随时随地移动学习。智利康塞普西翁大学计算机学院的M.Ang′elica Pinninghoff.J 等[10]在模块化架构上集成Android 应用程序编程接口的功能,提出了实用的移动学习应用程序,允许教师组成小组,以实现高效的协作学习。Al-Daihani SM等[11]调查了科威特大学的学生、教师和图书馆管理员对该校移动图书馆应用的看法和使用模式,大多数受访者倾向于使用数字平台访问图书馆资源和服务,57.2%的科威特大学学生首先使用智能手机访问图书馆。Griol D 等[12]提出了多模态会话代理和移动设备的实际应用,促进图书馆更大程度的共享,提高图书馆的利用效率,并且提供新型多媒体内容,增加与读者交互的功能,从而发挥图书馆的更高使用价值。此外,Griol D等人还开发了CALIMACO系统,这是一个多模式应用程序,该系统充分结合了移动设备的各种功能,人们可以通过口头表述或者触觉的方式进行查询,应用程序会反馈出与所请求资源相关的完整信息,提高了人与图书馆的交互性。Bombold[13]认为,即使有笔记本电脑,学生也更喜欢使用智能手机而不是PC 用于学术工作。这些充分说明了通过智能手机访问图书馆和在线使用数字图书馆的读者越来越普遍。移动设备的发展与普及带动了移动学习的推广与应用,从而反向促进了智慧图书馆的发展。

(2)技术。智慧图书馆涉及到的技术有很多,比如物联网技术、智能电网技术等,其中,国外对智慧图书馆的研究中,物联网技术是研究最广泛的技术之一。物联网是物与物相连形成的一个巨大的网络,通过智能采集、传输和信息处理,可以实现智能识别和科学管理。因此,在图书馆引入物联网技术后,传感器芯片可以嵌入各种物体中,并通过宽带、无限通信、多媒体网络系统进行交互,从而可以为读者提供高质量、周到、便捷、高效的服务[14]。物联网技术在图书馆的应用主要集中在无线射频(RFID)技术上,RFID技术的使用可以实现图书馆馆藏的智能化管理。RFID是一种通信技术,英文全称是Radio Frequency Identification,中文翻译是射频识别,它的工作原理是借助射频信号来准确识别目标对象,在图书馆的书籍定位、自助借还、馆员进行馆藏清点等管理中得到广泛应用[15]。2002 年,新加坡国家图书馆首次使用基于RFID 技术的图书馆管理系统,之后,美国、德国、荷兰和其他国家也相继在图书馆中使用RFID技术[16]。在我国,RFID 系统最早应用于厦门集美大学图书馆,此后更多图书馆都采用了RFID 系统。智慧图书馆是图书馆与物联网、云计算和智能设备相结合的图书馆,是智能感知与数字图书馆从感知角度的有机结合。物联网下的智慧图书馆整合照明、温度和湿度、公共卫生、消防和安全系统,为读者提供干净舒适、安全的学习环境[17]。物联网技术的广泛使用很大程度上促进了智慧图书馆的建设。

(4)意义与应用。智慧图书馆的建设可以促进知识聚合,能够更加合理地管理资源,从而促进资源的有效利用,为用户提供更加方便与智能的服务。当前,很多图书馆都开发了应用软件,或者结合微博、微信等新媒体,通过多种渠道方便用户访问图书馆的资源[13],因此,智慧图书馆的发展对人们更加便捷地获取信息资源具有非常重要的意义。

4 研究前沿分析

在特定的研究领域中发表的文献在某一时段内会出现类似的现象,随着主题的出现,某些特征词会急剧上升,Kleinberg 提出的突变词检测算法用来检测某一学科研究兴趣的突然增长[22]。同样,对某一领域的研究前沿进行分析,有利于学术界更好地把握该领域的发展趋势和未来的研究方向。学者陈超美开发的CiteSpace软件中的膨胀词探测算法,通过监测词频的时间分布,将词频变化率高的词从大量主题词中探测出来,依靠词频的变动变化,而不仅是频次的高低,来确定学科领域的研究前沿[23]。

图4 智慧图书馆突发术语图谱

将下载的文献题录信息进行必要的处理后,导入CiteSpace,节点类型为关键词,设定适当的阈值,选择显示类型为“time zone”,生成突发术语图谱(见图4)。

图4中三角形节点代表对应的关键词,节点大小反映关键词的词频,线条显示其演变过程。图4比较直观地展示了国际上关于智慧图书馆研究前沿术语的演化历程,2005—2010年之间的主要研究热点术语是e-learning,2010—2014 年的研究热点术语主要有:smart-phone、management-system、web-site、information technology、digital library、li⁃brary、mobile technology、internet of things(iot)、mo⁃bile device、sensor network等,2015—2019年的研究热点术语主要有:big data、smart library、library ser⁃vice、academic library、mobile library、service、biblio⁃metrics、cloud computing、challenge 等。从2005—2019 年的研究热点术语的演变,可以看出国际上关于智慧图书馆的研究主题从2010年以后开始繁荣,从与图书馆相关的智能设备、技术等方面朝着服务研究的方向发展。2015—2019年的研究术语在研究前沿方面更有代表性,对其进行归纳总结,智慧图书馆的研究前沿领域主要体现在以下几个方面。

(1)大数据(big data)。在图4 中,“big data”是一个比较突出的专业术语,通过阅读文献发现,大数据主要用于图书馆的个性化推荐系统[17]中。随着数据资源多样性和来源的广泛性,传统的图书馆系统已经无法满足现代用户的需求,用户也很难找到自己需要的资源,图书馆利用大数据的相关技术,对用户使用图书馆产生的数据进行分析挖掘,发现用户的兴趣,从而有针对性地向用户推荐其感兴趣的资源,能够更快速高效地帮助用户找到自己需要的资源。此外,大数据还用于学者评价等,传统的学者评价研究主要是对学者的专业领域、静态网页内容或行为进行分析,忽略了社交网络和科学数据源中的众包产生的大量社交数据。因此,Silva T 等[24]使用众包的大数据分析方法,将出版物数据、项目数据和社交网络的数据等数据源互连进行分析,从而发现专家的动态专业知识并构建专家库,提高专家寻找创新合作的机会。大数据时代,知识服务是图书馆服务模式创新的方向,智慧图书馆是实现大数据知识服务的基本途径[25]。

(2)图书馆服务(library service)。在图4 中,“library service”“service”等是比较突出的专业术语,因此,图书馆服务是智慧图书馆领域研究前沿之一。在知识社会,信息和通信技术的创新使人类能够通过各种技术实时将信息转化为知识,反之,其又改变了信息的生成和消费方式,并改变了如今图书馆被承认和使用的方式。图书馆作为公共空间,不仅可以为用户提供文化活动的场所,也可以为用户提供休闲、会议的场所,因此,图书馆除了向用户提供数字空间和物理空间服务之外,还可以提供“创客空间(maker spaces)”服务[26]。近年来,越来越多的图书馆提供创客空间服务,为用户配备各种材料、机器和技术,促进用户之间的协作和互动学习。新技术的不断发展,图书馆员不仅受到新技术优势的眷顾,还会受到高期望和“信息世界的庞大规模及其复杂性”的挑战。很多用户(尤其是老人、小孩)可能没有任何或者多次使用计算机和互联网的经验,这就对图书馆员的服务提出了更高的要求,努力提高图书馆的服务质量,在提高资源利用率的同时,提高用户对图书馆的满意度。

(3)云计算(cloud computing)。云计算是通过网络提供计算服务,由一组硬件、网络、存储、服务和接口组合在一起提供计算服务的各个方面。云计算是未来互联网计算的主要形式,也是未来网络计算的发展趋势[27]。近年来,由于技术的快速变化,要存储和处理大量数据,图书馆必须改变其数据处理和存储机制,使其更加智能。Dahdouh K[28]等提出一种基于云计算的使用在线学习平台产生的巨额数据的方法,为在线学习系统提供新的大数据架构,将电子学习存储和计算整合到Hadoop软件库中,可以顺利地使传统的电子学习系统适应云计算中的大数据生态系统。云计算提供了部署智慧图书馆所需的基础设施和资源,因此,未来对智慧图书馆的研究离不开对云计算的研究。

此外,比较突出的专业术语还有“biblomet⁃rics”“algorithm”“data analysis”等,可见,数据分析、数据挖掘、算法、计量等也是国际学者关于智慧图书馆的研究前沿领域。

5 总结

首先,自智慧图书馆的概念提出以来,国际上对智慧图书馆的研究热点主要体现在技术、服务、设备、应用等方面。通过对关键词的分析,发现RFID、物联网、大数据、数据分析、数据挖掘、图书馆服务、移动设备、移动APP、智能建筑等主题是智慧图书馆的研究热点。

其次,随着信息技术的不断发展,近5 年智慧图书馆的研究主题不断向图书馆服务的方向深入与扩展。为读者服务是图书馆的基本职能,当前的智慧图书馆研究正朝着注重利用大数据分析技术、云计算处理技术来提高图书馆的服务方向发展。数据分析、数据挖掘、计量、算法等相关主题将是今后智慧图书馆的研究趋势和研究重点。

猜你喜欢
词频智慧图书馆
基于词频比的改进Jaccard系数文本相似度计算
词汇习得中的词频效应研究
图书馆
词频,一部隐秘的历史
有智慧的羊
去图书馆
汉语音节累积词频对同音字听觉词汇表征的激活作用*
智慧派
智慧决定成败
智慧往前冲,统计百分百(1)