图情领域高活跃度学者知识图谱
——基于“2022图书馆学者学术活跃度榜”可视化分析

2024-02-24 02:44
传媒论坛 2024年3期
关键词:图情图谱聚类

曾 洁

2022年6月16日,新文科专委会首次在网络发布了“2022图书馆学者学术活跃度榜”[1]。这是新文科专委会继2021年12月15日发布“2021图书馆学术能力排名”后,第二次权威发布图书馆方面的学术情况。该活跃度榜是首个针对图书馆学者层面学术活跃度进行综合评价的指数,评价体系有如下特点:第一,采用“期刊+作者综合权重”的方式,将核心期刊类别和作者署名顺序细分,并引入合著者贡献分配模型;第二,人工对异构分散的各类研究计划进行聚合和认领,突出图书馆的特色与地位;第三,构建领域知识本体,对作者和机构署名采取实体消歧和语义链接,保证成果归属的准确性[2]。从评价结果来看,测度模型表现稳健,外审专家给予肯定。报告发布后引发热议,40余家官方媒体进行报道,超过半数的上榜学者提出出具入选证书的需求[2]。

可视化软件CiteSpace可通过“图”与“谱”的结合,直观展示共现、突现和聚类等关系,是包括图情研究的多领域学者们常用工具软件。朱彦君[3]等通过总结《中国图书馆学报》十年来的高频被引文献、作者和期刊,为研究人员识别经典文献、确定高影响力作者提供参考;廖球[4]等人进行了高校科研数据知识图谱分析,展示并解析高产作者及机构的合作网络态势;李继红[5]等人对国家社科基金数据进行文本挖掘和图谱分析,揭示学科研究的趋势和方向;刘竟[6]等人分析了2007—2012年高校图书馆的科研产出、多产作者及合作团体,梳理高校图书馆的科研情况。利用CiteSpace进行文献计量分析、知识图谱分析的研究涉及的领域众多,但前人的研究对象大多数是图书情报的专业期刊或某类基金数据,或是某种功能图书馆的科研情况,且研究时间都相对久远,研究的时效性弱。

本文对“2022图书馆学者学术活跃度总榜”中出现的机构和作者进行可视化分析,揭示2016—2022年图情领域的研究热点,探测研究前沿的发展趋势,以期为今后图书情报领域的选题与研究提供信息参考。

一、数据来源及研究方法

(一)数据来源

“2022图书馆学者学术活跃度榜”的内容分为三部分,分别是“图书馆学者学术活跃度总榜(下称‘总榜’)”“图书馆学细分榜”和“入选机构榜”。“总榜”列出了2016—2022年间在国内外图书情报与档案管理领域中最具学术活跃度的来自197个机构的485位图书馆学者,并按照分数区间分为五个等级展示。本文主要针对“总榜”中的机构和学者展开研究。“总榜”中机构所覆盖的图书馆类型包括高校高职图书馆,专业图书馆,公共图书馆以及党政图书馆。涉及的专家学者众多且具代表性,既有以初景利、吴建中等为代表的图情行业内公认的大咖,也出现了以白如江、吴晨生为代表的一大批青年学者。由于该榜发布时间为2022年,为了使分析更具时效性,笔者在数据检索时,把学者们的发文时间跨度定在了2016—2022年。

选择中国知网(CNKI)数据库进行数据检索。文献来源为学术期刊,得到数据后再经CiteSpace去重后获得有效文献5445篇。

(二)研究方法

分析软件为CiteSpace6.1.R2,利用CiteSpace绘制机构合作网络图谱,关键词共现图谱、聚类图谱、突现图谱。利用合作网络分析法、共词分析法、词频分析法,分别对机构和关键词进行分析。探索及展示2016—2022年国内图书情报学领域的研究脉络和热点前沿,并初步研判该领域未来可能的发展趋势。

二、研究结果分析

(一)发文机构分析

研究机构的共现词分析有助于明确该领域的研究力量分布特点,是发现该领域核心机构的最有效方法之一,且能为相关研究机构合作、交流提供依据。运行CiteSpace软件,Nodetypes(网络节点)选择institute,Selection CriteriaI(选择标准)设置“TopN=50”,生成机构合作网络图,导出排名前30机构表(表1)。可知机构合作网络中共有143个节点,292条连线,网络整体密度Density为0.0288,该数据表明图情领域机构间的合作比较紧密。表1显示了Count(发文量)排名前30的机构。其中中国科学院文献情报中心无论从发文数量(506)还是中介中心性(Centrality)都是最大的(0.17)。中心性作为衡量节点权力的大小,反映了该点在网络中的重要性,点中心性越高,说明节点在该领域越重要[7]。科研合作是科技发展的重要动力,不仅可以提升科研团队的整体实力,还可以有效地促进作者、机构和国家之间的知识交流,共享科研成果[8]。中国科学院文献情报中心作为图情领域的龙头单位,其中心及辐射地位显而易见。机构合作网络图也显示,同类型图书馆之间的合作相对更为密切,但不同类型图书馆之间也形成了跨地域,跨领域的合作。

表1 排名前30机构表

从表1发现,在排名前30的机构中,专业图书馆占比约三分之一,高校图书馆占比接近三分之二,专业图书馆和高校图书馆是图情领域研究的两大主要阵地。从排名前10的机构情况看,“国”字号专业图情机构以其绝对优势的发文量领航整个图情领域。排名11—20的多是高校图书馆,说明高校图书馆是图情领域的中坚力量。

(二)基于高频关键词共现的研究热点分析

运行CiteSpace软件,Nodetypes(网络节点)选择Keyword,Selection CriteriaI(选择标准)设置“TopN=50”,导出频次排名前50的关键词如表2所示。出现频次100次以上的关键词分别为图书馆、阅读推广、数字人文、文献计量和大数据。出现频次50以上的关键词包括知识服务、美国、信息素养、开放获取、人工智能、学科服务、智库和数字资源。出现频次30次以上的关键词有可视化、科学数据、信息服务、知识图谱和专利分析。出现频次20次以上的关键词则多达21个。数据说明近五年图情领域的研究热点紧紧围绕着图书馆功能、图书馆服务、图书馆学研究、信息资源建设与知识管理、图书馆智能化与网络化等核心主题。尤其像阅读推广、知识服务、学科服务和信息服务这些反映图书馆功能的主题,一直是学者们热衷的领域。而人工智能、互联网+、科技创新、智慧服务、微信等高频词的出现则说明新媒体时代的到来,信息科学和互联网技术的飞速发展让图情领域的研究更多元化,层次化。相较之下,近年来,学者们对图书馆学基础理论和管理方面的关注度略有减少。

表2 排名前50的高频关键词

(三)基于关键词聚类的研究前沿分析

节点的聚类是指将抽象的数据集合根据其内在性质分成若干类,每一聚类中的节点具有相同特性,在CiteSpace界面中,Selection CriteriaI(选择标准)设置为TopN=30,其他设置与前面一致绘制关键词时间线图谱。关键词按年份以节点的形式排列在横轴上。共得到#0(LLR聚类名称“图书馆”)、#1(LLR聚类名称“数字资源”)、#2(LLR聚类名称“信息素养”)、#3(LLR聚类名称“人工智能”)、#4(LLR聚类名称“数字人文”)、#5(LLR聚类名称“学科服务”)、#6(LLR聚类名称“文献计量”)7个聚类。如图1所示,某些聚类持续的时间较短暂,如“数字资源”以及“信息素养”聚类。持续时间短说明该类研究并没有被传承下去,或者说该类研究是有其时间性、时效性的。某些聚类持续的时间则比较长,如“人工智能”和“数字人文”和“文献计量”三大聚类。“数字人文”“学科服务”和“文献计量”聚类一直从2016年持续到了2022年。且这几大聚类下的关键词呈现也比较丰富,意味着该聚类所引起的研究也涵盖了多方面,产生了更丰富的外延。

图1 关键词共现时间线图

1.“#0”聚类下的特征词汇有:图书馆员、创客空间、智库、阅读推广、服务、战略规划等。其中,吴瑾[9]分析图书馆员所需提供的保障服务基础上,归纳总结图书馆员基于创客需求的服务中所必须具备的服务能力。胡永强[10]通过对各个领域创客空间建设实例的对比,总结适应我国高校图书馆的多种创客空间建设模式。陈幼华[11]总结了阅读推广实践与理论研究现状,分析了已有阅读推广定义的类型与特征。初景利[12]通过分析图书馆与智库之间的关系,探索图书馆支持智库建设的路径,总结图书馆参与智库建设的主要任务和措施,逐步明晰图书馆支撑智库建设的机制。该研究主题紧紧围绕着图书馆的人员、空间、职能三要素展开。图书馆的建设和发展是与图书馆的各要素紧密相连的。馆员是图书馆的核心要素之一。“数字时代我们必须更新自身的传统角色”“策划新的服务模式”[13]图书馆应抓住一切契机,增强馆员的服务意识,开发更丰富的服务。

2.“#1”聚类下的特征词有:信息服务、知识产权,长期保存等。其中董晓莉[14]探讨了国际主流的数字资源保存合作模式,并提出目前我国图书馆应采用的数字保存合作模式和资源存储方式。鄂丽君[15]提出构建高校图书馆知识产权素养教育体系,并提出高校图书馆知识产权素养教育实施策略。徐健晖[16]探究了网络环境下专业图书馆用户信息服务,提出在网络环境下专业图书馆应采取咨询方式多样化、增加信息定制服务,以期为用户提供更加优质更加具有针对性的服务。资源乃图书馆的根本,资源的保存、建设和利用是图书馆开展信息服务的重要保障。

3.“#2”聚类下的特征词有:大数据、开放科学、情报分析,数据素养等。代表性研究有,张兴旺[17]研究了图书馆大数据资产的内涵、特征并提出其合理利用的框架模型。赵展一[18]梳理开放科学概念,分析开放科学要素及其对信息资源的新要求,剖析国际知名案例,建议图书馆积极参与开放科学基础设施建设。杨宁[19]通过分析大数据情报分析工作的方法和工具,设计了适用于大数据情报分析工作的流程和框架。孟祥保[20]归纳数据素养的研究内容、研究路径、研究方法,建立一个整合的研究框架,提出未来研究的五个方向。图书情报领域常提及的信息素养是促进人类可持续发展的知识和技能之一。大数据时代,图书馆应积极在信息素养教育上进行投入,创建信息素养教育体系,创新信息素养教育方法。

4.“#3”聚类下的特征词有:专利分析、智慧服务、服务创新、知识服务、知识图谱等。许景龙[21]梳理总结18种专利情报分析工具的功能,归纳了专利情报分析工具的现状和发展趋势。孙蒙鸽[22]立足于科技情报服务视角,研判未来科研过程的发展趋势为智能化,图书馆应抓住知识服务智能化升级机遇。王峥[23]指出我国图书馆应坚持一切以用户需求为中心,将品牌营销、整合营销、数字营销融会贯通,走出一条具有中国特色的图书馆服务创新之路。柳益君[24]认为知识图谱作为大数据和人工智能时代知识工程的关键技术可为图书馆智慧服务创新模式。目前,我国广东、浙江、上海等地区的图书馆在空间服务创新中积极应用各类人工智能技术,将智慧空间融入区域新型公共文化空间整体的发展中,从而有效提升社会服务效能与认同,代表了现阶段智慧空间建设实践路向[25]。以人工智能引领的新兴技术是推动图书馆服务创新的重要手段。

5.“#4”聚类下的特征词有:开放获取、区块链、图书馆学等。其中,张伶[26]指出由于图书馆权限不高、版权及知识产权因素、资源质量及网络安全管控等因素,我国机构知识库开放性有待提高。魏大威[27]提出引入区块链技术进行智慧图书馆数字资源全流程管理的构想,深入探讨数字资源管理中需要解决的重点问题。戎军涛[28]确定了图书馆学的研究对象是人类社会公共知识流,在此基础上构建了图书馆学的公共知识流定律。区块链是由分布式网络、一致性协议、超级账本模型和非对称加密技术构成的共享共识账本。将区块链技术应用于公共图书馆数字阅读资源管理,可最大限度化解资源采集、加工、存储与推送的制约[29]。

6.“#5”聚类下的特征词有:高校、数据管理、资源建设、数据科学等。刘桂锋[30]从数据治理原则与目的、数据治理利益相关者、数据治理技术与系统、数据治理要素关系四个视角提出适合我国的数据管理模式。刘如[31]提出应用情报事理图谱进行智能情报分析,能很好地弥补知识图谱的缺漏。黄金霞[32]从国内外开放资源建设实践入手,在资源遴选评价、组织、互操作、再利用等方面对现有的标准规范进行梳理与总结,构建资源建设标准体系框架。在我国高校图书馆学科服务的整体发展情况参差不齐的事实下,应建立面向科研的高校图书馆学科服务联盟模式[33]。高校学科服务要以用户需求为导向,把学科服务真正嵌入到课题项目研究中。

7.“#6”聚类下的特征词有:美国,可视化、科技情报等。其中,孟银涛[34]对美国的14所大学图书馆进行调研,得出美国大学图书馆战略规划6个方面的优势,并提出国内高校图书馆提升的四个方面。杜婕[35]采用文献计量法,从图书馆营销的概念、内涵、内容出发,对图书馆营销服务研究领域论文进行多角度、多侧面的分析。赵志耘[36]梳理中国科技情报研究方法的发展历程,指出科技情报研究方法探索路径的6个主要方面。美国在图书情报领域的科研产出遥遥领先,这与美国对图书情报领域的研究时间早,开展规模大,同时注重图书情报科研教育以及人才培养,大力支持对该领域课题项目的资助有关[37]。随着我国图书情报领域的发展,各大高校的图书情报专业以及信息机构越发注重科研能力的培养,我国图书情报领域已经在国际上具有很高的影响力[38]。

(四)基于突现主题知识图谱的研究前沿分析

关键词的突发性探测提供了特定关键字与出现频率激增相关联的证据,关键词的爆发表明一个潜在的话题已经或正在引起特定时期内科研人员的高度关注[39]。基于关键词共现,利用Burst Detection检测,显示前20个高强度探测词。其中,Strength表示关键词突发强度,Begin表示突发开始年份,End表示该词结束年份。本节基于关键词共现作突发词探测,得到图2所示的突发词探测结果,清晰显示2016—2022年研究前沿的演进历程。可大致分成以下三个阶段。

图2 突发词探测结果

第一阶段为2016—2018年。此阶段的研究前沿涉及较多方面。包括学科馆员、数据素养、民国时期、实证研究、评价指标、文化扶贫、数据科学、数字学术、主题模型、综述和主题识别。突变强度最大的主题词是“学科馆员”。说明此时图书情报的研究前沿围绕着“学科馆员”展开。该主题词突变强度大,突变时间短。说明该主题在此阶段备受关注,其中探讨得最多的便是关于学科馆员的数据素养以及评价指标。

第二阶段为2019—2020年。此阶段研究前沿涉及服务创新、深度学习、空间再造、科技情报、馆藏建设。很明显此阶段聚焦在图书馆的建设与服务方面。其中“服务创新”和“深度学习”的突变强度较其他主题词大。事实上,“深度学习”和“服务创新”是图书馆的发展共同体。在区块链,大数据等新兴技术的加持下,图书馆实现服务创新有了更好的助力。

第三阶段为2020—2022年。知识产权、开放科学、口述历史、发展态势成为突现值较强的词。这几个主题词突变时间长,是最受关注的板块。这些主题词的出现说明学者们的研究范围逐渐扩大,已经从研究图书馆、馆员等内部要素外延至图书馆更多领域的服务开发,尤其是近年来兴起的数字资源服务领域。数字驱动的知识服务是一种超越图书、超越传统借阅服务的新业态,它是以解决用户信息问题为导向的全方位、全媒体、全过程数字化服务[40]。从大学、研究机构的发展来看,当前与知识服务有关的是开放获取、开放数据和开放科学,大学、研究机构的图书馆要顺应这一开放潮流[41]。

四、结论

本文采用CiteSpace可视化分析软件对新文科专委会发布的“2022图书馆学者学术活跃度榜”进行了可视化分析。研究结论如下:

(1)机构聚类图谱显示,专业图书馆、高校图书馆和公共图书馆这三个支柱型图书馆中,专业图书馆排名第一,高校图书馆排名第二,公共图书馆稍显弱势。同时,图书情报领域虽实现了跨地域跨领域的合作,但合作并不够深入。专业图书馆应发挥其科研实力和优势,对整个图书情报领域起到引领和辐射作用。不同类型的图书馆之间应尽早实现资源共享,深度合作。

(2)关键词共现、聚类和突现图谱,显示出2016—2022年图情领域的研究热点聚焦在数字人文、阅读推广、大数据、文献计量、人工智能和知识服务等方面。从图书馆的研究主题看,这些热点集中在图书馆的功能与服务上,并且与大数据和人工智能时代紧密相连。

图书情报学科历史悠久,应当从历史和传统角度,重视学科基础理论、学科历史和研究走向的挖掘,结合新技术进行创新,形成学科特色乃至中国特色,坚定学科自信与文化自信。研究内容应突破传统图书情报领域,不断引入新技术新方法,实现图书情报领域和其他学科的交叉融合,顺应“新文科”背景下的学科发展。

猜你喜欢
图情图谱聚类
数字时代图情档学科教育的数据化创新
绘一张成长图谱
新文科建设背景下的图情档学科建设(笔谈)“新文科”呼唤图情档成为“硬”学科
聚青年学者之睿智 窥图情档学科之未来
——写在《图书与情报》“图情档青年学者专辑”出版之前
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
中国盲人数字图书馆服务情况及展望
一种层次初始的聚类个数自适应的聚类方法研究