基于RDA和关联数据的图书馆机构知识库构建研究

2021-05-25 10:49雷拯
河南图书馆学刊 2021年2期

雷拯

关键词:RDA;著录编目;关联数据;机构知识库

摘 要:RDA标准与关联数据技术为图书馆机构知识库的建设提供了新方向,文章简要介绍了RDA和关联数据技术的概念与特点,从数据层、分析层和应用层构建了基于RDA和关联数据的图书馆机构知识库模型,最后从服务、资源与机构三个角度提出了基于RDA和关联数据的图书馆机构知识库构建策略,以期为图书馆知识服务效能提升提供一些参考。

中图分类号:G250文献标识码:A文章编号:1003-1588(2021)02-0095-03

1 RDA和关联数据技术的概念与特点

伴随大数据时代的到来,图书馆尤其是高校图书馆越来越重视机构知识库的建设。目前,学界对机构知识库并没有统一的定义,有学者认为机构知识库是一个机构建立的,以网络为依托,以收集、整理、保存、检索、提供利用为目的,以本机构成员在工作过程中所创建的各种数字化产品为内容的知识库[1]。

1.1 RDA的概念与特点

资源描述与检索(Resource Description and Access,RDA)是专为数字环境设计的用于资源描述和检索的新标准[2]。RDA标准具有兼容性、规范性和简洁性等特点,能够更清晰地揭示标题所表示的内容。表1呈现了RDA著录的内容分析,从表1可知,RDA规则对资源著录、资源识别、资源内容、检索等进行了详细的规范,图书馆可以依据RDA对知识库资源进行分类及著录。

表1 RDA著录内容分析

著录标题内容分析资源著录通用规则著录的目的、范围、标准、必备元素数据识别对常见的资源数据进行规范性的元素标注特殊资源的著录各资源载体的类型、数量、大小和材质等各类型资源的内容数据资源的类型、内容范围、描述对象、内容摘要、涵盖的信息等资源获取与检索获取与检索限制等方面的著录与资源相关的其他对象按照实体分别指出内容表达、个人介绍等信息相关资源资源和实体之间的关系

1.2 关联数据的概念和特点

关联数据是指在网络上发布、共享、连接各类数据、信息和知识的一种方式,它克服了本体的领域局限性,实现了数据之间开放的无缝互联[3]。一般来说,关联数据包括数据挖掘、数据分析和数据整合三个方面。通过关联数据技术,图书馆能够挖掘数据中隐藏的价值,同时强化数据之间的联系。可以说,关联数据打破了传统的数据分布和服务方式,呈现出开放性、互联性的特点,可以为图书馆机构知识库构建提供保障。

2 基于RDA和关联数据的图书馆机构知识库构建目标

在机构知识库构建过程中,图书馆不仅要对数据进行收集和整合,还要考虑知识库与外部知识库的关联。笔者将基于RDA和关联数据的图书馆机构知识库构建细化为以下三个方面。

2.1 资源收集方面

在大数据环境下,高校或知识机构内的任何个体与组织都可以成为数据的生产者,大量的科研成果与科研数据产生并被纳入图书馆原生资源库中,这些原生化资源的格式、类型、结构各不相同,呈现出纷乱繁杂的状态[4]。无序的数据不仅占用了大量的存储空间,而且难以发挥其应有的价值,因此,构建图书馆机构知识库的第一个目标就是要实现数据资源的全面收集和有效整合,使大量不規则数据转化为标准化数据。

2.2 资源关联方面

在机构知识库建设过程中,图书馆不仅要收集数据,还要通过数据关联技术对数据进行分析与整合,加强数据之间的关联,为用户提供更有价值的数据资源。一方面,知识库可以根据主题或学科对数据进行分类,打破固有的结构框架,实现数据重组;另一方面,图书馆要加强与机构外知识库的关联,以丰富资源类型和资源数量。总之,图书馆应加大数据资源的挖掘和整合力度,为资源编目与用户检索信息提供便利。

2.3 资源编目方面

RDA规范了知识库资源编目的规则,图书馆要根据这一规则完成资源的编目和著录工作。图书馆在对数据资源进行收集和关联之后,需要对其进行语义化、可视化处理,最终以标准合格的状态呈现给用户[5],科学规范的资源编目能够使资源的检索与推送更加精准,从而助力科研机构与高校师生的科研、教学与学习。

3 基于RDA与关联数据的图书馆机构知识库构建模型

笔者认为,基于RDA与关联数据构建的机构知识库服务模型可以分为数据层、分析层与应用层三个层级。其中,数据层是基础,分析层是支撑,应用层是为用户提供有效服务的最重要的组成部分,三个层级相互作用、相互影响,共同保障机构知识库的高效服务。

3.1 数据层

数据层是构建基于RDA和关联数据的图书馆机构知识库的基础层级,这一层级不仅包括本机构的数据,也包括与合作机构交换的输入型数据,为了保证知识数据的数量和质量,知识库必须对这些资源进行类型与格式的归类,然后依照RDA标准进行语义描述和分类存储。一般来说,知识数据的存储包括自存储、强制性存储与签订协议代存储三种方式,知识库核心资源分别以三种方式进行保存,扩展资源主要采用自存储和强制性存储的方式保存,关联形成的重要资源则单独以自存储的方式保存[6]。

3.2 分析层

分析层是指图书馆应用数据挖掘、分析、整合与关联技术,将关联成果进行链接。通过对机构知识库资源的语义描述与RDF排序,资源可以呈现出最优的聚合状态,再应用RDA建立起各资源间的链接,就构成了更全面细致的知识图谱[7]。相同题名或相同主题的资源则可以重组为机构知识库整体,与其他机构知识库和外部资源数据集进行关联,形成更加符合用户需求的信息供给体系。

3.3 应用层

图书馆机构知识库模型的最高一层为应用层,应用层不仅是读者交流的平台,也是读者获取资源的重要一环。应用层包括知识服务、语义检索与个性化服务三项内容,这三项内容都是建立在数据充分关联的基础上的[8]。应用层也是面向用户开展定向资源推送与个性化服务的基础,良好的资源获取体验可以增强读者对机构知识库的认同感。

4 基于RDA和关联数据的图书馆机构知识库构建策略

结合上文所述,笔者认为,影响图书馆机构知识构建的要素主要有三个:服务、资源、机构。因此,笔者从这三个角度提出图书馆机构知识库的构建策略:从服务角度看,图书馆要关注用户需求;从资源角度看,图书馆要加大数据挖掘和关联力度;从机构角度看,图书馆要注重机构间的合作,形成协同效应。

4.1 服务角度:关注用户需求

图书馆建设机构知识库的最终目的是提升用户体验,为用户提供更加准确和系统化的知识服务,因此,图书馆要关注用户需求,以满足用户需求为出发点和落脚点。笔者认为,图书馆要结合用戶需求进行资源建设,同时建立动态反馈机制了解用户需求的变化,在此基础上利用网络平台为用户提供全天候、个性化的高质量知识服务。

4.2 资源角度:加大数据挖掘和关联力度

数据资源是构建图书馆机构知识库的重中之重,也是最核心的要素。科研人员是图书馆机构知识库的主要服务对象,他们对知识资源的专业性、全面性及时效性有非常高的要求。互联网环境下,基于RDA标准和关联数据的机构知识库构建要加大数据挖掘与关联力度。一方面,图书馆应注意数据挖掘的规范化,保证知识资源的质量;另一方面,图书馆还要对这一工作进行硬性的指标性的规定,以保证工作流程的规范。在数据挖掘和关联过程中,如遇到元数据描述杂乱、学术研究成果参差不齐等不合格的情况,图书馆必须要返回上一个流程进行重新校对、更正[9]。

4.3 机构角度:注重机构间的合作

大数据环境下,任何一家图书馆都不可能拥有某一学科所有的文献资源,因此,在构建机构知识库过程中,图书馆要注重与其他机构的合作,如公共图书馆可以与高校图书馆、科研院所等开展合作。一些高校图书馆已相继与科研机构合作,加入机构知识库行列,如清华大学、香港大学等高校与其他学术机构或知识机构形成合作关系,在资源上互通有无,在技术上相互借鉴,在人才上加强交流。机构间的合作不仅有利于节约资源购置经费,而且可以促进信息的横向流通,从而为科研人员提供更及时、全面的知识服务。

5 结语

综上所述,大数据技术与信息技术的飞速发展对图书馆知识服务提出了更高的要求,也推动了图书馆知识服务形式与内容的转型升级。基于RDA与数据关联技术的机构知识库集中了人员、资源以及技术优势,拓宽了图书馆服务范围,提升了图书馆服务的有效性,可以为科研人员提供更加准确、高效的知识服务。

参考文献:

[1] 康桂英,明道福,吴晓兵.大数据时代信息资源检索与分析[M].北京:北京理工大学出版社,2019:348.

[2] 芭芭拉·B·蒂利特,张钰羚.RDA与中国:编目的国际化[J].中国图书馆学报,2012(6):14-21.

[3] 欧石燕,胡珊,张帅.本体与关联数据驱动的图书馆信息资源语义整合方法及其测评[J].图书情报工作,2014(2):5-13.

[5] 周俊烨.基于关联数据的图书馆、档案馆和博物馆数字资源整合模式构建[J].图书馆,2019(1):70-75.

[6] 李丽博.基于RDA的图书馆图书编目规范控制研究[J].河南图书馆学刊,2018(10):119-120,128.

[7] 李薇,王恒军,王爽,等.论基于RDA技术的图书馆馆藏数字资源知识组织[J].中国中医药图书情报杂志,2018(4):18-21.

[8] 陈婷婷.图书馆关联开放数据消费研究[J].情报探索,2018(8):97-102.

[9] 魏来,宁子晨.基于RDA的图书馆书目数据与机构知识库数据关联研究[J].图书馆工作与研究,2018(7):43-49.

(编校:周雪芹)