张 燕
(邯郸市图书馆,河北 邯郸 056002)
张 燕 女,1975年生。本科学历,馆员。研究方向:自动化。
关联数据是由“万维网之父”——英国人蒂姆·伯纳斯·李(Tim Berners-Lee)在2006年所提出的一种发布数据方式,关联数据作为一种可以将各种数据、知识和信息进行相互联接的规范,被国际互联网协会推荐使用。一方面,创建关联数据这一发布数据方式并不是简单地为了创建能够让人们读懂的文档,更重要的是创建计算机能够理解的一种具备结构化、富有语义的数据组织结构。另一方面,关联数据注重的是数据之间的关联性、交互性及共享性,它可以将同一机构下的不同系统无法关联的数据或者是来自不同机构数据库的数据进行相互关联。这样对于任意数据库,它既可以被其他数据库数据链接,也可以将自身数据链接到其他数据库数据之中。
2009年,蒂姆·伯纳斯·李在 TED(Technology,Entertainment,Design)大会上发表了关联数据创建时所必须遵守的4条原则:①将任何事物的名称使用URI进行标识;②确保任何人都可以由HTTP URI访问这些标识;③在标识被访问时,提供访问人有用的信息;④提供给访问人尽可能多的URI,用来帮助发展更多的信息。
由以上原则可知,用户可以访问、关联并再次利用关联数据,而且无论是网页、RDF等传统文件还是图片、音像等特殊文件都可以用URI进行标识。与目前的HTML相比,URI除了能够对数据资源进行标识、定位外,还能够据此关联到网络上的其他数据资源,进而形成新应用(见图1)。
作为国际互联网协会所推荐的一种发布、联接各种数据和信息方式的关联数据,并不是简单的全文检索,而是能够在互联网上进行数据层面的检索,这种检索所具备的基础性、彻底性及多功能性正在使万维网发生着深刻的变革。现在,诸如《纽约时报》、BBC等一些大型企业、媒体及政府部门已经开始着手将他们所拥有的数据转换为关联数据。
关联数据最为典型的应用是2007年启动的Open Linked Data项目。这一项目的目标是将目前已经公开存在的数据资源进行整合,并遵循关联数据的原则将其转化为RDF,在HTTP传输方式下改善原有数据的网络结构。目前,该项目还处在进行之中,并且已经有美国国会图书馆、BBC等组织参与此项目。
图书馆作为整合、搜集、处理信息资源的专业机构,更应该注重关联数据的应用进展,积极参与到关联数据的建设之中。2010年,由万维网联盟成立的图书馆关联数据孵化小组(Library Linked Data Incubator Group),能够将图书馆的主题、编目及MARC等数据转换为关联数据。目前,瑞典国家图书馆、美国国会图书馆分别将各自的馆级书目、主题标目LCSH转换为关联数据;德国国家图书馆关联了馆内的权威资源;OCLC则关联了虚拟权威档案信息及杜威分类法。而国内图书馆对于关联数据的研究还处在初级阶段,主要是对国外关联数据研究的阐述及介绍,因此,我国应加强对于关联数据的综合研究,使其更好地应用于我国图书馆及其他领域。
图1 基于关联数据的信息聚合
与传统数据库相比,关联数据更具开放性。基于关联数据的图书馆知识服务,允许读者通过某一点关联到更广泛的信息资源(见图2)。图书馆作为知识服务的主要机构,要站在读者的角度为其服务,所提供的知识服务内容,不应仅仅局限于本馆馆藏已存在的信息数据资源,可将本馆馆藏数据转换为关联数据,在为读者提供馆外数据资源的前提下,争取将越来越多的读者吸引到图书馆。
图2 关联数据的数据共享
知识发现是一个复杂而系统的过程,在知识发现的过程中,需要对众多的数据库资源、数据知识库进行深层次分析,以探究数据之间所存在的潜在关联及规则。而关联数据的出现则对知识发现服务的发展起到了促进作用,在关联数据的作用下,可以将图书馆内部馆藏资源及图书馆外部资源有效关联,为读者提供图书馆以外的知识资源,使读者发现资源越来越便捷,提高图书馆知识发现服务的质量。
一方面,关联数据可以将不同领域、不同系统、不同数据库的数据进行相互关联,使得网络中的任何数据、信息、资源实现共享成为可能。通过数据、信息、知识的网络共享关联,可以让图书馆知识服务馆员及读者获得丰富的检索结果,提高知识服务的质量及效率。另一方面,共享网络中的关联数据并不是固定不变的,在关联数据网络的发展过程中,必定涉及新的关联数据的加入及旧数据的淘汰,此外,还会包括数据关系的变化。所以说,关联数据虽然在一定程度上解决了异构资源的整合问题,但是也使数据资源管理变得日趋复杂。
关联数据的最大优点是能够解决异构资源的整合,将来自不同数据库的全面相关数据信息提供给读者。这使得读者面对指数级增长的数据信息时,往往需要的不再是简单的文献检索及传递服务,而是需要馆员在基于海量的数据信息之上为他们提供更为专业、更为具体、更具指导性的信息服务,这就对图书馆知识服务方式提出了更高的要求。
对于单一图书馆而言,其内部馆藏资源是有限的。但是经过对数据资源进行关联之后,其知识资源体系可以扩展到整个网络。加强建设以关联数据为核心的知识服务资源体系,可以保证读者发现新知识资源的方便、快捷、高效性,也可以满足读者对于新兴科研主题、时事热点等问题的咨询追踪。
对于关联数据,虽然其包括了来自不同数据库的异构数据资源,方便了读者对于馆外资源的使用,但是读者更希望能够享受到“一站式”服务,这就要求图书馆在馆内数据关联的基础上,加强对馆外异构关联数据的组织、整合,使这些数据资源得到形式上的统一。
3.2.1 加强对馆内数据的关联,将图书馆内部数据,包括图书馆检索系统、管理系统、参考咨询系统等数据进行关联整合,方便读者使用。同时,在这些数据的基础上,了解读者需求,把握馆藏资源的利用情况。
3.2.2 加强对馆内、馆外数据的关联整合,将读者所需知识资源转换成为多层语义互联及单一语义映像的数据资源,将传统的文献层次的整合加深到逻辑关系、语义方面的整合。
对基于关联数据的图书馆知识服务而言,其能够整合其他数据库的异构数据资源,对于读者的检索结果起到很好的扩充作用。对此,我们要在海量知识数据资源的基础上,深入理解读者需求,明确知识服务目标,丰富知识服务方式,提高知识服务质量。为此,我们可以通过团队合作、服务集成及系统集成等不同方式,根据读者实际需求的变化灵活选择知识服务内容,合理组织、安排相关知识服务工作。
在建设以关联数据为核心的知识资源服务体系过程中,不仅需要对关联数据进行重组、整合、分析,而且需要图书馆内部的智能检索服务、推送服务、导航服务等技术的支持,这一切都离不开专业的技术团队。这一团队不仅要解决关联数据的嵌入、一站式服务的开展等问题,还要把握图书馆发展现状及未来的发展趋势,创新图书馆的服务方式。
在图书馆知识服务开展过程中要对多种媒体资源进行分析、处理及整合,以寻求读者真正需求的知识信息;还要将这些信息合理、有序地推送到读者面前,处理读者咨询过程中出现的各种问题,这些过程都需要具备较高的计算机操作能力、良好的沟通能力及图书情报知识的高素质馆员的参与。毋庸置疑,团队的力量比单人力量更为强大,决策更为明智,高素质的馆员团队是图书馆知识服务的主角。
[1] 陆觉民,马国栋,郑宇.基于数据挖掘技术的图书馆流通数据的关联分析[J].现代情报,2009(9):108-110.
[2] 马国栋.基于WEKA的高校图书馆流通数据的关联分析[J].图书馆工作与研究,2010(12):42-45.
[3] 徐华.关联数据在国外图书馆中的应用及其借鉴意义[J].图书馆学研究,2011(16):87-89.
[4] 孙鸿燕.图书馆关联数据的综合管理及其实现[J].图书馆学研究,2011(23):51-54.
[5]刘志勇.关联规则数据挖掘在图书馆藏书建设中的应用研究[J].电子设计工程,2011(21):62-64.
[6] 朱俊波,等.图书馆元数据拓展和关联著录方法研究[J].情报杂志,2011(8):109-112.
[7] 李琳.关联数据在图书馆界的应用与挑战[J].图书与情报,2011(4):58-61.