关联数据公共目录探究

2024-12-31 00:00:00高斌顾婷马菊红
图书馆研究与工作 2024年9期

摘 要:近年来已有许多图书馆导入关联数据,提供多种在线公共目录的信息服务。文章依据关联数据公共目录的发展现况,选取具有丰富书目本体语义关系的简·奥斯汀的相关及其衍生作品为样本,同时以西班牙国家图书馆、法国国家图书馆,及美国国会图书馆的关联数据服务和共享型虚拟探索环境4个案例为对象进行评估,发现已具备关联化信息探索等10项功能,特点不尽相同,包括网络化公共目录、关联数据公共目录类型、关联数据化方式、URI关联化程度、语义关系与开放程度等。最后针对关联数据公共目录与资源探索系统在多个方面加以比较。

关键词:关联数据;在线公共目录;书目本体;资源探索系统

中图分类号:G254.3 文献标识码:A

Exploring Linked Data Public Access Catalogs

Abstract In recent years, many libraries have adopted linked data (LD) to provide various online public catalog information services. This study investigates the current development of LD public access catalogs (PACs) and evaluates them using Jane Austen's works and related materials, which possess rich bibliographic ontology semantic relationships, as samples. Four cases are examined: the National Library of Spain, the National Library of France, the Library of Congress Linked Data Service, and the SHARE Virtual Discovery Environment. Beyond the ten identified functions for linked information exploration, each exhibits unique characteristics, including networked public catalogs, types of LD PACs, LD methodologies, URI linkage degrees, semantic relationships, and degrees of openness. Finally, a comparative analysis is conducted between LD PACs and resource discovery systems across various dimensions.

Key words linked data; online public access catalog; bibliographic ontology; resource discovery system

1 引言

目录是揭示图书馆馆藏内容,帮助用户查找馆藏资料的重要工具。随着ICTs的发展,目录也受其影响,经历了传统印刷卡片目录、OPAC、网络化OPAC、WebPAC,乃至于Web2.0的社群化OPAC等多种形式。虽然目录形式不断演变,但是各类目录多数与MARC格式有关。由于MARC不被图书情报界以外所熟悉与使用,且多数未列入网络搜索引擎查询范围之内,逐渐陷入所谓信息孤岛的窘境。除此之外,同一笔与不同笔记录的数据元素之间的关系无法在MARC中予以明确标引,用户必须自行理解后,将其转化为新的查询关键词与检索点,不同数据元素间的关系也不易辨识[1]。

近年来,随着语义网与关联数据(Linked Data, LD)的广泛应用,图书情报界尝试将MARC目录记录转换为LD。从数据设计观点出发,LD以数据为处理对象,同时采用特定本体进行数据模型化,并以资源描述框架(Resource Description Framework, RDF)为语法将数据划分为主语、谓词和宾语,并以统一资源标识符(Uniform Resource Identifier, URI)命名与标示。因此,LD除了能将数据关联外,也能清楚标示数据之间的语义关系。除由外而内引入外部资源,以丰富与扩展既有的目录信息,也可以由内而外将目录数据变成全球信息网内容之一[2]。未来的LD将以网络空间为主,因此LD也为书目信息的传播与用户服务提供了一个创新基础[3]。尤其是专业馆员完成LD作业后,LD公共目录(Linked Data" Public Access Catalog, LD PAC)究竟会以怎样的信息服务呈现给用户。目前为止,图书馆还未有任何系统化探讨LD的目录功能服务,揭示LD PAC样貌的研究。

2 LD PAC主要功能

OPAC的发展方向是目录的查询范围扩大化、社群化与网络搜索引擎化。主要功能包括了层级式导航、用户参与、单一入口、单一关键词查询对话框、关键词推荐、相关数据/信息推荐与RSS推送等。另外,资源探索系统的单一用户界面,提供用户搜寻与获取图书馆资源的功能,包括核心搜索与检索功能、查询推荐、查询结果相关性排序、层级式筛选查询结果与查询工具等。LD在图书馆的应用发展,除了对信息组织产生影响外,也为OPAC带来了很大变化。

2.1 由外而内的丰富化工作

丰富化工作是指经协调将同一实体的不同名称予以整合、聚合后,由信息组织人员选择适当的外部LD资源,增加相关URI至原有记录,以促进用户发现新的信息资源。基于新增URI,原有目录信息由外而内将外部LD资源导入既有的LD PAC外,也促成以URI为依据的LD资源聚合[4]。

2.1.1 经由关联达成自我描述与动态内容

基本上,LD是采用URI标引每一LD及其彼此间相互关系。因而,在网络空间中,每一LD以URI为依据,自动聚合相同URI的不同来源信息,而同一URI可以整合跨学科领域的LD信息[5]。因此,每一LD经由URI关联可达成自我描述外,同时也达成动态式的描述内容,并非固定不变[6]。

2.1.2 关联外部LD资源与类型

在关联外部LD资源方面,URI除了关联主题术语的分布式应用(Faceted Applications of Subject Terminology, FAST)、美国国会图书馆关联数据服务(Library of Congress Linked Data Service, LC LDS)、虚拟国际规范文档(Virtual International Authority File, VIAF)等相关的LD资源及维基百科与DBpedia等外,甚至将关联扩展至其他类型的知名LD资源,包括英国广播公司、美国纽约时报、Geonames,以及作者传记资料等,还包含不同的在线服务[7]。

2.1.3 聚合式的知识网络与信息图谱

根据不同的URI关联至同一目录信息的情况,每一个关联的URI就如一条“知识线索”,而这些线索可视为一种知识网络,是诠释特定资料的基本素材[8]。此外,将不同的知识线索加注、统一URI后,即可自动形成所谓全球型的信息网或信息图谱[9]。

2.2 LD的查询与浏览

除一般字段与关键词查询等功能外,LD PAC以URI的信息关联与聚合提供额外的功能。

2.2.1 关联式资源探索

LD PAC提供了关联式资源探索功能,与传统OPAC关联功能有所不同。在MARC因LD需求增加相关字段的子字段$0、$1、$4之前,OPAC关联范围主要以MARC记录的检索点为主,如作者、主题等,唯一例外在于字段856子字段$u关联外在网络电子资源。LD PAC则兼具内外部资源,尤其是不同来源的外部LD资源。因此LD PAC的关联式资源探索已由内部关联扩展至外部资源。

2.2.2 LD关系的显示与查询

由于LD采取RDF的主语、谓词和宾语陈述不同于LD间的语义关系,因而RDF语法中的谓词除了可以机读外,也可以人工识别,尤其以URI命名时更是如此,所以LD间的关系除可被明确标示以外,也可作为检索之用[10]。语义关系可能是层级关系,也有可能是相关主题的部分与完整关系,或是特定主题的相关信息。除原来隐藏在MARC栏目间的彼此关系可以被清楚描述与标示外,也可以作为探索信息的新起点,不再需要用户自行推测或理解彼此关系后,即可转化为新的查询关键词与检索点[11]。

2.2.3 信息偶遇

鉴于URI的信息聚合功能,同一LD可以关联至不同来源的信息,即不同观点的信息整合至同一URI,堆叠成不同的信息网络。这既可以引导用户发掘相关信息,也可以提供不同关联的线索,引导用户找到未曾想到的信息,形成一种信息偶遇的效果[12]。

2.2.4 关键词推荐服务

LD PAC用户可以利用自动推荐关键词查询,并善用LD型权威控制词汇服务。利用特定词汇的不同形式拼法与多语言的关键词推荐服务,改善资源探索服务。

2.2.5 URI型与层级式信息导航

就URI为基础的LD而言,URI除了识别LD之外,其主要功能是以URI聚合不同来源的LD资源后,用户可以依照聚合的相关URI浏览与查阅相关资源,称为URI型信息导航。除此之外,URI也能提供层级式信息导航。

2.3 其他功能

LD PAC主要是引入外部LD资源,除丰富OPAC的内容外,还具备其他相关功能。

2.3.1 对外开放目录信息

目录LD化后,除了引入外部LD资源外,也强调开放目录,以利于用户获取LD PAC数据。因此LD PAC必须成为网络空间的一部分,由内而外推广LD PAC信息至网络搜索引擎的索引与查询范围内,增加其曝光度,有利于后续的增值服务,如Google的搜索艺廊(Search Gallery, SG)与知识图谱(Knowledge Graph, KG)等。

2.3.2 动态组合式信息

为使未来的目录具备动态组合功能,LD PAC应具有动态重组与自适应用户界面的能力。LD PAC可依LD所整合的URI适时地调整,以提供满足不同需求的功能服务。因此LD PAC具备的功能是以URI为根据,包括关联式资源探索、关联外部LD资源与类型、自我描述与动态内容、LD关系的显示与查询、聚合式知识网络与信息图谱、信息偶遇、URI型与层级式信息导航、LD信息的动态组合、关键词推荐服务、对外开放目录信息,共10项。

3 案例与研究方法

有关图书情报类LD的案例众多,有些针对权威数据,有些以书目数据为主,有些则是以定位关联不同的LD来深究LD PAC。本研究选取涵盖书目与权威数据的LD案例为研究对象,包括欧洲的西班牙国家图书馆(Biblioteca Nacional de España, BNE)与法国国家图书馆(Bibliothèque nationale de France, BNF),LC LDS以及关联数据生产(Linked Data for Production, LD4P)计划之一的共享型虚拟探索环境(SHARE Virtual Discovery Environment, SHARE-VDE)共四个案例的LD PAC。其原本OPAC也同时存在,可供回溯参照LD与MARC记录两者之间的变化。再者,四个案例可划分为书目记录功能需求(Functional Requirements for Bibliographic Records, FRBR)与书目框架(Bibliographic Framework, BIBFRAME)两个类型的书目本体论。其中BNF是以FRBR为基础发展BNF书目本体作为LD之用,而BNE直接采用FRBR,LC与SHARE-VDE则是采用BIBFRAME,如表1所示。在测试样本方面,选取简·奥斯汀与其著作《傲慢与偏见》为实例。样本除了必须同时出现在四个LD PAC外,也须具备丰富的书目本体关系(如不同语言的姓名、不同语言的翻译著作与衍生电影等各类型出版物,及其著作的相关出版物与作者等)。最后在分析框架方面,以LD PAC具备的10项功能为主要依据,逐一评估四个LD PAC,并加以说明,讨论LD PAC的发展状况。

4 功能分析

以BNE、BNF、LC LDS与SHARE-VDE使用案例为范围,同时以LD PAC所具备的10项功能为框架进行分析,揭示其特点。

4.1 关联式资源探索

四个案例都具备此项功能,但范围与类型各有不同,如表2所示。以简·奥斯汀为例,提供的关联式资源探索范围可分为内外两方面,除了本身LD PAC外,也包括外部LD资源。在LD PAC方面,四个案例全部提供简·奥斯汀的相关著作,但只有LC LDS与SHARE-VDE除提供以简·奥斯汀为研究对象的相关作品外,也提供不同形式名称的作品。比较特别的是,BNE、BNF与SHARE-VDE提供相关衍生作品。BNE主要是提供有关数字重制的作品信息,而BNF是汇总简·奥斯汀作品所涉的主题,以及衍生作品与相关作者,如翻译作品与作者、影视作品与演员、剧作家等。另外,SHARE-VDE在LD页面中,则未明确区分简·奥斯汀相关作品及其衍生作品与作者,须至浏览单笔书目记录时才能知晓。

4.2 关联外部LD资源与类型

四个案例所关联的外部LD资源与类型大不相同,如表3所示。LD资源大致可区分为图书情报类与非图书情报类,其中非图书情报类LD资源除了DBpedia、Wikidata与Wikipedia外,还包括Getty Vocabularies LOD、Geonames与MusicBrainz。以数量而言,BNF提供的外部关联数据数量最多,共有10个,同时也是被其他三个LD PAC所关联的对象。

4.3 自我描述与动态内容

在四个案例中,自我描述与动态内容可分为两类:内部与外部。内部自我描述与动态内容是指LD PAC依其所采用的书目本体论关系关联本身的LD与其内容呈现。四个LD PAC除包括表2所列的相关作品、衍生作品、衍生作品的个人以及与此人相关的作品等项目外,可以发现LC LDS依据BIBFRAME的类别与属性关系详细列出某一LD项目的名称与实例。另外,外部自我描述与动态内容是指由外而内导入外部LD资源至LD PAC本身,除了LC LDS未具备本项功能外,其余三个LD PAC都具备Wikipedia被BNE、BNF与SHARE-VDE共同用来丰富既有LD PAC的LD外部资源,而SHARE-VDE则进一步提取VIAF的不同形式名称供用户参考。

4.4 LD关系的显示与查询

四个LD PAC都提供LD关系及其语义,其中只有LC LDS以BIBFRAME原有类别与属性关系名称作为LD关系的语义名称,BNE与BNF则是通过转化原有书目本体论的专有名称为一般名称来引导用户,而SHARE-VDE除了一般名称的LD关系外,还辅以可视化界面。以简·奥斯汀的作品为例,BNE以“Sus obras(His Work)”,BNF以“Textual works”,LC LDS以“Contributor To Works”为提示语引出相关作品,而SHARE-VDE则以“Work”直线连接作者图像与作品。此外,四个LD PAC都未提供LD关系型的关联式资源探索,除非经由SPARQL端点达成。

4.5 聚合式知识网络与信息图谱

基本上四个LC PAC都采用LD的谓词将某一LD的相关知识网络予以分类与呈现。以简·奥斯汀为例:

(1)BNE提供简·奥斯汀个人作品、以其个人为研究对象的作品、包含她的相关作品、外部LD资源关联与查证参考资料五种类型的知识网络。

(2)BNF区分为简·奥斯汀著作、研究简·奥斯汀相关著作、与她相关的个人、BNF馆藏目录的跨库检索与外部LD资源关联等。

(3)LC LDS列出以简·奥斯汀为研究对象的作品与其个人作品,及其他语言名称与LC LDS的相关LD URI(即http://id.loc.gov/rwo/agents/n79032879)。除外部LD资源的关联外,也提供原来LC权威记录已查证的相关参考来源等信息。

(4)SHARE-VDE以可视化关系图形界面呈现查询结果,主要包括:下方是相关作品、右方则是个人的不同名称,左上方则是外部LD资源关联,左下方则是取自Wikipedia的基本信息。在页面上,左右两方以层级分类方式显示,分别包括馆藏地、格式、书目层次、年代间距、出版物年代与个人主题,以及书影等。

信息图谱是以URI为基础的LD,从四个LD PAC得知,LD PAC可无形中发展成信息网或图谱,但只有部分案例达成KG。取自不同信息来源以形成摘要式信息,即所谓的信息卡或知识面板。根据定义,发现LC LDS并未达成所谓的KG,虽然关联来源包括LC LDS本身所属LD与外部LD资源,但是外部LD资源仅标示URI而已,实际上并未将外部LD资源引入LD PAC中。另三者则符合KG要求,如BNE融合Wikipedia与BNE LD信息,BNF额外整合了Wikipedia与BNF数字图书馆系统Gallica,而SHARE-VDE结合Wikipedia等信息于一身。若从LD的数据流向看,LC LDS只实现了LD的发布,并未形成LD的使用,其余三个LD PAC则是两者兼具。

4.6 URI型的信息偶遇

此功能由URI关联的知识网络与信息图谱促成,四个LD PAC都具备此项功能,因而形成信息偶遇的知识线索必须视内外部LD的关联与跨库检索而定。所以LC LDS只限于本身LD的知识网络,并未形成KG,而跨库检索仅经LC卡片目录的URI关联至相对应的MARC记录。BNE与SHARE-VDE则比LC LDS多了KG与外部LD资源关联两项功能。另一方面,BNF除了具备KG与外部LD资源关联两项功能外,也提供跨库检索。就关联的外部LD资源与跨库检索而言,BNF最为丰富,可提供的信息偶遇机会较多。

4.7 URI型与层级式信息导航

四者都具备URI信息导航功能,范围包括LD PAC本身及其外部LD资源与跨库检索。就层级式的信息导航而言,除了不同类型的知识网络外,比较特殊的是LC LDS以URI为依据,提供一种层级式浏览结果,包含纲要、类型、合集、创作日期与修改日期等。同时LC LDS也运用BIBFRAME词汇作为提供层级式信息导航的依据。

4.8 LD信息的动态组合

经由“聚合式知识网络与信息图谱”与“URI型与层级式信息导航”讨论,可知四个LD PAC都已具备此项功能。例外的是SHARE-VDE以URI为依据,自动形成虚拟式联合目录功能。

4.9 关键词推荐服务

关键词推荐服务分为关键词查询对话框与LD显示两种。在关键词查询方面,BNE、BNF与SHARE-VDE都已提供。在LD显示方面,BNE与BNF并未提供本项功能,LC LDS仅列出不同形式的个人名称,但无法关联查询,必须由用户理解后自行输入查询,而SHARE-VDE除列出不同形式的个人名称外,更进一步实现关联式资源探索,直接供用户查询。

4.10 对外开放目录信息

获取对外开放目录信息共有三种方式,包括单一下载、批次下载,以及SPARQL端点批次下载。其中SHARE-VDE只提供单一LD下载方式,LC LDS则同时提供单一与批次LD下载,而BNE与BNF具备三种方式。四个案例的LD PAC功能服务整合如表4所示。

5 讨论

整体而言,LD PAC与传统OPAC的区别主要有两方面,一是信息粒度是LD资料,而不是代表文献的记录;二是LD PAC除了以URI作为LD资料的识别外,也标示不同LD资料的语义关系,因而形成LD PAC的特色。

5.1 网络化PAC

LD PAC由不同的URI组成,包括URI所代表的LD资料及其相互关系。每一LD资料可经由这些URI关联,进一步聚合LD PAC内外部LD资源,形成一个探索信息的新起点,以此查找不同网络化的关联信息。经由四个案例的探讨,可发现所谓网络化信息具备下列几种特点。

5.1.1 提供基本的背景信息

首先,可由外而内为既有的LD提供更丰富的外部LD资源。以往传统OPAC一旦在MARC字段856子字段$u著录URL后,即可由外而内带入书影与目次。然而,在LD PAC中,引入的是Wikipedia信息,为个别LD提供基本的背景信息。

5.1.2 标引书目本体论关系

(1)提供作品的相关引导与识别,如BNF提供不同载体版本的关系(如“Editions of ‘Pride and prejudice’”)。

(2)提供主题LD的广义与狭义的相关主题关系,如BNF的“Allemand (langue)”。

(3)提供个人的相关关系,如BNF提供简·奥斯汀的合著者及其相关研究者、剧作家、演员等。除此之外,OCLC(Online Computer Library Center, 联机计算机图书馆中心)的身份档网络(WorldCat Identities Network)则是关联简·奥斯汀与其作品的学者网络,包括可视化图形,相关学者与其作品等,而社会网络与档案背景(Social Networks and Archival Context)以可视化的方式显示简·奥斯汀家族在文学等方面的人际关系。

5.1.3 提供跨库检索

如LC LDS关联LC馆藏目录,而BNF LD关联BNF的实体馆藏与数字馆藏OPAC外,也关联音乐与文化遗产等外部数据库。

5.1.4 提供查询关键词的推荐

SHARE-VDE除了提供不同形式与语言的关键词外,也可直接关联查询,而BNF与LC LDS仅提供不同形式与语言的关键词,用户须自行理解这些不同点之后,将其自动转化为查询关键词,并重新查询。

5.2 LD PAC类型及LD化方式与URI关联化程度

通过四个案例,发现LD PAC可分为LD驱动式与导向型两种,其中SHARE-VDE属于前者,其余三者属于后者。就LD PAC的数据内容本质而言,SHARE-VDE内容仍为MARC记录,只是采用子字段$0或$1,著录LD所需的BIBFRAME类别的URI,以此关联相关的LD,并采取MARC对照至所属的BIBFRAME类别后,以RDF数据格式予以标示,即采用所谓的关联型MARC方式,故SHARE-VDE并未将MARC分解为个别LD[13]。

除了BIBFRAME外,SHARE-VDE也采用RDA注册中心的词汇区分RDA类别与属性,尤其是在MARC字段758的子字段$1与$4。因此,除了LD PAC外,SHARE-VDE仍可以同时提供传统式OPAC查询界面。另一方面,其余三个案例则全是MARC记录为相关的个别LD,并未同时提供传统OPAC查询界面,而是经由特定URI或记录号关联至原来的OPAC。

若从LD化的方式看,可以发现BNE除充分落实FRBR三组实体关系外,分别建立第一组书目与第二组个人、机构,以及与第三组主题的关系,并采用西班牙文版本FRBR与ISBD词汇予以描述。因此BNE依据MARC与FRBR的对照结果与其相关LD化程序,从MARC记录中提取出所需资料为LD,包括个人、实体(包括机构与地名)、作品与主题,并用URI命名。于是在浏览LD时,只限于上述类型进行URI关联,并未将所有对应词汇所属字符串予以URI命名,同时关联原始OPAC与相对应的MARC记录。

BNF与BNE十分类似,虽采取以FRBR为依据的BNF书目本体论建立模型和LD化,并从原始MARC记录中提取出作品、期刊、表演、作者(含个人与团体)、主题、地名与年代等不同类型的LD,且以URI命名,但仍未将所有对应词汇所属字符串予以URI命名。此外,在URI关联OPAC与BNE相同。

反观LC LDS,除已全然采用BIBFRAME书目本体词汇建立模型外,也发现每一BIBFRAME词汇所属字符串都具备URI,所以LC LDS才是真正实现全面化的URI命名与LD关联化,最终LC LDS能在查询结果的页面中获得BIBFRAME词汇提供层级分类式的限制功能。因此未来LC LDS的目录动态组合的弹性较大,且类型趋向多元化发展。如果能将丰富化工作后的外部LD资源进一步增值应用(如信息图谱或KG),可将LD PAC扩展至另一种崭新的目录信息服务领域。

5.3 目录功能

未来目录应具备搜寻、聚合与动态组合功能。据此,可发现LD PAC搜寻的主要对象为LD及其关联的相关LD与文献,而且搜寻类型可采用书目本体论的类别加以区分,如作品、内容版本、载体版本、单件、实例、个人、家族、机构、主题、地名、时期与特定年代等。在聚合方面,LD以URI为依据,不以作者等不同类型的字符串为依据,自动聚合同一URI所关联的内外部LD资源,如BNE、BNF与SHARE-VDE等。在动态组合方面,由于URI的聚合具备主动与被动式动态关联,前者可由信息组织专业人员主动加入同一URI不同观点的URI,后者则由网络用户加入。因此,本质上同一URI的内外部LD资源聚合即具备动态式组合(如BNE、 BNF与SHARE-VDE加入Wikipedia)。除此之外,就LD PAC(如LC LDS)而言,所依据书目本体论的每一类别与属性名称,除可成为个别独立的层级分类导航外,也可作为查获结果的限制条件,以缩小或更精准地筛选查询结果。

5.4 URI型的LD语义关系与LD开放程度

在LD语义关系方面,只有LC LDS完全采用BIBFRMAE词汇,其余三个案例则是将原有书目本体词汇予以一般化,以引导用户查找相关LD,若要以语义关系进行查询,必须经由所谓的SPARQL端点获取。但SPARQL方式对于一般用户而言需熟悉SPARQL语法,因此不够直观、友善。此外,有些并未对外提供SPARQL端点,包括LC LDS与SHARE-VDE等;另一方面,根据LD开放程度可分为三种类型,包括单一、批次与SPARQL端点对端点,BNE与BNF则是三种方式全部提供,最为齐全。其中BNE、 BNF与LC LDS提供大量LD资料批次下载,开放程度与传统OPAC差异较大。值得留意的是,BNF更进一步提供JSON-LD(JavaScript Object Notation for Linked Date)档案格式,是符合Schema.org规定的格式之一,更加有助于由内而外将资料推广至网络搜索引擎的搜索范围之内,增加曝光度,符合未来在搜索引擎优化方面的应用,如SG与KG等。当BNF LD资料已列入网络搜索引擎的索引与搜索范围内,它也能成为Google KG的一部分,并真正融入网络空间,也可以经由符合Schema.org的结构化数据格式语法要求(如JSON-LD是一种通过关联数据描述结构和内容的方法),将吻合的关键词查询结果,以类似SG艺廊的影像框架展览方式,呈现相关网页内容的名称、图像与相关文字简介等信息。

5.5 与资源探索系统之间的比较

当书目LD化后,PAC除了LD化外,LD PAC与资源探索系统两者之间异同,可从范围、处理对象、丰富化结果、语义关系、关键词推荐与层级浏览方面加以探讨。

5.5.1 范围

两者都以现有馆藏为范围,但是资源探索系统的索引范围包括实体馆藏、商业授权的电子资源、免费的网络电子资源(如OA期刊与图书)和数字馆藏。然而四个案例中多数LD PAC仍以实体馆藏为主,只有BNE、BNF(如Gallica跨库检索)与LC LDS包括了数字馆藏,但大都以经典作品居多,因而现有LD PAC中并不如资源探索系统的索引范围大且多元(如未包括期刊文献等)。如今学者与其研究并未涵盖在图书情报界的LD PAC或LD数据中心,如果能将期刊等文献纳入LD PAC关联数据公共目录中,就能发挥URI型知识网络与信息图谱的信息提供和导航功能。

5.5.2 处理对象及丰富化工作的依据与结果

现有资源探索系统仍以文献为主,且相关索引条目(如作者、主题等)既为关联型检索点,也可作为另一次检索信息的起始点。然而,LD PAC以数据及其关联的文献为处理对象,除了提供关联资源探索外,也以URI为依据,由外而内提供LD的相关知识线索、信息卡与信息图谱,这正是资源探索系统以文献为处理对象所无法提供的信息。另一方面,两者的丰富化后,结果也大不相同。资源探索系统由外而内的主要丰富化结果为书影和目次,而LD PAC则为相关知识线索、信息卡与信息图谱。

5.5.3 关系的呈现与检索

由于LD PAC采用书目本体论进行数据模型化,因而可以提供不同数据间明确的语义关系,引导用户找到相关信息。就资源探索系统而言,用户必须自行理解与猜测,以找到相关信息。

5.5.4 关键词推荐

资源探索系统是在查询对话框中引入索引条目,并利用用户的查询历史记录为基础提供推荐的关键词。然而,LD PAC除了在查询对话框提供类似的关键词推荐外,在查看个别LD时,则以URI聚合的不同语言与形式关键词作为推荐依据。

5.5.5 层级浏览

层级浏览时的不同体现在浏览的依据与层级两个方面。其中资源探索系统主要以某一书目记录的栏目与其数据值为主要依据(如MARC21字段260子字段$b的出版者),并提供层级浏览及其查询结果的限制条件。LD PAC则以URI为主要依据,层级浏览及其查询结果的限制条件以URI的命名类型为主。以LC LDS为例,是以BIBFRAME类别的词汇及其URI与所属实例为层级浏览及限制查询结果的主要依据。虽然目前只提供单一层级的浏览及限制条件,若依据BIBFRAME的类别层级关系,未来LC LDS的层级浏览可以扩展为两个层级以上的方式,如BIBFRAME的Identifier类别下可区分成40种以上的识别码,及Title类别区分为VariantTitle子类别后,又可划分为4种以上不同类型的题名等。

6 结语

发现OPAC被LD化后,URI命名范围与LD关联程度存有差异,只有LC LDS趋近完全URI型的数据关联化。然而遵循URI的LD关联化,除了由外而内丰富既有的目录信息外,也可由内而外推广目录信息至全球信息网的信息领域空间,如网络搜索引擎。另外,基于URI的内外部LD资源聚合,LD PAC逐渐具备了更多的网络化关系和信息,可整合成信息图谱,提供更多的知识线索供用户参照使用,形成URI型信息导航,以至于促成信息偶遇。更重要的是,LD PAC除了是一种馆藏目录外,也能转变成一种信息关联型目录,信息提供的范围则以数据网为范畴。四个案例只是LD PAC的发展现况,期待未来LD PAC具有更多创新的目录信息服务功能。值得注意的是,目前LD语义关系并未被充分发挥应有的功能,如用户是否能正确解读以书目本体论为依据的LD之间关系的文字意义,包括相关LD的导航与查询等。此外,现有书目本体论的内容与时俱进,词汇时有更新与变动。未来无论采用哪一种书目本体论,也会面临类似MARC内容的新增、删除与修改等维护问题。再者,原来图书情报界对MARC变动的处理原则与方法是否仍然适用于书目本体论内容的改变,都值得未来加以探讨。

参考文献:

[1] BOWEN J.Moving library metadata toward linked data:Opportunities provided by the extensible catalog[EB/OL].[2023-11-10].http://dcpapers.dublincore.org/pubs/article/view/1010/979.

[2] MOI A.When linked data is (not) enough:Cataloguing tools between obsolescence and innovation[J].JLIS.it,2020,11(2):1-19.

[3] COLE T W,HAN M J,WEATHERS W F,et al.Library marc records into linked open data:Challenges and opportunities[J].Journal of Library Metadata,2013,13(2/3):163-196.

[4] CANDELA G,ESCOBAR P,MARCO-SUCH M,et al.Transformation of a library catalogue into RDA linked open data[C]//Research and Advanced Technology for Digital Libraries.TPDL 2015. Lecture Notes in Computer Science,9316.Cham,Germany:Springer,2015:321-325.

[5] FEIGENBAUM L.BBC’s adoption of semantic web technologies:An interview[EB/OL].[2023-11-10].https://www.cmswire.com/cms/information-management/bbcsadoption-of-semantic-web-technologiesan-interview-017981.php.

[6] WAHID N,WARRAICH N F,TAHIRA M.Mapping the cataloguing practices in information environment:A review of linked data challenges[J].Information amp; Learning Science,2018,119(9/10):586-596.

[7] ULLAH I,KHUSRO S,ULLAH A,et al.An overview of the current state of linked and open data in cataloging[J].Information Technology amp; Libraries,2018,37(4):47-80.

[8] ALI I,WARRAICH N F.Linked data initiatives in libraries and information centres:A systematic review[J].The Electronic Library,2018,36(5):925-937.

[9] BAKER T,BERMES E,COYLE K, et al.Library linked data incubator group final report[EB/OL].[2023-11-10].https://www.w3.org/2005/Incubator/lld/XGRlld-20111025/.

[10] SOUTHWICK S B.Aguide for transforming digital collections metadata into linked data using open source technologies[J].Journal of Library Metadata,2016,15(1):1-35.

[11] LD4P Grant Proposal.Background and rationale[EB/OL].[2023-11-10].https://wiki.lyrasis.org/display/LD4P/Background+and+ Rationale.

[12] ULLAH I,KHUSRO S,ULLAH A,et al.An overview of the current state of linked and open data in cataloging[J].Information Technology amp; Libraries,2018,37(4):47-80.

[13] 高斌.MARC21关联数据化的转变与应用[J].图书馆学研究,2021(24):52-68.

作者简介:高斌,硕士,江苏科技大学图书馆副研究馆员,研究方向为图书编目、信息组织、智慧图书馆;顾婷,硕士,江苏科技大学图书馆馆员,研究方向为图书编目、数字人文;马菊红,硕士,江苏科技大学图书馆馆员,研究方向为阅读推广。

收稿日期:2023-12-13编校:李萍 王学思