连续性资源开放获取与关联方案研究
——以ROAD为例

2022-02-14 12:37宋文燕国家图书馆
图书馆理论与实践 2022年1期
关键词:连续性书目关联

宋文燕(国家图书馆)

1 选择和识别开放获取学术资源的困境

连续性资源是开放获取(Open Access,OA)学术资源的最主要来源。ISSN手册将连续性资源定义为“以任何媒介出版的出版物,随时间推移而发行,没有预先确定的结论,并向公众提供”[1]。连续性资源包括我们通常所说的连续出版物,如期刊、报纸、会议录等;还包括集成性资源,如连续更新的网站、数据库等。全球仅期刊这种连续出版物的基数就非常庞大,网站、数据库等集成性资源更是难以计数。然而,用户面对大量的这类资源时,存在着选择和识别的困难。

在出版实践中,一方面,并不是所有承载或包含OA学术资源的连续性资源的题名与其对应的ISSN都是唯一匹配的:有的连续性资源在题名出现重大变化后没有及时申请ISSN而是继续使用对原题名分配的ISSN,有的使用别的或已经停止出版的连续性资源的ISSN,有的通过非正规途径取得ISSN,有的则把印刷版的ISSN用在在线资源上。这些情况导致“一刊多号”“一号多刊”等“违规”连续性资源的出现。“违规”连续性资源出版者倾向于盈利而非科学进步,存在着连续性资源申请ISSN时信息虚假、连续性资源上的文章内容稀缺或抄袭、自己发明期刊影响因素等现象。另一方面,世界范围内的研究机构和组织一致认为发布在国际标准体系或标识符系统认可的OA学术资源上的研究成果才具有科学性和有效性,对于那些在“违规”学术期刊上发表文章的人采取惩罚性措施的呼声越来越高,连续性资源的质量和声誉与OA学术资源紧密地联系在一起。由此,面对大量的连续性资源,用户在判断、选择和识别符合国际标准体系或标识符系统的合法连续性资源,尤其是OA学术资源时,由于缺乏正确且可验证的信息,很难从连续性资源提供的信息中甄别出真实、有价值的信息。即使选择使用的资源属于合法、有效的范畴,但由于没有一个直接、便利、开放的入口提供给用户使用,导致用户只能花费大量的时间、精力来进行判别,有时甚至一无所获。这不仅给用户造成很大的不便和困扰,也影响了OA学术资源的价值发挥与利用。

2 ISSN国际中心的方案

自从国际连续出版物号(International Serial System Number,ISSN)于1975年第一次作为一个ISO标准——ISO 3297建立以来,ISSN国际中心40多年来一直致力于识别全世界的连续性资源,保持连续性资源识别的标准化、国际化和权威化。在联合国教科文组织通信和信息部门的支持下,ISSN国际中心依托ISSN网络(包括89个ISSN国家中心和ISSN国际中心)创建并维护ISSN国际注册信息数据库——ISSN注册系统(ISSN Register),并研发了开放获取学术资源目录(The Directoryof Open AccessScholarly Resource,ROAD)[2],随即展开了招投标选择承包商进行项目的技术开发、对数据进行检查和更新、与索引/摘要等其他OA学术资源数据库沟通合作等一系列工作,最终ROAD的测试版在2013年12月正式发布[3],并于2014年6月通过了ISSN国际中心理事会验证。

2018年1月5日,ISSN国际中心发布了新的ISSN门户网站和客户外联网[4],作为门户网站的一部分,ROAD免费对外提供使用。经过几年的发展,ROAD既提供连续性资源的详细元数据,也提供各种RDF格式的关联数据,而且这些数据都已被Keepers Registry(保管机构登记处)确认并存档。ROAD和Keepers Registry等的关联使得在线信息可用于评估所描述的连续性资源的质量。ROAD为全球研究人员和相关机构提供了一个新的识别和选择关联OA学术资源的新方案,是对联合国教科文组织推出的全球开放获取门户(Global Open AccessPortal,GOAP)的一个重要的补充。

2.1 ROAD资源建设机制

2.1.1 资源建设措施

ISSN国际中心在建设ROAD时,采取了一系列措施来保证其涵盖的书目记录是描述OA学术资源的记录,正是这些措施保障了ROAD的运转及其标识的权威性。

(1)识别开放获取学术资源。从2013年7月开始,ISSN国际中心发起了“核心资源”活动[5],主要目标是改善和增强用户对ISSN注册系统中数字学术出版物的查阅。主要方法是对自20世纪90年代末以来在ISSN网络分配的在线连续性资源进行OA学术资源的识别。ISSN国际中心根据资源是否在ISSN注册系统中登记注册,来对已分配了ISSN并在ISSN系统中登记注册了的资源进行回溯性识别。ISSN网络的各个国家中心对未分配和登记注册的在线资源进行实时识别。

(2)检查、更新ISSN记录。为了使通过ROAD检索到的数据具有可获取性和重用性,ISSN国际中心提出,要对所有在2013年12月ROAD项目发布之前创建的ISSN记录以及由其描述的OA学术资源进行检查和更新,如URL是否可用、出版者是否发生变化等。同时,对所有影响ROAD使用的各种问题进行核查,如发现URL失效或链接变更的,要在ISSN记录的相应字段更新为可用的、可自由访问的URL(统一资源定位符)。

(3)将ISSN记录与ROAD中的资源范围清单进行匹配。ISSN记录是由ISSN国际中心和各个国家中心根据ISSN手册创建的。ISSN国际中心每周会对在ISSN注册系统中登记注册的标明为分配给OA学术资源的ISSN与索引/文摘数据库、注册系统和期刊指示符等提供的范围清单进行匹配,当匹配的结果为“正”时,ISSN记录通过“在范围清单内”或者指示符来自动完成标注,即这样的ISSN记录属于ROAD。

2.1.2 资源选择标准

为了保证识别的资源属于OA学术资源,ISSN国际中心对是否属于ROAD范围的资源制定了以下标准[3]。①开放获取的是资源的整体内容,但不包括“混合”出版物。若连续性资源是“混合”出版物,不属于ROAD的资源范围不被收录,不被认可为OA学术资源。②在线OA资源通过标识的URL可以自由访问,即网页打不开或者URL已经失效的情况不能存在。需要注意的是,OA学术资源的ISSN记录中,URL应直接指向资源的URL,而不是出版者网站主页的URL。如“Zhongguofei’aizazhi(online)”(ISSN 1999-6187)的URL为http://www.lungca.org/index.php?journal=01,而不是其他。③资源主要由研究论文组成。主要包括OA学术期刊和学术论文知识库。OA学术期刊刊载由研究人员撰写的涵盖不同学科领域的文章,学术论文知识库持续更新集成性资源。④资源的目标用户是研究人员和学者。

这四个标准简易通俗,便于操作,而且直指OA学术资源的核心,即研究人员和学者这类用户可以自由、免费、方便、不受时间和地点限制地多次获取和使用被确认为ROAD的资源。

2.1.3 资源编码

ISSN网络为连续性资源分配了250多万个ISSN,大约每年增加5万—7万个连续性资源的识别和描述[6],这些连续性资源记录构成了日益丰富的ISSN网络及其提供服务的基础。ROAD记录是根据ISSN手册的编目规则创建的书目记录,为使系统能够自动识别和确定ISSN国际中心和各个国家中心提交的资源是否为属于ROAD范围的OA学术资源,ISSN国际中心确定了一种“内部”编码机制,为连续性资源书目记录添加特定的ROAD编码。

编目员在使用MARC21和UNIMARC创建连续性资源的书目记录时,对于属于ROAD范围内的资源,编码必须添加在856的$x子字段(见图1)。如果记录中包含多个856字段时,其中必须有一个字段有子字段$x。作为一种“内部”编码机制,这个子字段不会在ISSN门户网站上的书目记录中显示,也不会作为文档被ISSN注册系统的订阅者导出。在具体操作时,要针对不同类型的资源使用不同的编码,如期刊的编码为“OA-J”、会议论文的编码为“OA-C”、学术知识库的编码为“OA-R”。此外,对于已经标明是OA学术资源的记录,如书目记录中有“Gold”或“Green”时,则不需要再对记录重新编码[7]。对于那些可在线免费提供的已停刊的印刷版学术连续出版物的电子版则用“Archive”进行编码。对不属于ROAD范围的资源是否编码也进行了规定,如某种OA学术资源限制用户访问或获取,或者仅有部分期刊论文或卷期在线时,不对其进行编码。

图1 连续性资源“Translational neuroscience and clinics(Online)”(ISSN 2096-0670)的ISSN记录

连续性资源停刊、更名、变更出版频率等时,要更新其书目记录。如果出版者的开放获取政策发生变化,且资源不再符合ROAD标准,或者资源不再在线使用时,相应的ROAD编码要从字段856中删除,记录不会再在ROAD中发布。

2.2 ROAD的实现机制和功能

ROAD提供了一个免费访问ISSN注册系统的子集,这个集合主要由ISSN网络分配了ISSN号的描述OA学术资源的书目记录组成,其目的是概览全球所有由ISSN识别的期刊、会议论文集、专题类连续出版物、学术机构知识库等OA学术资源出版物。ROAD为世界各地出版的在线学术资源提供了一个可自由检索和访问的入口。通过此入口,用户尤其是研究人员和学者能了解到世界范围内开放获取学术出版的概况以及使用或感兴趣的OA学术资源的索引、摘录、引用等信息,对资源的可信度、质量等有一个基本的评价。同时,出版者发布的OA学术资源在ISSN门户网站上进行了展示,提高其被索引、数据库等引用和收录的可信度,也提升了OA学术资源书目记录之间、书目记录与资源之间、书目记录与机构知识库之间、资源之间、资源与机构知识库之间的关联度,扩大了OA学术资源的可见性和可获取性。通过ROAD,ISSN国际中心展示了其使用ISSN描述各种资源信息的新方法,在世界范围进一步发挥连续性资源识别的无可比拟的优势。

2.2.1 实现ROAD功能的语义模型——PRESSoo

ROAD的目标是帮助科研人员和研究机构发现特定主题的开放获取资源,并让所有提供元数据的合作伙伴共同使用ISSN,通过数据关联功能还可以实现为索引的每个资源提供其影响因子的来源之间的交叉检查。ROAD的功能实现需要适用于连续性资源的模型提供支持。2012年,ISSN国际中心和法国国家图书馆共同合作开发了PRESSoo,其在语义层为ROAD提供了通过语义Web技术使用的模型,而ROAD又为PRESSoo的使用提供了机会。

虽然书目记录的功能需求(Functional Requirementsfor Bibliographic Records,FRBR)自 发布以来应用到现有各种书目记录集合中的实验一直没有间断过,然而连续性资源记录却被排除在外,原因是在连续性资源记录中使用FRBR模型存在困难。为了解决连续性资源记录与FRBR模型之间难以适配的问题,PRESSoo应运而生。PERSSoo是一个面向对象的模型,致力于捕获与描述连续性资源特别是报刊书目信息的相关语义的正式本体,它是FRBRoo模型的一个扩展,实际上是CIDOC CRM的扩展。PERSSoo不是一个概念模型,而是一个通过语义Web技术使用的模型[8]。根据PERSSoo模型,ISSN手册中规定的每个元数据字段经审查后映射到CIDOC CRM和FRBRoo类或属性,这些类或属性也被称为PRESSoo的具体类和属性。因此,PRESSoo能够精细地描述连续性资源的具体特征,以及随着时间的推移影响它们的变化(如继承、吸收、拆分等)及其可能与其他连续性资源的关系(如其他语言版本、网络版等)。PERSSoo的目的是使连续性资源的语义信息和关联关系更加精确,这样就为数据自动处理和互操作提供了前提条件,为书目数据更广泛地交流和共享奠定了基础。

在ISSN门户网站,通过地图检索、分面检索、简单检索和高级检索等多种检索方式,以ISSN、题名、出版者、责任者、团体名称、国家、主题、语言、出版年等为检索词对目标资源进行检索后,检索结果主页面以资源信息、资源相关题名、资源网络、资源历史、记录信息等栏目展示和关联资源的丰富信息,用户通过“My Tools”栏还能对目标资源进行分享、打印以及用RDF/XML、JSON-LD和Turtle三种格式展示关联数据。ROAD独有的检索方式满足了不同用户的检索需求,突出了检索服务的个性化。这与PRESSoo模型与连续性资源的良好适用性密不可分。在以RDF/XML格式为例展示关联数据时,我们可以发现,其序列化的基础是CIDOC-CRM,FRBRoo和PRESSoo这三个本体。在该序列化中,由URI(与ROAD网页的URL相对应)识别的每个连续性资源是PRESSoo中“F18连续作品”类的实例。来自这些本体的各个类和属性主要用于描述每个资源的特征。在ROAD中,RDF/XML仍然遵循RDF三元组原则,同时通过XML对文档和数据进行结构化处理。RDF/XML文档树显示情况见图2。

图2 连续性资源“Translationalneuroscienceand clinics(Online)”(ISSN 2096-0670)和RDF/XML文档树(部分)

由图2可知,ROAD的RDF/XML严格遵循数据格式与长度规范的三元组<资源,属性、属性值>结构,使通过ROAD检索后的结果在网页上展示出丰富的摘要信息,便于用户更直观地了解连续性资源的全貌。尽管ROAD在XML文件中并未包含任何关联的样式信息,但通过PERSSoo模型的两个关键的概念类和属性把连续性资源本身的动态特征、自身的复杂关系(如继承、合并、替代等)在语义层面进行揭示,通过把ISSN记录这种书目数据RDF化后,又把连续性资源间以及连续性资源与其他资源间的隐藏关系进行关联。随着关联技术的运用和ISSN国际中心对ROAD功能的优化和提升,通过ROAD检索还能把目标OA学术资源以png、jpg格式展示其资源网络关系,实现了ROAD的数据关联功能。

2.2.2 ROAD的数据关联功能

自2006年Tim Berners-Lee提出“关联数据”概念以来,它在推荐、发布和关联各种数据和信息方面的价值已经得到普遍的认可和广泛的使用。关联数据支持在特定信息环境下对不同信息对象的关联和发现。Tim Berners-Lee提出,关联数据必须遵循四个原则:使用URI命名事物、使用HTTP URI使人们可以访问到这些标识、当用户查找URI时通过RDF等标准提供有用的信息、尽可能提供关联的URI使人们可以发现更多的事物[9]。通过这四个原则,在内容对象间建立了规范化的命名机制和调用内容对象的机制,同时要求用结构化、规范化方式来描述内容对象,在使不同内容对象之间建立起关联的情况下,支持相关内容对象的关联检索[10]。实际上,关联数据是在互联网上使用标准格式和接口发布的一系列技术,而遵循相关标准的数据就是关联数据。

作为负责提供书目信息的组织,ISSN国际中心对关联数据技术表现出了浓厚兴趣。一方面,关联技术对发现、检索、交换甚至自动生成元数据具有重要意义;另一方面,ISSN注册系统本身就是基于标识符和链接建立起来的。ISSN国际中心运用关联数据原则和技术,通过ISSN这种连续性资源唯一的、普遍的、可信赖的标识符建立资源之间的联系。从用户角度来看,用户在同一地点就可以获取资源的标识符和资源的元数据,从而支持内容的发现、获取和交换,满足一些组织、机构重复使用数据、增强对自身数据了解的需求;从ISSN国际中心自身来说,在为用户提供更优质服务的同时,能够满足用户不断增长的需求,也促使40多年建立起来的ISSN系统和庞大的ISSN网络的价值焕发新的生命力。

ISSN国际中心将关联数据原则和工具视为从其自己的注册系统分发信息的突出方式,实现连续性资源关联数据功能的关键是将通过ISSN关联的数据怎样发布出去。建设ROAD的目标之一就是把其建成ISSN系统未来项目的“实验室”,解决关联数据问题是最先开展的实验工作。ISSN国际中心通过运用关联数据原则和技术,不仅使ISSN记录发挥了更大价值,而且使关联数据的作用得以最大化体现。最重要的是,通过ROAD提供的书目信息把相关联的资源和数据在HTML页面进行编码后,这些书目信息就成为关联数据发布的一种方式,并且还可用于批量下载。在ROAD上,每个连续性资源的ISSN记录对应一个网页,该网页包含其ISSN号码的URL唯一标识,遵循的模型是http://road.issn.org/issn/[ISSN-NUMBER][11],因此上文举例的连续性资源在ROAD上的URI标识就是“https://portal.issn.org/resource/ISSN/2096-0670”,并且是该记录在ROAD上的唯一标识。在使用ISSN关联来自各种数据库的信息方面,ROAD提供了可能和有益的尝试,实现了ISSN记录向关联数据的过渡,ISSN国际中心既能向用户提供开放获取关联的连续性资源ISSN记录,也拓展了ISSN的服务范围。

3 展望与建议

3.1 ROAD的应用前景

ISSN国际中心通过ROAD为研究人员识别和选择由ISSN识别的具有高品质的OA学术资源提供了支持和帮助。在ISSN门户网站上,ROAD具有友好的界面和良好的适用性,为广大用户提供了一种全新的检索、展示ISSN注册系统以及来自各种来源的关联信息的新方案。ROAD通过自身的完善和发展,持续为用户提供免费访问世界范围内不同类型在线OA学术资源及其有关质量和重要信息的服务。ISSN国际中心在扩大ROAD影响的同时,积极支持ISSN网络的开放获取与关联,在将ROAD打造成为一个全球性、全面和多学科关联的开放获取学术资源工具方面不断进取,为推进开放科学的发展而努力。

3.2 提高我国连续性资源开放获取与关联的世界影响力建议

我国连续性资源数量庞大,提高我国连续性资源尤其是学术期刊在世界范围内开放获取的影响力是使学术文章价值得到有效发挥的必要措施,对于促进学术信息自由交流和知识共享及促进包含这些学术文章的连续性资源的交流具有重要意义。因此,笔者对提高我国连续性资源开放获取与关联的世界影响力提出以下几点建议。

(1)我国连续性资源必须遵守我国的出版政策,除取得国内刊号外,取得ISSN号后才是国际认可的标准连续性资源。出版者申请到ISSN后,按照要求在连续性资源的显著位置标示ISSN号,出版过程中要按照申请的连续性资源题名出版。当题名、出版频率、出版地点、出版者或者计划及其他的版本出版等发生变化时,都要及时向ISSN中国国家中心说明,或者申请新的ISSN。这是保障连续性资源唯一性的必要措施。ISSN是国际普遍认可的连续性资源识别符,经过ISSN注册系统认可的OA连续性资源都被纳入ROAD中,而且被不同的数据库索引,其传播的范围和力度也会得到扩大和增强。

(2)探索合作模式。OA的形式、程度、范围除了与OA政策密切相关外,与经济政策也密不可分,打破瓶颈的唯一办法就是在一定的OA政策下不断探索新的商业模式。以向作者收取文章处理费(ArticleProcessingCharge,APC)为例,要细化其用途,针对不同的OA形式开发不同的协议,甚至同一种形式内细化不同的协议。同理,根据许可证的授权来细化不同的订阅使用。学术期刊与我国商业期刊数据库进行合作是连续性资源提供持续OA的一个途径,这也是国际大多数OA学术资源通行的做法。

(3)加强关联数据技术的运用。通过关联数据技术促进连续性资源、学术文章、作者、出版者等在各类数据库或标识符系统中的关联度,促进知识和内容的发现、获取、交换和传播,从而促进OA学术资源价值的最大化,反之亦然。

猜你喜欢
连续性书目关联
推荐书目《初春之城》
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
非连续性实用类文本阅读解题技巧例谈
“一带一路”递进,关联民生更紧
小学中段非连续性文本阅读教学初探
奇趣搭配
智趣
连续性
联合疗法治愈连续性肢端皮炎一例
本刊邮购书目