基于OCLC平台的上海图书馆外文文献编目实践

2018-11-29 09:06倪道敏郑佳盈
新世纪图书馆 2018年8期

倪道敏?郑佳盈

摘 要 论文介绍了上海图书馆外文文献资源获取及编目情况,以上海图书馆外文文献不同来源的数据为分析对象,着重分析基于OCLC平台的数据情况,并结合OCLC平台使用情况及工作流程提出了对未来编目工作的展望和思考。

关键词 上海图书馆 OCLC 外文文献 西文数据 编目工作

分类号 G254.3

DOI 10.16810/j.cnki.1672-514X.2018.08.004

上海图书馆(上海科学技术情报研究所,简称上图) 是综合性研究型公共图书馆和行业情报中心,外文文献采集在其文献资源建设中占有相当大的比重。上图外文文献的编目和揭示依托于OCLC平台,是OCLC国内最早的管理性会员单位。本文通过介绍上海图书馆近年开展的外文编目业务情况,分享外文编目经验与成效,以期为同行提供借鉴参考。

1 2017年度上海图书馆外文文献资源总体情况

1.1 外文专业图书采购

上图外文文献资源以学术类图书为主,内容涵盖人文、社科、自然科学以及工程技术等各学科领域。语种包括英、日、德、法、俄、韩及西班牙语。2017年,共采购各类外文学术资源28 309种,其中外文图书27 399种、外文视听资料910种。

1.2 获赠图书和国际交换图书情况

国际交换和国际赠书是上图馆藏建设的一部分,上图与世界各国、各地区的六十多家图书馆长年保持着交换合作关系。2017年度,上图共收到交换、赠送的图书4525册。

1.3 大众类图书采购情况

为了满足普通读者对外文图书的阅读需求,自2014年起,上图尝试外文大众类图书的馆藏建设,并且收到了良好的成效,采购图书深受广大读者喜爱,借阅率逐年提高。2017年度,共采购大众类外文图书2050种,其中英文图书1739种、日文图书311种。

1.4 电子图书采购情况

2017年度,上图主要采购5家出版社的外文电子图书,总量达11 884种,具体如表1所示。除此之外,上图一般还采购ProQuest、EBSCO、易阅通和一些国外出版社出版的电子图书。

2 2017年度上海图书馆外文文献编目工作

2.1 外文文献编目情况统计分析

2017年上图Horizon流通系统共收录西文数据44 982条。从图书来源看,可分为:本馆采购、交换赠送、中心馆数据、回溯数据。其中,本馆采购又可分为纸本书和电子书两类,中心馆数据是指上图为上海市各区图书馆、街镇图书馆编制的数据,回溯数据是指长期未编的图书数据,具体分析见表2、图1。从数据来源看,可分为OCLC下载数据、自编数据和外来数据三类,具体分布见表3。本馆采购的纸本和电子比重达到了76.31%。在全年度收录数据中利用OCLC平台下载的数据达到了61.09%,其中本馆采购的纸本书并且利用OCLC下载数据的比重达到了54.42%。

外来数据主要用于外文电子书,这些数据一般由出版社随书配置,编目工作主要是进行分类法修改,不考虑外来数据的影响,上图2017年度总计编目29 568条(见表4),其中通过OCLC平台下载编目27 480条,约占总数的92.94%;自建数据2088条,占总数的7.06%。其中本馆采购(纸本书) 的自建数据占总自建数据的97%,主要由小语种图书(大部分为韩语图书,另有法语、德语、西班牙语等)、西文无数据图书、视听资料组成。在本馆编目数据中95%为学术类数据,5%为大众类数据。

2.2 基于OCLC的外文编目数据修改情况

从编目方式看,上图下载数据中92.5%的下载数据用RDA编目。即使有如此高比例的RDA下载数据,但仍然要进行数据修改。数据的修改是依据《上海图书馆西文文献RDA编目细则》。该细则类似《RDA本地政策声明》,数据修改严格依照《资源描述与檢索 (RDA)》 《MARC21书目数据格式》 《中国图书馆分类法》 《美国国会图书馆标题表》 《杜威分类法》 等规范进行。外文文献编目部门定期参阅“RDA TOOLKIT”、美国国会图书馆编目相关政策及OCLC编目字段的更新情况,并结合编目实际对编目细则进行更新。

数据的修改主要是三个方面。一是修改客观著录内容与文献本身描述不相符的地方,主要是责任者遗漏、题名项丛书项混淆、载体描述项(插图、表格、页码)遗漏、ISSN号遗漏等。二是修改与上图编目细则有出入的方面,主要是责任者著录数量、RDA特征字段(336-338) 部分子字段的遗漏,504内容附注遗漏,名称、主题规范的使用与控制等。三是对下载数据添加中图分类、索书号及上图本地特征化字段。

上图编目数据中仍有少量数据为原编数据。原编数据主要分为两类:一类是在OCLC有相似数据,但与上图编目要求差异太大,可用度不高,不能认定是否相同载体表现或基于编目效率暂不考虑对OCLC记录进行升级的,这类数据主要常见于IEEE及相关会议录数据、SPIE资料以及重印版的系列丛书;另一类是OCLC上无数据,主要是印度、德国等非英美出版社的图书,以及英美国家中比较小众的艺术类文献。

3 OCLC-WorldCat平台利用及工作流程概述

OCLC书目记录达到4.1亿条、总馆藏记录26亿多条,覆盖491种语言,向全球的图书馆、信息中心及其用户提供各种信息服务,通过存取世界各地的信息来降低获取信息的成本。OCLC也是促进国际标准不断发展的合作机构,尤其是在合作编目、资源共享、联机参考服务和馆际互借等方面做出了卓著的成绩。

3.1 上图西文数据及OCLC使用情况

上图1996年加入OCLC,成为国内最早参与OCLC合作组织的成员单位,主要利用OCLC平台进行西文数据的下载和上传工作。西文语种主要指英语、法语、德语、西班牙语、俄语等。目前,上图西文数据编制采用套录下载与原编相结合的方式。其中套录数据的数据源来自OCLC WorldCat数据库,突破了原本逐条编制数据的困境。现在西文数据每月下载量达到2000余条,并利用平台优势对相关字段做规范控制。

近年来,编目事业有了很大的发展,从传统的文献编目转型为资源的描述,RDA对整个机读格式目录进行了重新定义。OCLC作为行业引领者,其平台的RDA数据在近几年也呈井喷式增长。针对这一情况,上图及时调整了编目工作策略,对RDA的推行进行了调研和分析,后于2012年成立RDA工作小组,启动RDA应用推广研究项目,对RDA编目实现方式、RDA编目员培训工作及RDA编目测试阶段的工作进行了探索及研究,为RDA的应用打下了基础。目前,上图对新旧数据编目格式的界定为:对于2014年以前编制的西文数据仍保留AACR2编目格式,2014年以后新编制的英文数据采用RDA编目格式。目前,上图外文文献编目中,英、法、德、西班牙、俄、韩语图书的下载与原编数据均采用RDA格式。现已有少量西文图书原编纪录上传到OCLC WorldCat数据库,由OCLC总部质量控制部门审校,反馈情况良好。

除中文图书和国内出版的西文图书采用RDA编目格式外,上图仍保留境外书目数据业务,以服务国外图书馆文献数据需求。考虑到境外数据的特点,上图将早年以CNMARC编目的图书批量转变为USMARC数据而对于境外数据的编制,参考上图西文图书RDA编目细则,以MARC21为基本格式,以新罗马化拼音为主要编目字符,并通过880连接字段将拼音和汉字字段相连接而构成。依据OCLC互惠互利、共同发展的原则,上图也积极向OCLC World Cat 提供优质境外原编数据,2017全年上传2800余种全字段RDA格式数据,通过贡献知识内容和共享资源共建OCLC数据平台。

3.2 上图西文数据OCLC套录下载工作流程

目前,上图西文数据下载套录工作按以下步骤进行(流程见图2)。(1) 新建一个本地数据目录,并将新下载的数据保存在此目录中。(2) 通过ISBN在OCLC的检索框中进行检索,未检索到的记录可以通过题名、著者等其他途径检索。(3) 对于单条检索结果,如果数据的基本字段完整,则直接套录下载进入数据修改操作。对于多条检索结果,根据数据揭示的载体形态、收藏数据的馆藏数及First Search平台显示的数据质量情况综合选取质量较高的数据进行数据修改。(4) 对选取的下载数据进行修改。由于OCLC数据为全球联盟的数据,成员馆提供的数据质量差异较大。为保证编目质量,保持上图编目特色,编目时需特别注意RDA编目特征字段及USMARC标准格式的修改。套录编目遵循照实著录原则,不受下载记录的影响,逐一与所编文献核对,对不符合之处做出修改,使之符合所编文献的客观状况。同时,根据上图西文数据编目细则要求对RDA特征字段及上图本地化馆藏字段进行标准化。(5) 对会议名、作者名、主题词等内容做好规范控制工作。OCLC重视规范化与标准化的建设,除了提供依据 USMARC 标准数据格式和 RDA 标准著录格式加工并提供书目数据外,还联机提供规范文档,以实现规范控制及数据库质量有效控制。(6) 保存修改内容,进入下一条数据编目。(7) 按批次完成整个目录下载编目,并对目录数据进行本地馆藏化操作。(8) 移交审校人员进行数据审校工作。

3.3 利用First Search WorldCat辅助检索

OCLC First Search Service 是一个通过 Web 访问的, 与Z39. 50协议兼容的联机检索与参考服务系统。目前,First Search 实现了多个数据库的完全整合, 增强了联合编目数据库 WorldCat 的馆藏信息, 实现了各库间的联机全文共享。

上图西文编目工作也通过First Search的WorldCat数据库进行检索。目前查看检索数据的主要目的是判别数据质量。考虑到OCLC-connexion数据库的检索及下载的计费模式,为避免查看多条数据进行数据比较而带来的额外费用,上图编目员均通过First Search平台进行数据查看及选择,特别对于小语种数据的挑选及查看有很大的帮助。借助于First Search平台,上图通过OCLC套录的数据精度更高,套录编目数据更加规范化、标准化。

4 编目工作的思考

4.1 编目工作的困境与发展

一方面,许多高校图书馆和公共图书馆正在减少编目人员编制,采用业务外包的方式,把编目工作整体外包给书商或承包商,但是,外部数据来源五花八门,总体质量不高。特别是外文数据编目工作存在编目人员业务能力差、流动性强,下载渠道乱,编目机制不完善,审校力量不强等问题,严重影响了编目数据的质量。另一方面,作为编目工作一部分的规范数据正越来越被图书馆所重视。此外,国际编目规则正出现重大变化,以资源描述与检索为内容的新标准正在替代原有被大家普遍采用的英美编目条例, RDA的采用会使图书馆界的书目更易被互联网所接纳,使数据所反映的实体与关系层次分明、概念清晰,使系统能更有效地对书目进行发现、关联和开放。

4.2 编目工作应当有一定的投入

目前,许多图书馆的编目数据多为下载套录,数据的成本很低。有些编目馆员认为,编目数据即使下载不到也会等到,不需花力气原编。但编目数据审核与校对是需要时间成本和人力成本的,在目前技术条件下,还不能通过人工智能的方法加以取代,必须逐条输入和校对,因此一条符合要求的原编编目数据制作还需要较高的人力成本。

4.3 编目数据的共建共享问题

OCLC联机计算机图书馆中心是全球最大的联机编目中心,而在我国,CALIS(中国高等教育文献保障系统)、国家图书馆联合编目中心、上海图书馆联合编目中心是我国三大书目数据共享平台。

CALIS和国家图书馆联合编目中心是国家级的书目数据中心,分别拥有巨量的馆藏数据和书目数据,为不同的用户提供服务。上海市文献联合编目中心归属上海文献资源共建共享办公室,由上海图书馆采编中心具体负责运行的区域性文献联合目录中心和文献编目中心。这些重要的文献编目数据共享平台各有特色,但是由于历史原因,平台之间的数据交换、共享不够畅通,成员用户在利用各家资源时投入较多人力进行数据修改。总体来看,各平台均存在共享有余、共建不足的问题,理念和机制也需要进一步改进。

4.4 编目标准、规范、要求须统一

目前,我国的编目标准各不相同,尤其在外文编目MARC标准的采用上,有些图书馆采用CNMARC进行外文文献编目,有些采用MARC21。而在内容标准方面,少数图书馆已完全与国际接轨,外文文献利用RDA工具套件且完全采用RDA规则编目,但大部分图书馆仍然采用混合方式,即保留下载RDA记录的同时,原编仍采用AACR2标准。还有图书馆仍采用AACR2进行数据编制。另外,联编系统之间对数据编制要求也不统一,例如CALIS、国图、上图编制的外文数据都有差异。上述因素使平台间的数据共享与交换难度加大,极大阻碍了我国编目事业的发展。因此,编目标准的制定亟需加以統一。