刘 华 (中国科学技术信息研究所 北京 100038)
书目数据是计算机可识别和可处理的揭示馆藏文献资源的信息。联合目录数据库汇集了多个图书馆和信息机构的书目数据,其完善程度及其书目数据的质量都直接影响着图书馆信息资源的交流与共享,因此,联合目录数据库的数据质量控制成为编目界关注的热点。OCLC(Online Computer Library Center,联机计算机图书馆中心)拥有着世界上最大的联合编目数据库——WorldCat。考虑到世界上9 031个图书馆都依赖于其书目数据,OCLC非常重视WorldCat的质量控制,并采取了一系列举措。本文拟对OCLC的书目数据质量控制举措进行剖析,并对我国联机联合编目系统的质量控制提出一些改进建议。
1.1.1 广泛应用各种现有的标准或规范
WorldCat中的书目数据来自于世界各地众多的成员馆。为了使这些书目数据能够在格式或著录规则上一致,OCLC所采取的首要措施是广泛实施各种标准和规范。这些标准和规范的采用呈现出一定的层次性:首先,采用相关国际标准;其次,采用各国已有的规范;再次,针对上述规范中所未涉及到的内容制订相应的规范。《书目格式与标准》[1]中详细地指明了应采用的标准和规范以及国际和各国标准与规范中未涉及的内容,目前已出版第4版,并在不断更新中,最近一次更新时间是2010年2月。现有标准和规范的广泛采用最大限度地保证了数据的兼容性(见下页表1)。
1.1.2 实施OCLC质量计划
OCLC的质量计划主要是为了鼓励其所有的成员馆参与WorldCat书目数据的监督和修正,对数据进行补充、修正和去重而制定并实施的。这些质量计划能够确保WorldCat数据的完整性和准确性,包括:
(1)WorldCat修改申请(WorldCat Change Requests)这一计划允许所有编目成员馆提出修改申请表格、指出WorldCat书目数据或规范文档中需要修改的错误。也就是说,所有的编目成员馆都拥有监督WorldCat数据的权利,这使书目数据处于最广泛的监督中。
(2)最低级别升级(Minimal Level Upgrades) 这一计划鼓励所有编目成员馆对WorldCat中未达到完全级的主记录进行内容添加或修改,以使书目数据更为完整。为了保障所添加或修改的数据的准确性,OCLC赋予所有编目成员馆的添加或修改权利是有限的,其可添加或修改的字段仅限于系统中默认的可编辑字段。
表1 WorldCat书目数据用到的标准或规范
(3)数据库补充(Database Enrichment) 这一计划是指所有编目成员馆都可以对WorldCat中的主记录进行补充,以提升主记录的质量。可以补充的内容包括:记录中的索书号和主题标目,006字段(附件特征)和007字段(载体形态),505字段(附注),在版编目数据中的300字段(载体形态项)。
(4)升级在版编目数据(Cataloging-in-publication Upgrading)[2]这一计划是指特定的成员馆可以对在版编目数据进行补充、编辑或修改。CIP(Cataloging in Publication,在版编目数据)数据是由美国国会图书馆和其他国家或地区的国家编目机构在出版物出版之前创建的书目数据。由于出版物在出版之前许多数据尚未确定,或者出版之后发生了改变,导致在版编目数据的完整性和准确性有所欠缺,因此,所有CIP数据都需要进行升级,以确保其准确性和完整性。1995年,OCLC提出CIP升级计划,制订了简要的项目规范,列出了CIP升级所需要修改的USMARC字段及其子字段以及有资格升级的成员馆。该计划允许任何具有完全级或更高授权的编目成员馆添加300字段数据;允许OCLC的高级参与者编辑整个CIP记录;允许国家级高级授权的成员馆将CIP升级为主记录,并使之成为一个完全级的书目记录。
(5)OCLC高级参与者计划(OCLC Enhance Participants)[3]OCLC高级参与者实际上是一种认证机制,经过OCLC的许可,他们可以锁定、编辑和替换WorldCat中的书目记录。高级参与者分为两类:①普通高级参与者,他们可以替换绝大多数由成员馆输入的记录;②国家级高级参与者,他们主要是从美国国会图书馆选出的编目人员或合作编目项目的参加者,拥有更大的权限,可以替换大多数的国家级记录。考虑到高级参与者所拥有的权限,OCLC制订了严格的评估和培训机制,以确保这一计划的顺利进行[4]。
(6)专家社区计划(Expert Community)[5]专家社区计划源自于“专家社区计划实验”,该实验于2009年2-8月进行,主要是赋予具有完全级编目授权的成员馆更大的修改权限和范围,以改进和升级WorldCat主记录。由于该实验进行得很成功,因此OCLC保留了这一实验的所有功能,并将之作为专家社区计划的一部分。被纳入专家社区的成员馆有权实时修改记录,有权修改完全级书目记录,有权修改更多主记录的字段,有权将书目数据升级为主记录。专家社区计划实际上是将WorldCat的记录维护工作更多地分配给成员馆,使这部分工作能够有更多的技术力量支撑。任何拥有完全级编目授权的成员馆都可以申请加入该计划。
1.1.3 参与非OCLC质量计划
非OCLC质量计划实际上是OCLC以合作的方式吸收其他合作机构的高质量数据,并将其补充到WorldCat中,间接地提高其书目数据质量的做法。目前,这一类非OCLC质量计划包括合作编目计划以及合作联机连续出版物和美国报纸计划。
(1)合作编目计划(Program for Cooperative Cataloging,简称PCC)[6]PCC计划主要是基于图书馆之间互相认可的标准,提供有用、及时和经济的编目数据,以满足读者对图书馆馆藏检索日益增长的需求。该计划由美国国会图书馆和PCC计划的参与者共同协调,旨在增加高质量的数据数量、增加负责国家级记录的编目员和编目机构的数量、制订和维护互相认可的数据标准。PCC的书目记录可以直接提供给WorldCat,也可以通过OCLC规范文档间接提供给WorldCat。
(2)合作联机连续出版物(Cooperative Online Serials,简称CONSER)[7]CONSER计划是一个联合在线连续出版物编目项目,是连续出版物的高质量书目数据源。这一项目还出版关于连续出版物编目的文献和培训材料,并发布有关连续出版物的标准。CONSER数据库嵌在OCLC联合目录中,其成员馆在OCLC上输入、验证和修改连续出版物的编目数据,或者通过FTP(File Transfer Protocol,文件传输协议)将原始记录上传至OCLC联合目录,并为连续出版物的目录记录提供日常维护。
(3)美国报纸计划(U.S. Newspaper Program,简称USNP)[8]USNP是美国联邦政府和各州之间的合作项目,主要是对18世纪至今在美国出版的报纸进行定位、编目并以缩微胶片的方式进行保存。该项目由美国国家人文基金会提供赞助,由美国国会图书馆提供技术支持。USNP的数据库收录了自1690年以来在北美出版的300 000多种报纸,不仅提供书目数据和馆藏位置信息,而且还致力于保存重要的、濒临消失的馆藏。OCLC加入该计划后,WorldCat中报纸记录的数量和质量均有大幅度的增加和提高。
1.2.1 多层次标准的实施确保其数据更具兼容性
著录规则和标准是保证书目数据质量的基础。为了确保书目数据的准确性,也为了提高其兼容性,OCLC实施了多层次标准:①采用广泛接受的国际标准或国际上通用的标准,如DC(Dublin Core,都柏林元数据),AACR2;②在特定的编目实践中,参考使用各个国家或地区的相关标准,如美国音乐图书馆协会的《乐谱编目公告》;③与其他质量计划合作,开发相互认可的标准;④针对自身数据加工的特殊性,制订相应的细则。
1.2.2 开展最广泛的合作
OCLC不仅注重与各成员馆之间的纵向合作,也积极参加外界的各种质量计划,加强与OCLC以外的机构的合作。例如,CONSER 计划的成员馆包括:美国国会图书馆和加拿大国家图书馆;选定的大学、政府、研究机构、特殊机构和公共图书馆;选定的图书馆协会;订阅代理机构和制作摘要与索引的服务部门等。通过加入CONSER计划,OCLC可以合作的机构不再局限于图书馆领域,还涵盖了众多的其他类型机构。这种广泛的合作也为保障OCLC的书目数据质量奠定了坚实的基础,一方面,OCLC可以直接将这些机构高质量的书目数据纳入WorldCat;另一方面,OCLC可以借助这些机构中的编目人员加强对WorldCat的更新维护。
1.2.3 实行“全员监督、分级更新维护”的原则
WorldCat是由OCLC众多成员馆共同建设的。因此,OCLC也鼓励所有的编目成员馆都参与到WorldCat的监督与更新维护中,可归纳为“全员监督、分级更新维护”的原则。所有的编目成员馆在发现书目数据的错误时都可以向OCLC提出修改记录的申请,可以在有限的字段内对WorldCat中的记录进行补充,但更进一步的更新维护则取决于编目成员馆的级别。OCLC建立一定的评估机制,授权给不同水平的编目机构,让他们对书目数据进行不同程度的更新维护。“全员监督”可以确保WorldCat处于更严密的监督机制之下,也使各成员馆更具“归属感”,有“当家作主”的感觉;“分级更新维护”则能确保对WorldCat记录修改的准确性。
受OCLC的启示,我国于20世纪90年代开始开展联机联合编目领域的探索。经过十多年的发展,我国已经形成不少联机联合编目系统,如全国图书馆联合编目中心(Online Library Cataloging Center,简称OLCC)、CALIS联机合作编目中心(CALIS Union Catalog Center,简称CUCC)、中国科学院联机联合编目系统(Union Catalogue of Chinese Academic Library & Information System,简称UNICAT)、上海市文献联合编目中心(Shanghai Information Union Catalog Center,简称SIUCC)和地方版文献联合采编协作网(China Regional Library Network,简称CRLNet)等。这些系统都有着各自的质量控制举措,以保障自身书目数据的质量(见表2)。
表2 我国主要的联机联合编目系统的质量控制举措一览表
与OCLC相比,我国联机联合编目系统在质量控制方面有以下特点:
2.2.1 应用的标准和规范各异
我国各大联机联合编目系统都基本遵循《中国文献编目规则》、《中国机读目录格式》等基本标准,但是这些国家标准并不足以解决编目过程中的所有细节问题,再加上出版物本身的复杂性,各大系统都制定了自己的标准,以致应用的标准和规范不一致。标准和规范的不一致一方面会给用户带来不便,因为用户在从不同系统下载数据时会面临数据不兼容的问题;另一方面,会阻碍我国联机联合编目事业的进一步发展,因为随着信息技术的飞速发展,我国各大联机联合编目系统势必会汇聚在一起,数据之间不能兼容将会阻碍这一进程。
2.2.2 侧重于自身数据质量的提高
我国几大联机联合编目系统都侧重于如何提高自身的数据质量,并且在质量控制方面,大都采取措施保证自身加工信息的完整性和准确性,但不考虑共享其他系统高质量的数据以间接地提升自身的数据质量。这是我国联机联合编目系统与OCLC最大的差异。
2.2.3 侧重于数据加工的质量控制
我国联机联合编目系统的质量控制主要包括两个方面的内容:制订相关的标准和进行编目员资格认证。前者能够确保数据加工人员加工数据时有据可依,后者则能够确保数据加工人员的素质。然而,我国联机联合编目系统大多缺乏对上传后数据的监督机制与更新维护机制。虽然其中有些系统设立了严格的审查小组,但人少数据量大的现实使得这种审查不能及时发现问题并及时更新。
为了实现最大范围的数据兼容,建议我国各大联机联合编目系统:(1)采用国际标准或国家标准进行数据加工。(2)合作开发统一的加工规范,在国际标准或国家标准不能适应数据加工需求时, 各系统之间应进行横向合作,合作开发相对统一的规范,以规范编目中的细节问题、规范标准中的非标准因素,从而使各方数据能够互相兼容,为成员馆利用不同系统的数据提供便利。
各联机联合编目系统都汇集了多个成员单位的数据,但我国联机联合编目系统大多只设立专门的审查小组对数据进行审核,这对于数量庞大的数据来说是远远不够的。因此,建议采取一定的措施,鼓励各成员馆或具体用户在发现问题数据时及时上报;开辟多条途径,为成员馆上报错误数据提供便利,如OLCC就为此设有专门的QQ群和编目论坛。
提高书目数据的质量,除了加强对上传数据的审查以外,还应该强化书目数据更新与维护的机制。建议我国联机联合编目系统借鉴OCLC的分级更新维护机制,针对不同编目水平的编目员、图书馆进行不同级别的授权,赋予他们对书目记录中的特定字段进行更新和维护的权利。这样一来,编目员对于书目数据中存在的某些问题可以在自己的权限内及时处理,无须上报联编中心,从而减少数据在审查过程中反复上传的程序,间接加快数据上传的速度,在保障书目质量的同时提高数据加工与审查的速度。
[1] Bibliographic Formats and Standards[EB/OL]. [2010-05-13]. http://www.oclc.org/bibformats/default.htm.
[2]Upgrading of Cataloging-In-Publication (CIP) Records[EB/OL].[2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/cip/default.htm.
[3]OCLC Enhance Participants[EB/OL]. [2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/enhance/#enhance.
[4]Enhance Evaluation Procedure[EB/OL]. [2010-05-13]. http://www.oclc.org/asiapacific/zhtw/support/documentation/worldcat/records/enhanceevaluation/default.htm.
[5]Expert Community[EB/OL]. [2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/expert/.
[6]Program for Cooperative Cataloging[EB/OL]. [2010-05-13]. http://www.loc.gov/catdir/pcc/.
[7]Cooperative Online Serials[EB/OL]. [2010-05-13]. http://www.loc.gov/acq/conser/.
[8]U.S. Newspaper Program[EB/OL]. [2010-05-13]. http://www.neh.gov/projects/usnp.html.
[9]全国图书馆联合编目中心[EB/OL]. [2010-05-13]. http://olcc.nlc.gov.cn/about-zxzc2.html.
[10]全国图书馆联合编目中心2009 年工作会议资料[EB/OL]. [2010-05-13]. http://olcc.nlc.gov.cn/attendent/09年会/资料汇编2.pdf.
[11]CALIS联机合作编目中心[EB/OL]. [2010-05-13]. http://www.calis.edu.cn/CALIS/lhml/index.asp.
[12]中国科学院联合目录集成服务系统[EB/OL]. [2010-05-13]. http://union.csdl.ac.cn/index.jsp.
[13]上海市文献联合编目中心[EB/OL]. [2010-05-13]. http://catalog.library.sh.cn/.
[14]地方版文献联合采编协作网[EB/OL]. [2010-05-13]. http://www.crlnet.org/.