铁峰+李京
[摘要]国内外大多数高校图书馆使用OPAC系统作为发现和访问电子书的主要机制。图书馆OPAC系统对电子书的整合为编目工作带来了一系列挑战,包括有限的可用的记录、缺乏标准化、添加和删除电子书产生的MARC记录问题、供应商提供的低质量数据。针对这些问题,高校图书馆应在微观层面制定本馆的电子书编目政策,在宏观层面制定电子书元数据标准并建立联盟与电子书供应商谈判以规范电子书市场及书目数据质量。
[关键词]高校图书馆;电子书;图书馆OPAC系统;MARC记录
[中图分类号]G255.75[文献标志码]B[文章编号]1005-6041(2014)04-0001-01
1引言
在信息技术迅猛发展和广泛运用的今天,数字资源已取代纸本资源呈现出不断激增的态势,电子书以其声图并茂、节约空间、出版速度快、便于检索、能弥补纸质图书不足的优势成为高校图书馆馆藏建设的重要组成部分。为进一步提高电子书的利用率,国内外各高校图书馆纷纷采取各种措施以及时、有效地整合、揭示电子书,其中图书馆员和读者都认为图书馆馆藏目录是查找电子书最直接的方法,有研究表明,在 OPAC系统中融入电子书可以提高其使用率达50[WTB2][WTB2]%[WTBZ][WTBZ][1],因此在OPAC系统中加入电子书的信息成为各高校图书馆整合电子书的重要手段。OPAC系统是高校用户普遍熟知并经常使用的馆藏资源检索工具,在OPAC系统中整合电子书符合用户的使用习惯,有效节约用户跨电子书数据库平台检索的时间。但是在整合的实践中,电子书市场存在的种种乱象及MARC数据存在的诸多问题给国内外各校图书馆带来了不小的挑战。
2当前电子书市场乱象
2.1 多个层次的电子书内容整合
虽然图书馆的采访人员已经对“按标题逐本选择电子书”表示了强烈的偏好,但大多数电子书都是通过包库的形式被采购的,这些电子书呈现了广泛的学科领域并代表了特定的出版商。在某些情况下, 这些被打包的电子书的标题被整合、编目得就像一个系列的图书。在其他情况下,一本图书被进一步分解成各个章节,并被单独编目。原本不是多卷书的图书却通过增添编号或符号对书名进行差异标识来制造貌似多卷书的效果,这种方法导致ISBN、作者和出版社相同, 但书名不完全相同。例如: 一本书先按上下册分, 再按1、2、3册分, 数量就变为5本[2]。这种多层次的整合意味着图书馆用户在检索时可能会发现并获取图书的一个章节、一本电子书或者一个电子书系列。例如,SpringerBriefs在线出版项目至少分为五个层次的整合:系列图书、子系列图书、子子系列图书、专题论文标题和章节。图书馆可能获得任何一个或多个层次的内容。这种多个层次的电子书内容整合导致的结果是图书馆员甚至供应商有时很难确定不同层面的整合之间的关系。
2.2 电子书ISBN号的非标准化分配
电子书的ISBN号(国际标准书号)向将ISBN号作为独一无二的标识符提出了挑战。对于纸本书而言,每个版本(精装或平装)都被出版商分配唯一的ISBN号。这使得每个版本之间的差别很容易被理解。但是对于电子书而言,ISBN号就不那么管用了,因为不同版本电子书之间的区别并不总是那么明确。此外,电子书的ISBN号既可以由拥有图书内容的出版商所分配,又可以由打包并营销电子书给图书馆的供应商所分配。在某些情况下,出版商给一个数字著作分配一个ISBN号,随后这本著作被分发给几个具有专有平台的供应商。每个供应商可能为这本著作添加特定格式或功能,但每个版本都保留了由出版商分配的ISBN号。在其他情况下,如果由供应商分配ISBN号,那么出版商就会拒绝注册ISBN号。这可能反映了一个事实,就是注册ISBN号需要付款。正如Dillon指出:“许多较小的出版商不愿意购买成批的ISBN号去分配给每一本电子书的每个格式。”[3]此外,一些出版商给多本电子书重复使用相同的ISBN号,使得它们既无用又存在潜在的误导。而在由供应商分配ISBN号的情况下,有些供应商会添加自己的ISBN号,而其他供应商则趋向于在不分配ISBN号的情况下发布他们的电子书。
3图书馆OPAC系统整合电子书存在的问题[HT]
3.1 同一著作具有多个版本的问题
是否为一本书的纸质版和电子版创建各自的MARC记录是每个图书馆的编目人员都需要面对的问题。有些图书馆认为纸质版和电子版是两种完全不同的著作——格式上的差异必然导致内容和表现形式的不同。例如,北京大学图书馆就将一本著作(秦建宁编著的《图书馆现代技术应用教程》 )的电子版和纸质版视为不同的著作。两者之间没有建立任何关联。当查看纸本图书时, 读者可以看到其基本著录信息以及馆藏地点等。当查看电子书时, 读者也可看到其基本著录信息, 不同的是显示其计算机文件特征电子图书[4]。有些图书馆则只是简单地添加了电子书的链接到纸本书的记录上。例如中国人民大学图书馆馆藏目录检索系统就是将一本书的纸质版和电子版作为一条记录显示,点击“全部细节”可看到其馆藏地点等基本信息, 同时提供了电子版的超链接[4]。还有一个需要注意的问题是是否需要为不同电子书数据库中的同一本电子书提供单独的记录。多数高校图书馆基于电子书数据量大,批量加载供应商提供的记录比较便捷的考虑使用单独的记录,但也有些高校图书馆采用为一本著作的所有数字化版本提供一条纪录的方式。
[HTK]3.2 包库电子书中添加或删除电子书产生的问题
由于供应商很少授予图书馆对包库电子书的控制权,所以当供应商常规性地添加和删除单本电子书时,会导致图书馆手足无措。尤其是许多供应商在添加和删除单本电子书时并没有及时通知图书馆。许多供应商似乎没有意识到当添加或删除电子书时需要更新馆藏目录。休斯顿大学图书馆员在购买包库电子书之前从没遇到过电子书编目方面的问题。针对每一个聚合包,图书馆工作人员根据供应商每月的更改列表手动更新目录。然而,他们很快就意识到, 如果图书馆大量订阅这样的包库电子书,他们的工作将是非常繁重的[5]。高校图书馆通常订阅几个电子书库,这种变化对编目人员的工作量产生了巨大影响。尽管很多高校图书馆都对他们拥有的电子书做出越来越多的调整去适应他们的供应商所提供的不定期的信息,但许多大型高校图书馆的馆员都认为删除并重新加载整库电子书记录比逐条添加或删除记录更容易。
3.3 供应商MARC记录存在的问题
在高校图书馆馆藏目录中超过70[WTB2][WTB2]%[WTBZ][WTBZ]的电子书MARC记录由供应商提供,并且大多数主要供应商提供的随书MARC记录都是免费的。随着时间的推移,越来越多的供应商提供记录。2006年,12家较大规模的电子书整合商中,有7家为订阅图书馆提供MARC数据[6]。2009年,六大电子书整合商中,除了一家以外其余都提供记录[7]。使用供应商所提供的记录可以使编目工作变得更加高效。然而,不幸的是,供应商提供的MARC记录并不总是使用简便。
3.3.1 供应商MARC记录的有限提供问题。
在许多情况下, 供应商可供的记录仅限于当下的一些图书但不包括一些年代久远的图书的记录。在描述Springer电子书供应商提供的MARC记录时, Martin和 Mundle指出供应商不能提供2005年之前出版的大部分电子书书目记录[8]。在某些情况下, 一些书目记录可以被某些出版商提供而有些出版商却不能。这一问题极大地削弱了OPAC系统作为一站式发现与获取机制的优势。还有一个需要引起关注的问题就是已购电子书与其MARC记录获取之间的时间延迟。在某些情况下,电子书在MARC记录未被提供之前就可以访问。在其他情况下, 在电子书可供使用之前MARC记录就已经出现在图书馆的馆藏目录中。
3.3.2 供应商MARC记录的低质量问题。
供应商提供的MARC记录质量是编目工作首要考虑的问题。相当多的编目人员指出,供应商提供的MARC记录比其他途径获得的记录更容易出错。奥克兰大学图书馆的工作人员指出,供应商提供的记录中所存在的错误是多种多样且频繁的[9]。 同样地, 由于其低质量,许多OhioLINK成员选择不使用供应商提供的记录[10]。总的来说, 在供应商的记录被认为是可以接受的之前,编目人员某种程度的干预还是有必要的。尽管低质量记录是许多电子书供应商的共性问题, 但是对高校图书馆编目人员来说更大的挑战是图书馆所购买的每个包库电子书的MARC记录质量、格式及其功能各不相同,供应商之间的编目标准也有显著的不同。Martin和Mundle已经确定了三种与供应商提供的MARC记录相关的问题:访问问题、加载问题、记录质量问题。访问问题阻止用户访问电子书,加载问题阻止记录被加载到馆藏目录中,记录质量问题妨碍用户查找馆藏目录中的电子书并呈现令人困惑的信息 [8]。不正确的URL和URL的缺失是最主要的访问问题。同样,许多供应商提供的URL指引用户访问在线资源的主页而不是MARC记录所代表的电子书,从而为搜索过程添加了不必要的一步。加载问题包括关键字段的遗漏、字段的格式错误、OPAC系统不支持所提供的字段格式、不兼容的编码方案的使用。记录质量问题,例如标点符号不合理,可能会导致严重的访问和加载问题。许多问题可以归因于这样一个事实——供应商有时提供纸质版本的MARC记录而不修改这些MARC记录以反映在线格式的独特特征。一些供应商甚至不改变纸本书特有的ISBN号。这将为书目数据的自动匹配制造巨大的难题。在试图改善供应商所提供的MARC记录存在的问题后,多数图书馆已经放弃使用供应商提供的记录。休斯顿大学图书馆工作人员已经升级了供应商提供的记录,但管理不同的供应商提供的记录的难度使他们考虑其他来源[5]。
3.3.3 使用其他来源MARC记录的问题。
尽管大多数高校图书馆使用供应商的MARC记录编目电子书,但是约30[WTB2][WTB2]%[WTBZ][WTBZ]的图书馆不使用供应商记录[11]。国外许多高校图书馆从第三方MARC数据供应商获取编目记录,如EBSCO、Ex Libris, Innovative Interfaces,Serials Solutions和 TDNe。Kemp提供了有关MARC记录重复、不完整、不准确、过时的明确证据。超过60[WTB2][WTB2]%[WTBZ][WTBZ]的受访者表示在使用记录之前,他们必须作出重大修改[12]。一些编目员已经放弃了批量加载。取而代之的是,当从第三方下载个别记录时,他们使用各种形式的自动化。例如,eCataloguer等工具让图书馆员工通过ISBN匹配过程获得MARC记录[13]。 俄勒冈州立大学图书馆使用成员馆提供的记录解决了他们采购的75[WTB2][WTB2]%[WTBZ][WTBZ]的Kindle电子书的记录问题。编目Kindle电子书最大的挑战与其说是编目规则的应用,不如说是必要的书目数据的查找。这一问题使得编目低效、非常耗时,因为编目人员在得出数据不存在的结论之前必须查找好几个地方[14]。
4结论与对策
对于大多数高校图书馆来说,图书馆OPAC系统是电子书的主要发现与获取机制。乍一看,供应商提供的MARC记录似乎为图书馆提供了一个更好的选择。研究证明, 供应商提供的记录经常需要大量的改进才可以使用。最严重的问题包括:1)许多电子书MARC记录的不可获得性;2)每本电子书的各种版本的编目记录的不一致性;3)特定于出版商、集成商或供应商的MARC字段的涵盖;4)由出版商和电子书供应商不正确或重复的ISBN号分配;5)难以控制的包库电子书中电子书的添加或删除导致的MARC记录问题;6)在MARC记录中存在错误导致用户不能访问电子书;7)存在加载错误导致不能下载MARC记录到本地馆藏目录系统;8)存在错误导致用户很难识别满足他们需求的电子书。使用MARC记录的高校图书馆面临一个选择:是考虑准确性和完整性还是考虑成本效益。有些图书馆可能会倾向于使用高质量的记录。相反,其他图书馆则认为,“通过最低级别的MARC记录访问胜于不能访问”[15]。虽然基于准确性和完整性的标准必须满足每个图书馆特定的需求,不同来源的MARC记录质量的变化可能会增加馆际合作间共享和使用元数据的难度。
要解决高校图书馆OPAC系统整合电子书遇到的重重问题,使电子书在高校教学环境中发挥作用,促进电子书在高校图书馆系统及服务中被发现与获取,元数据、编目规则及MARC格式等都为电子书的揭示、组织提供了不同途径的解决思路和方法。各高校图书馆甚至图书馆联盟必须建立电子书编目政策及操作流程规范,以保证来自于不同电子书提供商的记录的统一性,方便用户有效获取电子书资源。清华大学图书馆在分析各电子书供应商提供的数据质量基础上结合本馆自身情况制订了电子书编目政策,包括编目规范、编目流程、各供应商数据修改规范等。对于供应商书目记录存在的共性问题,图书馆与软件公司合作开发批处理软件以加快数据处理速度;对于无法实现批处理技术的书目记录,则需要编目人员逐一修改,将检索点信息、遗漏字段补充完整以保证数据质量、满足读者的检索需求、提高检索的准确性[16]。温莎大学Leddy图书馆在电子书编目、加工及管理工作的实践中也制定了一些政策以协助用户使用图书馆的电子书馆藏,在使用用于纸本书的字段的基础上,一些特殊字段被添加以反映电子书的特性,比如一些搜索字段099(在线)、710(平台或出版商的名字)、538(系统细节)、856(电子定位和访问。在了解其他图书馆电子书编目实践的基础上,温莎大学Leddy图书馆也对记录导入的操作流程做了详细规定[5]。此外高校图书馆应联合起来以联盟的形式与各电子书供应商沟通、谈判,对MARC数据的标准化问题提出意见和建议,以从源头上提高MARC数据质量,并进一步规范电子书市场。
电子书元数据的基本功能包括帮助用户发现、识别、选择、获取和使用电子书。目前国际和国外先进的电子书元数据标准大多是针对不同需求而制定,如国际电工委员会(IEC)制定的电子书系列标准(IEC62448-2009,IEC 62524-2009 IEC_TS 62229-2006),国际数字出版论坛(IDPF) 所制定的电子书系列标准(EPUBI-13)、美国书业研究会发布的ONIX 标准等,这些标准并存互补,但也具有重复制定、相互交叉的问题,这也充分体现了电子书元数据标准化领域的竞争局面。其中美国出版商协会在ONIX 标准基础上所做的完善颇具新意和实用价值。美国出版商协会在ONIX 标准元数据的基础上增加了元数据项,形成了电子书独特的元数据标准,用于对电子书的网络销售。他们将电子书的元数据标准分为3种,分别是查询元数据、核心元数据和专有元数据。其中查询元数据主要是用于帮助用户查找所需图书;核心元数据主要是帮助用户了解图书内容;专有元数据主要用于电子书的买卖,主要包含电子书的格式信息、版权信息等,其中的查询元数据和核心元数据非常值得借鉴。由于以电子书为代表的数字资源存在多样性与复杂性的特点,因此在图书馆数字化建设工作中仍需加强对数字资源元数据应用规范体系的研究。
[JZ][参考文献][HT5”K]
[1] Croft, R., Davis, C. E-books revisited: Surveying student e-book usage in a distributed learning academic library 6 years later [J]. Journal of Library Administration, 2010 (5–6): 543—569.
[2] 吴云珊. 高校图书馆国内电子书采购风险与对策[J]. 图书馆论坛,2011(01):91—94.
[3] Dillon, D. E-books pose major challenge for publishers, libraries[J]. Library and book trade almanac, 2011.
[4] 龙旭梅,王颖,刘鹏年,张建平. 从OPAC看各馆电子图书揭示管理[J]. 中华医学图书情报志,2011(01):45—47,51.
[5] Wu, A., Mitchell, A. M. Mass management of e-book catalog records: Approaches,challenges, and solutions[J]. Library Resources & Technical Services, 2010(3),164—174.
[6] Silberer, Z., Bass, D. Battle for eBook mindshare: It's all about the rights[J]. IFLA Journal, 2007(1):23—31.
[7] Vasileiou, M., Hartley, R., Rowley, J. An overview of the e-book marketplace[J].Online Information Review, 2009 (1):173—192.
[8] Martin, K. E., Mundle, K. Cataloging e-books and vendor records: A case study at the University of Illinois at Chicago[J]. Library Resources & Technical Services, 2010(4):227—237.
[9] Min?i?-Obradovi?, K. E-books in academic libraries[M]., England: Oxford Press,2011.
[10] Preston, C. A. Cooperative e-book cataloging in the OhioLINK library consortium[J].Cataloging & Classification Quarterly, 2011(4):257—276.
[11] Primary Research Group. Library use of ebooks (2011 ed.)[R]. New York, NY: Primary Research Group.
[12] Kemp, R.. MARC record services: A comparative study of library practices and perceptions[J]. The Serials Librarian, 2008(3): 379—410.
[13] Rao, K. N., Moorthy, A. L. e Cataloguer: An automatic tool for developing bibliographic database using MARCXML records[J]. DESIDOC Journal of Library & Information Technology, 2010(2):101—108.
[14] Sapon-White, R. E. Kindles and Kindle e-books in an academic library: Catalogingand workflow challenges. Library Resources & Technical Services, 2012(1): 45—52.
[15] Beall, J. Free books: Loading brief MARC records for open-access books in an academic library catalog. Cataloging & Classification Quarterly, 2009(5):452—463.
[16] 贾延霞,杨慧. 利用数据库商提供的电子资源MARC数据的策略[J]. 图书馆建设,2012,08:25—27.
[收稿日期][HT5”K]2014-05-04
[作者简介][HT5”K]李京(1981—),女,哈尔滨商业大学图书馆馆员,硕士。
[说明][HT5”K] 本文系黑龙江省高校图工委科研项目“泛在知识环境下高校图书馆电子书的发现与获取相关问题研究”研究成果之一(项目编号:2013-B-055)。