刘桂娥
(辽宁师范大学图书馆,辽宁 大连 116029)
图书编目数据源,顾名思义,是指图书编目数据的来源。图书编目原始数据来源于图书的著录信息源和规定信息源,我们把这种最原始的数据来源称为“原始数据源”或“一次数据源”。本地数据或外部数据经过套录、修改最终成为馆藏书目数据,我们把这种再利用的数据称为“二次数据源”。数据源的选取和应用直接关系着编目工作的效率和编目数据的规范化程度。LIBSYS中文全称为汇文文献信息服务系统,简称汇文系统,在图书馆界已经广泛应用,目前版本为LIBSYS 5.0,各种数据源在该编目系统下有着不同的检索与应用技巧。
原始数据形成的过程就是原始编目的过程。ISBD和GB3792规定了普通图书的八个著录项目,即题名与责任说明项、版本项、文献特殊细节项、出版发行项、载体形态项、丛编项、附注项、标准编码与获得方式项[1]。以《中国机读目录格式》为准则,每种图书都会形成一条完整的MARK数据,因而著录项目的来源也就是MARK数据的来源。著录项目的来源称为著录信息源,著录信息源分为主要信息源和规定信息源。普通图书的主要信息源为题名页,规定信息源根据不同著录项目主要包含题名页或代题名页、版权页甚至整部图书及附件[2]。
在LIBSYS 5.0编目系统中原始编目途径有两种:
(1)直接利用财产号调出数据,即验收数据(本馆验收人员直接依据图书验收而来)。
(2)利用模板新建记录。具体操作如下:点击模板参数—书目MARK—中文图书,建立一条空白MARK。MARK里面的具体字段通过系统选项中简单编目字段设置来完成。这两种途径在著录内容方面,验收数据ISBN号、题名与责任说明项、出版发行项以及载体形态项著录较全,而主题、分类号、责任者、丛编附注项一般著录不够全面;空白MARK数据在字段设置上更趋全面,但字段内容需要自行输入来完成。编目人员要严格遵照MARK格式的要求,增加缺失的字段,修改不准确字段来生成一条完整准确的MARK记录。
本地数据源即经过本馆编目人员审核并带有本馆排架号及馆藏信息的在馆书目数据。在相似数据套录时离不开本地数据源的运用,即检索出本地数据库中完整的相似数据,利用复制粘贴功能覆盖在待编新数据上,覆盖之前可以保留待编数据中有用的MARK字段。在图书编目的过程中,数据合并同样不可避免,数据合并就是将两条或多条数据合并成为一条完整的MARK数据,如果其中一条数据为本地数据,那就必须将新数据合并到本地数据中。数据合并情况主要分为以下两种情况。
(1)旧种合并。查重是编目工作的一项重要环节,在订购过程中旧种查重不够精准,导致旧种产生。目前图书出版的不规范,同一种书内容相同、版次相同,出版年、ISBN号或者页数进行更改后重新印刷,编目时往往按照旧种处理。
(2)集中著录。同一套书到馆时间不同,采取先到先著录原则,后到馆的同套图书著录时,采用集中著录原则。
在汇文编目系统中数据状态由低级到高级为待编、已编、审校。必须在浏览状态下通过拖动蓝色拖拉条来实现数据的合并[3],并遵照同级之间或者从低级向高级合并的原则。
图书馆业务外包逐渐兴起,外包形式由半包逐渐到全包,服务项目从磁条、财产号、馆藏章的加工扩展到带有馆藏索书号数据的提供,从而实现了图书到馆直接入库阅览。由于书商经济利益的考虑,所聘编目人员经过简单培训上岗,提供的数据虽然比在版编目数据有了一定的提高,但对于专业的图书馆编目人员来说在MARK数据细节上还需进一步加强。
由于汇文系统在订购、验收、编目数据方面一体化,编目直接调出数据为验收数据,源头为订购数据,即出版商提供的简单数据。书商在接受订单后经过一段时间的数据加工最后提供给图书馆完整数据。书商数据到馆后转存到汇文系统中转站中,利用MARK套录检索功能检索出满足条件的数据往往会出现多条,这些数据中包含了一条甚至几条不完整的订购数据,编目人员要逐条排查才能检索到所需完整数据。如果汇文系统能够通过功能设置实现输入财产号直接调出所提供的完整书商数据,那么将省略逐一查找步骤,大大提高编目人员的编目效率。
图书在版编目简称CIP,是“文献出版过程中,利用清样进行编目”[4],我国从1999年4月1日起全国以强制性标准统一实施图书在版编目。由于每本图书版权页上都印有在版编目数据,为免费的资源共享提供了便利条件。在版编目作为原始编目的重要参考,降低了重复性劳动,提高了工作效率,在一定程度上使数据更趋于规范化。但是这种数据主要由出版社提供,因而其规范化程度与专业的图书编目工作人员所提供数据相比还有待进一步加强,主要表现在主题词、分类号不够精准,这就决定了CIP数据源在现在的编目工作中只能作为一种辅助的参考依据。
OPAC即联机公共目录查询系统。随着图书馆自动化的发展,OPAC的应用在各个图书馆已经普及。编目人员可以通过浏览器或者终端方式来访问其他图书馆的OPAC,由于网页方式打开不受限制,所以可以进行多条数据的横向比较。对于一些先进的OPAC系统,还可以通过直接下载的方式来获取免费的MARK数据。在汇文编目系统中,当数据源不支持Z39.50查询或者数据源的Z39.50查询不支持UNICODE编码的时候,汇文系统提供内嵌Internet Browser,提供LOC网页MARK粘贴功能,通过浏览器访问其他图书馆的OPAC。例如我馆汇文系统下Z39.50不支持国家图书馆书目数据,在编目系统中运用 Internet Browser,输入 http://opac.nlc.gov.cn/进入国家图书馆联机公共目录查询系统,检索到所需数据,再利用LOC网页MARK粘贴功能直接覆盖到本馆数据中。
随着计算机编目的普及,各个图书馆都建成了各自的机读书目数据库。为实现馆藏资源的共享,联机联合目录在网络技术的支持下应运而生。各个图书馆根据自身特点选择加入不同的联机联合编目中心,成为其中的不同级别的会员,分享数据的同时也履行着各自的职责。在数据的上载与下载中,为了解决不同的集成系统带来的差异,就必须有一个标准协议来实现,Z39.50解决了这一问题。目前在国际市场上占有率较高的图书馆集成管理系统,基本上支持Z39.50源端(客户端)和目标端(服务器)的应用[4]。LIBSYS 5.0在高等院校的联机联合编目中,中文图书数据主要支持CALIS数据源的获取。在具体应用中,通过系统设置—Z39.50设置—CALIS—cn-cat—添加最爱—修改站点(域名、端口、用户名、口令设置),生成新的功能键按钮,点击后直接进入Z39.50检索页面,选择检索条件抓取CALIS数据。此数据必须经过下载后方可使用,因此下载状况直接影响着CALIS数据的使用。LIBSYS系统支持CALIS成员馆的上载功能,具有CALIS上载资质的编目人员通过上载把本地数据源补充到CALIS数据中去[5],实现CALIS数据的不断完善。
汇文编目系统对数据源的检索主要有以下几种:
(1)MARK检索:检索对象为本地数据源,包括数据状态为订购、在编以及审校的所有满足条件的数据。
(2)MARK查重检索。匹配方式默认为前方匹配,检索对象与Mark检索相同,检索条件包含题名、责任者、主题词、ISBN、丛编五项,选中相应选项后该数据对应内容自动出现。
(3)MARK套路检索。检索对象为书商数据源,检索条件相对应内容同样自动生成,无需编目人员再次输入。
(4)Z39.50关联检索。检索条件默认为前方匹配,检索对象为书商数据源和其站点所支持的联机联合编目数据源。
(5)Z39.50检索。检索对象涵盖了本地数据源、书商数据源、站点支持的联机联合编目数据源。对MARK记录的查重、参考与下载只需一次检索即可完成。
在现代化的编目工作中Z39.50检索的运用最为广泛。但是,在实际工作中Z39.50检索存在着一些问题。如果以题名作为检索条件,检索结果会出现大量不同责任者、不同版本的相关数据,虽然实现了查重功能,但是编目人员需要逐条筛选出最完整的记录以便套录。以ISBN号或者题名同时作为检索条件,能够有效地缩小筛选范围,但是以此查重不够准确。各种检索功能单独使用虽然相对繁琐,但是能够确保数据的准确灵活运动。因而,利用专门的MARK查重来满足全方位的查重检索,在Z39.50设置选项中仅选择CALIS数据,这样检索数据快而准,在CALIS数据不全的情况下,再利用MARK套路检索功能以书商数据源为补充。
在各种检索条件中由于ISBN号的唯一性,通常作为首选选项,在无标准号或者同一套书标准号相同而需要分散著录时,检索条件选择顺序先后进行题名、责任者或者多条件检索,而主题词、丛编项等其他检索条件一般只作为一种参考。
各种数据源数都以《中国机读目录格式使用手册》为标准。特点上,原始数据源比较直观,本地数据源具有馆藏特色,CPI数据源提供快,书商数据针对性强,联机联合数据源准确度高,OPAC数据源参考性强。形成时间上,CPI数据来源于出版商,这就决定了它在形成时间上必定先于其他数据源。利用率上,原始数据源是基础,在版编目数据源可以作为其他数据源的基本参考,更广泛的横向参考则通过OPAC数据源来完成,书商加入联机联合编目后也可以直接获取联机联合编目数据源,各种数据源经过加工后最终都可以成为本地数据源。准确率上,联机联合编目数据源规范化程度较高,其中CALIS数据源目前已经成为高校图书馆图书编目的主要数据源[6]。
随着我国编目事业的发展,各种数据源正在向着规范化、国际化方向迈进。世界上最大的联合编目中心是OCLC,目前,我国已有1000余家图书馆加入其中,但就我国整体而言,这些成员馆所提交的数据仅仅是国内数据的一部分。在我国建立一个中国的OCLC组织,使其成为唯一一个国内最大的联合编目中心,让目前国内所有各类型的大中小规模的编目机构必须全部参与其中,形成一个有机的整体。此中心可以起到承上启下的作用,即直接加入OCLC后,也就意味着国内所有成员都可以利用OCLC资源。中国OCLC的建立,必须制定统一完善的数据规范规则,经得起时间的推敲,能够解决各个编目中心具体数据规范在细枝末节上的差异,最终达到数据质量全国范围内的整齐划一。各个编目成员馆下载的数据无需更改便可直接使用,真正实现我国信息资源的共建共享。由于现有的不同联合编目中心之间数据仍存在着较多的重复书目,在中国建立OCLC后,现有的联合编目中心将数据提交到OCLC过程中,必然要剔除原有各个编目中心之间的重复数据,达到纯粹的唯一性,因而,中国OCLC的建立,还要依托先进的网络技术以及客户端软件的开发。总之,我国编目工作现代化的目标就是要尽快建成中国的 OCLC[4],使其成为我国各行各业最大最权威的编目数据源,使我国的编目事业与国际接轨,跃上一个新的台阶。
[1]李晓新.新编文献编目[M].天津:南开大学出版社,2006.
[2]夏翠军.中文图书著录信息源的规范:兼比较《中国文献编目规则》与AACR2R中著录信息源的规定[J].四川图书馆学报,2003(3):56-58.
[3]宋金燕,余丽君,龙旭梅,等.汇文系统编目子系统在图书编目中的应用[J].中华医学图书情报杂志,2008,17(2):43-45.
[4]胡广翔,金培华,杨 齐,等.联机联合编目与Z39.50标准协议应用研究[M].北京:社会科学文献出版社,2011.
[5]李师龙.汇文系统在编目工作中的应用实践与问题[J].黑龙江科技信息,2009(35):75,62.
[6]蔡 敏.高校图书馆中文图书编目利用外部数据源探讨[J].图书馆论坛,2004,24(3):120 -121.