Millennium系统编目模块的应用与问题分析

2009-10-13 03:29肖丽萍
现代情报 2009年7期
关键词:查重标目编目

肖丽萍

〔摘 要〕Millennium系统是美国INNOVATIVE公司开发的一个功能齐全的图书馆集成管理系统,其发展已超过25年历史,在国内外拥有众多用户。我馆于2006年引进该系统,本文结合2年的编目模块实践,从数据套录、统计、数据质量控制等方面,全面论述该系统在我馆编目工作中的应用,同时分析其存在的问题并提出解决的办法。

〔关键词〕Millennium系统;编目;数据质量控制

〔中图分类号〕G254.3 〔文献标识码〕A 〔文章编号〕1008-0821(2009)07-0174-03

Applications and Problems of Utilizing Millennium System in CatalogingXiao Liping

(Library,Jinan University,Guangzhou 510632,China)

〔Abstract〕Millennium system is a full-featured integrated library management system developed by INNOVATIVE Corp.of USA with 25 years history and thousands of users worldwide.Based on two years cataloging experience since 2006,the author analyze the advantages of application of Millennium system in cataloging and provide solutions for the existing defects.

〔Key words〕Millennium System;Cataloging;Data Quality Control

2006年,暨南大学图书馆引进Millennium系统,该系统是由美国INNOVATIVE公司开发的一个集采访、编目、流通、期刊、OPAC、系统管理等于一体的功能齐全的图书馆集成管理系统,在全世界40多个国家和地区拥有众多用户。在中国内地有清华大学、西安交通大学、华中科技大学、国家会计学院、浙江省图书馆等10多家图书馆使用,其功能全面、结构严谨,使用方便,得到用户的广泛认可。本文将结合2年的编目模块实践,具体讨论Millennium系统编目模块应用中的优势和存在的问题,分析其中原因,并提出较为可行的解决办法。

1 Millennium系统编目模块应用的优势

1.1 支持多数据源检索

在联机合作编目的形势下,图书馆书目数据共建共享,数据套录渐渐成为编目工作不可或缺的一部分。如何有效提高套录效率就成为提高编目效率的一个重要方面。在Millennium系统的Z39.50客户端,可以配置多个Z39.50服务器,其远程检索支持不同语种和多种MARC格式,套录数据可以同时选择多个数据源库进行检索。例如套录西文图书数据时,可以同时选上CALIS联合目录、美国国会图书馆联合目录、美国Ohiolink联合目录等数据库,进行一次检索,即可同时下载不同数据源库的检索结果。

1.2 具有强大而灵活的统计功能

图书馆统计工作是图书馆业务工作的重要组成部分,它对图书馆运行中的各种数据进行搜集、整理、分析研究,以便从中发现问题和解决问题。国内系统在统计方面的功能比较欠缺,例如不能对数据进行深层次的统计和分析,问题数据进入大库后很难将其查找出来等。Millennium系统具有非常强大的统计功能,编目模块常用统计工具产生资料档(Create lists)可以非常方便的统计出几乎所有需要的统计结果。

利用资料档,用户可以根据自己所设定的条件,从书目、馆藏等记录数据库中进行检索,找出符合自己要求的记录集合。设定表达式时,可以针对某一个索引组、某一字段或子字段,利用=、≥、含有等数学表达式,结合“与”、“或”、“非”等逻辑条件[1]。

在编目实践中,主要用资料档进行个人工作量统计、抓取有问题记录、批次业务统计、书目数据审校以及产生新书通报。

1.2.1 抓取有问题或需处理的书目记录

只要根据需处理记录的共同特征设定条件,就可以轻而易举地找出相关记录进行处理[1]。例如要找出2008年12月已编目数据中漏加索书号字段的记录,设定条件如下:

BIBLIOGRAPHIC Cat.Date between″2008-12-01″and″2008-12-31″AND BIBLIOGRAPHIC Call No.not exist。通过这个表达式即可抓取12月编目的所有书目记录中无索书号字段的记录。

1.2.2 批次业务统计

批次业务统计是编目典藏工作之前非常重要的内容,统计结果的核查尤为重要。利用资料档的字段排序功能,可以很容易找出取值范围之外的错误记录。例如用书目记录的索书号排序,没有分编(即没有索书号字段)的记录就会排在最前面;同样,用馆藏记录的条码进行排序,就可以将不符合本条码段的记录找出来。

1.2.3 书目数据审校

书目数据审校是书目数据质量控制的重要环节,也是保证书目数据标准化、规范化所采取的重要质量控制措施。Millennium系统资料档的数据排序及输出等功能,可以非常方便的完成此工作。利用不同的字段排序,从资料档里直接输出该批数据需要检查的字段内容,比如题名、责任者、版本、索书号等,在本地直接用文本文档查看。这就省去了逐条打开记录的繁琐,而且也更加直观明了。

1.3 可有效控制数据质量

图书馆的书目数据库质量的优劣直接影响到文献检索效果,进而影响到文献的流通、文献的开发利用和文献资源共享[2]。然而,如何有效控制书目数据质量却是系统开发商面临的重要难题。Millennium系统提供的多项功能如全域更新、标目查重、标目异动报表等,为用户控制书目数据质量提供了充分的空间。只要编目人员充分利用这些功能,就可以极大的提高书目数据库的质量。

1.3.1 全域更新

Millennium系统的全域更新功能可以批次插入、修改、删除、复制变长字段,修改特殊字段等。在抓取需要更新的记录后,利用此功能可以批次快速更新记录,在执行更新之前还可以通过预览查看更新之后的结果,以核对更新条件是否正确[3]。

例如我馆正在回溯院系资料室回收图书,需要在某一批数据的馆藏记录中增加一个字段表明该批数据回收来源。设置一定的条件抓取资料档后,利用“插入定长字段”,将来源信息如“经济学院回收”加入条件中,执行即可批次添加。

1.3.2 编目即时查重

Millennium系统在编目状态下,提供了多种帮助功能来保障书目数据质量。其帮助功能主要有:实时MARC格式提示、MARC格式检查、标目即时查重等。标目即时查重功能可以在3个方面对书目数据的质量予以保障。

(1)避免查重不严所致记录重复。Millennium系统既可以对被编目记录中某一索引字段即时查重,也可以同时对被编目记录的全部索引字段即时查重。如遇到多个索引字段值均在书目数据库中存在的情况,尤其是ISBN与题名同时出现重复的情况,就需要引起编目员的注意,通过仔细判断来避免失误[1]。

(2)索书号查重。通过索书号字段的即时查重,可以及时发现重号图书,从而避免异书同号现象。

(3)排除输入错误。通过对题名、责任者等字段的即时查重,可以显示相邻记录的索引值,有助于发现可能存在的输入错误[1]。

1.3.3 标目异动报表

书目数据库中的记录,只要有所变化,Millennium系统都会记录下其标目的变动,形成标目异动报表。通过报表,我们可以实时监控数据质量。在我馆,标目异动报表主要用来记录重复使用标目的变化。

标目异动报表能够产生重复控制号、索书号和馆藏记录条码号的报表。从“索书号”重复提示,直接打开报表中的各个条目,可以进行人工判重,排除因为区分号不同而被系统认为重号的记录;从“条码号重复”提示,可以明确标示出重复的条码,从而保证馆藏记录主要标识的惟一性。

另外,如果图书馆建立有本馆的规范记录库,还可以使用标目异动报表进行规范记录控制。通过报表指出与规范记录有关的规范记录重复、使用非规范标目和盲目参照等[1]。

2 Millennium系统存在的问题及解决办法

Millennium系统是西方国家开发的系统,由于国情的差异和思维方式的不同,系统功能开发的侧重点也会有所不同。在编目模块的设计上,国外系统更注重检索[4],而对中国特殊国情需要的某些功能开发有所欠缺,目前,Millennium系统编目模块存在的问题主要体现在如下3个方面:

2.1 有些中文字符转换错误

我馆Millennium系统使用的是图形界面,字符集为Unicode码。Millennium系统对中日韩文采用EACC/CCCII作为内码存储,在系统升级为Unicode之后,客户端汉字输入设为Unicode字符集。由于客户端字符集与系统内码的不同,就需要进行字符集编码的转换[5]。因为字符集转换表的问题,在字符转换过程中,就出现了一系列的问题,包括字符缺漏,如“税”字不能保存;有些字符转换成了异体字或者乱码,如汉字“真”在导入系统之后变成了“真”,等等。

为了解决字符问题,我馆主要采用两种方式:一是在编目过程中搜集错误的字符,并将其发送给公司,由公司方重新匹配字符集,逐个修改;二是定期统计月度编目数据,利用全域更新批次修改转换错误字符。

2.2 中文图书原编时拼音罗马化不符合CNMARC著录要求因为我国使用象形文字,CNMARC著录规则要求对有检索意义的字段如题名、主题、责任者增设我国特有的拼音子字段,从而提供多一种检索途径。Millennium系统对汉字罗马化(即产生拼音)的定义是将定长字段language为chi的记录中所有的中文汉字都匹配一个拼音[6]。显然,这种罗马化的定义与CNMARC图书著录规则不相符。在Millennium系统中做中文图书原编时,无法使用其罗马化功能自动生成拼音,必须手动逐个输入。为了解决这一问题,我馆中文图书原编都在CALIS Z39.50客户端完成,数据提交之后再从Millennium系统远程下载,覆盖本地系统的简编记录。

2.3 Millennium系统还未与中国高等学校文献保障系统(简称CALIS)达成协议,在系统中无法直接向CALIS上交馆藏

作为CALIS的成员馆,我们在下载其记录的同时还必须向其提供本馆的馆藏信息,以利于各成员馆之间的馆际互借。由于协议尚未达成,我们不能直接通过Millennium系统向CALIS提交馆藏,而只能到CALIS Z39.50客户端重新执行一次检索并上交馆藏信息。目前公司正在与CALIS协商,我们期待早一点有结果。

3 结 语

2年多的编目实践,我们感受到Millennium系统编目模块结构严密,功能强大,使用方便,它提供了一整套编目业务管理的规范操作,有效提高了数据质量,整体上提高了编目工作效率。然而由于各国国情不同,思维方式的差异等原因,造成了上述的问题。我们希望Millennium在今后的系统升级中,能更多考虑不同用户的需求以满足用户需要。

参考文献

[1]胡小菁.INNOPAC系统书目数据库质量控制[J].图书馆杂志,2001,(11):23-26.

[2]万丽蓉.论书目数据的质量控制[J].图书馆工作与研究,2007,(5):34-35.

[3]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 104002,2009-01-01.

[4]孙晓菲,曹玉霞.图书馆集成管理系统Horizon编目模块评价[J].大学图书馆学报,2002,(4):37-39.

[5]方红.INNOPAC/MILLENNIUM系统汉字处理问题的研究[J].高等工程教育研究,2006,(S1):119-121.

[6]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 105472,2009-01-01.

[7]Millennium ILS:Innovative Interfaces[EB].http:∥www.iii.com/products/millennium_ils.shtml,2009-01-01.

猜你喜欢
查重标目编目
学位论文查重乱象引关注
国家图书馆藏四种古籍编目志疑
《传奇汇考标目(别本)》的版本及其他
中文图书在版编目数据标目中存在的问题及对策研究
论文查重别大意
学术论文该“查”什么?
粤剧编目整理之回顾与展望
CALIS联机合作编目中的授权影印书规范著录
图书馆编目业务外包发展探讨
医学论文中制表的注意事项