陈雅
(广州图书馆,广东 广州 510623)
图书馆编目系统更换实践研究
——兼论地区联合编目中心数据质量控制策略
陈雅
(广州图书馆,广东 广州 510623)
随着信息技术的进步,图书馆已由独立运营向联合编目信息共享方向发展,原有的图书馆编目系统已经不能适应新时代图书馆的需求,许多图书馆面临着编目系统更换的问题。广州图书馆经过半年多的编目系统更换实践,总结了若干经验:编制新旧系统对比操作手册、根据新系统特性调整工作流程等,并对新系统在严谨性、易用性、发展性方面提出建议。
编目系统 联合编目中心 质量控制
20世纪末,我国图书馆逐步从手工编目转变为计算机编目,当时的信息技术还是在以DOS操作系统为基础的计算机编程环境下,初期的计算机编目系统的主要功能只是把手工编目转变为计算机编目;手工书目目录卡片进化为机器打印书目目录卡片。受限于当时信息技术水平,20世纪末人们对计算机编目系统的需求是:能达到适应独立图书馆的编目流通工作即可。[1]其后,互联网不断发展,计算机编目系统也发展为能实现从联合编目中心下载数据,大大提高了图书馆的文献编目和图书流通工作效率。二十多年后的今天,随着信息技术的不断进步,图书馆已由独立运营向联合编目信息共享方向发展,这需要对地区图书馆的馆藏进行资源整合,对图书馆编目系统功能要求更高了,原有的图书馆编目系统已经不能适应新时代图书馆编目需求,国内许多图书馆面临着编目系统更换的问题,新编目系统须适应新时代信息发展的需要。[2]编目系统的更换是一项复杂的工程,牵涉的事情繁多。广州图书馆经过半年多的编目系统更换实践,总结了若干经验和建议,以期为同样面临更改系统的同行以启示。
2.1 编目系统更改原因
20世纪,由于制度的原因、信息技术的局限,社会对图书馆通借通还的需求不强烈,以独立运营为目标的编目系统尚能满足当时图书馆的发展需求。如今,人们对知识的需求日益增长,独立运营的图书馆容易造成资源不能充分被读者利用等缺点。为了促进图书馆图书资源能被充分利用,必须推行通借通还。通借通还的前提是必须要有联合的编目中心,而各个图书馆使用的编目系统必须能与地区的联合编目中心顺利接轨。因此,当图书馆编目系统还是以独立运营为目标的系统,显然已不符合现代图书馆需要,应更换新的编目系统。
编目系统更改的原因主要有以下四方面:
第一,图书馆发展趋势。由独立运营图书馆向地区图书馆资源共享转变。地区图书馆图书的通借通还,能提高图书的使用率,也给读者带来了便利。地区图书馆图书通借通在国外公共图书馆和高校的实施效果非常好。据媒体报道,韩国的图书馆于2016年5月起实行了全国图书馆图书通借通还[3],韩国图书馆实现图书资料全国通借通还表明,图书资料能在大区域流通乃是新时期图书馆的大势所趋。在中国,各地公共图书馆已开始逐步实现了地区图书馆联合;中国高校图书馆更是已经实现了地区高校图书馆图书资料流通互借。
第二,制度支持。在国家倡导大力发展公共文化服务政策下,在地区大型图书馆的倡导下,在地区分馆的支持下,经过一系列努力,在制度上能达成地区图书的通借通还。
第三,信息技术发展。互联网和信息技术的发展,使得以前只能独立运营的图书馆书目数据能在信息技术的支持下实现多馆数据整合。联合编目使得通借通还在技术上得到实现。
第四,大型图书馆的需求,大型图书馆与小型图书馆的差异。在我国,大型图书馆通常历史比较长,藏书量多,担任了地区图书馆中心馆角色,中心图书馆通常和区县图书馆分馆形成了长期的友好合作关系,区县馆读者需要借区县馆没有的藏书,经常会通过馆际互借的形式满足读者需求;反之,中心馆需要某些区县馆的图书资源,也可通过馆际互借的形式实现。以地区大型图书馆为主要依托的地区编目中心,需要一个功能强大的编目操作系统,以处理其海量的图书资料信息和海量的图书流通借还数据信息。小型图书馆相对于大型图书馆而言,藏书量相对较少,读者量较少,若小型图书馆以独立运营为目标,则对编目系统的需求小;若小型图书馆也有参与地区文献信息流通的需要,则需加入地区文献编目中心成为分馆,那么其在数据处理需求上和大型图书馆的需求是一致的。
2.2 新系统的选择
新编目操作系统的选择,要根据各个图书馆实际情况综合考虑。①图书馆体量:是属于大型图书馆还是中小型图书馆;②图书馆经费;③需要达到怎样的管理效果:达到图书馆独立运营,地区图书馆中心馆,还是需加入地区联合编目中心的分馆等。
对新操作系统的选择还需要从以下3个方面进行考察。
其一,系统的运行条件和系统的性能。新编目系统对网络带宽的要求与处理采购数据的能力,要求能够达到采购数据的批处理操作等;编目数据处理能力。包括新编目系统对下载数据的处理能力、原编数据的处理能力、上传数据的能力、对联合编目数据的处理能力等。
其二,与旧系统的衔接。若新编目系统在基本性能上能达到图书馆的需求,也需要考虑其与旧系统能否顺利衔接,旧系统的数据要能够顺利导入新系统。此外,最好是新系统在操作方式上与旧系统的操作方式差别不大,这样新旧系统的过渡阶段会顺利很多。尤其对于大型图书馆来说,每天都必须处理大量数据,如果操作系统之间的磨合期时间过长,将会影响整个图书馆的运营。
其三,系统的售后服务。当图书馆启用新系统后,会面临各种各样的问题,新的编目操作系统的售后服务显得很重要;特别对大型图书馆,有良好及时的售后跟进服务,才能使图书馆的编目流通工作顺利进行。售后跟进服务优秀与否,是图书馆考量新的编目操作系统优劣的重要指标之一。
2.3 图书馆编目系统更换实践
图书馆编目系统更换需要着重解决的问题有:其一,编目系统更换过程不能影响图书馆的日常运营。其二,编目人员对新系统的适应性。其三,由于图书馆馆藏数据类型多样(图书、期刊、音像资料等),馆藏量大,编目数据关联采购信息,要求旧系统的数据库转换到新编目系统中要确保数据信息准确无误。
2.3.1 新旧系统并存阶段
以广州图书馆为例,广州图书馆为大型综合性图书馆,其馆藏量大,图书流通量大,图书编目加工量也很大。大型图书馆不能像小型图书馆那样停止日常的编目加工工作,让编目人员集中时间学习新系统、适应新系统后,再更换系统。大型图书馆需要顾及图书馆的日常运行需要。基于以上原因,大型图书馆在更换系统中,将有一段时期是新旧系统并存编目的。
新旧系统并存编目的方法:首先,把数据库量少的外文图书编目工作先在新编目系统上操作;其次,选取中文图书编目的部分人员在中文图书编目测试库中进行检测使用工作;最后,中文图书编目测试工作完毕后,所有编目工作皆在新的编目系统上进行。
由于图书馆的编目数据是分了几个数据库的(根据资料的载体、资料的特征等,分为中文图书数据库、外文图书数据库等)。在实践中,先行把馆藏量相对较少的外文图书数据导入新的系统中,发现问题及时与新系统开发者反馈,改进系统性能。与此同时,馆藏量大的中文图书仍然在旧系统中进行编目,以保证日常的图书出书量,以满足图书馆日常的流通需求。
建立中文图书编目测试库,中文图书编目人员中分派出若干名骨干人员,在新系统的中文测试库中进行各个环节的检测试用工作。因为中文图书藏书量很大,若其中有一点数据纰漏,势必引起整个数据库的数据问题,对于中文图书数据库的迁移是需要非常谨慎对待的,所以要建立中文图书编目测试库。中文图书编目人员的选择:第一,对旧系统非常熟悉的编目员;第二,有很强的学习能力,能够对新旧系统进行对比分析;第三,有良好的沟通能力,能对新系统提出系统需求,并且能把学习心得与同事分享。
2.3.2 编写新旧系统对比操作手册
为确保馆藏中文图书编目数据顺利导入新系统的数据库中,以及由旧系统顺利过渡到新系统,从事中文图书编目的工作人员在新系统的测试库中进行各个环节的检测试用工作,总结出新旧系统的操作区别和新系统的使用诀窍。
以广州图书馆为例,其使用lLASII(图书馆自动化集成系统)已近二十年,图书馆的编目人员对旧系统非常熟悉,尤其旧系统属于内联网编目的形式,网络速度快,操作界面简洁。骤然转换到新的以互联网网页形式为操作界面的图创系统,系统界面等与旧系统有极大的不同。为使编目工作人员能尽快适应新系统操作,对新系统试用的编目人员还要承担编写“新旧系统对比操作手册”的任务。对旧系统中常用的新建、增加字段、合并记录等操作,对应新系统操作过程作一个对比表。“新旧系统对比操作手册”在系统更换过程中能起到桥梁作用,使编目人员能更快更好地适应新系统,减少操作失误。[4]
“新旧系统对比操作手册”使编目人员能很快适应新系统。以广州图书馆为例,其从ILASII(图书馆自动化集成系统)转换到图创系统,大批中文编目操作人员只用了3个月就适应了新的系统操作,3个月的适应期中没有出现重大的数据错误。
2.3.3 调整工作流程
广州图书馆编目系统更换为图创系统后,有个别的操作方式需要适应新系统进行调整。
调整一:验收工作。图创系统在验收界面及功能区分上与ILASII有巨大的区别,如果工作模式变化过大,则工作人员适应新系统的时间将会延长,差错率也会增大。因此,要尽量保持原有的工作模式。在确保编目中心的工作模式尽量少改变的前提下,作出细微的调整。ILASII是“验收——编目——审校”,调整后,在图创编目系统的图书编目流程上已经调整为,验收——编目——馆藏确认——审校。
调整二:编目数据中的905字段。更换新系统的改变是:广州图书馆馆藏由独立馆藏变化为广州地区联合编目中心的馆藏。由于广州地区联合编目中心集中了很多原来没有行政关系的区县馆馆藏,每个馆的索取号都有区县馆自己的规定,原来广州图书馆的905字段只能表明是广州图书馆的书目数据索取号,那么区县馆也放置于905,则会在编目数据中出现太多的905字段。因此,在新的编目系统中,书目数据不再出现905字段,赋予索取号工作将在验收板块中操作。
调整三:书标打印工作。原来书标打印为3行,现在增加了馆藏地点及图书出版年,书标新增为5行,书标的样式及打印程序都进行了调整。
2.3.4 数据迁移
在理顺了工作流程并试运行了一个月没有出现大问题后,把广州图书馆所有馆藏733万册(件)数据[5]导入到新的编目系统中。从此一切编目操作皆在新的编目系统中完成,实现了图书编目系统的更换。
2.4 提升新系统性能,提出系统改进建议
图书馆编目系统在更换过程中,图书馆对新编目系统就其严谨性、易用性、发展性方面提出若干改进意见,提升了新编目系统的性能。以广州图书馆为例,广州图书馆经过半年的系统更换实践,发现图创软件系统有如下不足:
第一,系统性能不稳定。由于使用的是网页式操作,依赖于网速,若网络环境不好,势必造成网络瘫痪无法工作。
第二,系统在严谨性、明晰性上还需要加强。系统某些功能的改变过于随意,在没有通知用户的情况下进行修改。
第三,系统提供的功能过多。很多时候编目工作中需要的只是几个常用必要的功能,其他的非必要功能不需要提供过多。核心功能上希望能吸取ILASII优点,比如系统要稳定,系统有对比功能,系统能实现多条件检索等功能。
第四,设计问题。诸如页面显示过小、界面设计不友好、按键设计不合理等。
在图书馆编目中心和图创软件开发者不断的沟通和努力下,图创软件的若干不足之处得到改善,如:因网速而导致的网络瘫痪问题,通过增加硬件的投入,加大网线带宽,加大主处理器的容量等措施,使问题得以解决;在系统的严谨性、明晰性上则在听取了使用者的建议后,逐步有所改善;对数据下载的多条件检索功能,则在进一步的研发攻关中。
系统的改进措施:在图书馆使用方和系统技术开发方之间要建立良好的合作关系,在工作中发现问题要积极与制造方进行沟通和改进,以期使系统不断进步,使图书编目工作做得越来越好,工作效率越来越高。改进措施如下:
第一,图书馆使用方定期或者不定期与系统技术开发方交流工作心得。
第二,图书馆使用方要定期对图书编目数据质量进行抽检,发现问题及时与系统技术开发方联系。
第三,编目系统的客户众多,对系统的改进可能会根据其他客户提出需求进行改良,改良后应该及时知会所有使用客户。
2.5 成效
2.5.1 顺利更换系统
经过3个月的试用和在试用过程中不断与图创软件系统工程师的沟通,使用方对新系统进行了改良,与此同时,图书馆的编目员也初步适应了新系统。又经过3个月的时间,全体编目人员可在新的编目系统进行编目操作。前后总共只用了6个月时间,广州图书馆就更换了图书馆编目系统,实现了大型图书馆编目系统更换的安稳过渡,没有影响图书馆的工作绩效。
2.5.2 提升新系统性能
以前用ILASII系统,中文数据需要上载到联编中心需要每天进行同步操作;现在直接在联合编目中心实时操作,无须同步数据,减少了同步可能出现的诸如控制号冲突等差错。此外,经过广州图书馆(使用方)与图创软件系统商(系统技术开发方)一段时间的沟通,使得软件有了以下几点进步:①图书采购中实现了批处理功能;②图书采购中实现了PDA模式(Patron driven acquisition)读者决策采购,能达到读者现场选书登记后就能把图书借走;③改进书标打印系统,新书标能显示图书的馆藏区域,为读者服务提供了更好的条件;④中外文编目格式的互相转换(Marc21转换为CN-Marc;CN-Marc转换为Marc21);⑤数据上传到联机计算机图书馆中心(OCLC)。
地区联合编目中心宗旨是:在地区范围内组织和管理图书馆联机联合编目工作,运用现代图书馆的理念和技术手段将各级各类图书馆的书目数据资源和人力资源整合起来,以地区图书馆为中心,实现书目数据资源共建共享,降低成员馆及用户的编目成本,提高编目工作质量,避免书目数据资源的重复建设。[6]
广州市图书馆文献联合编目中心由广州图书馆发起,由广州市属各区县图书馆共同创建,旨在通过联合联机编目的方式,达到资源共建共享的目的。采用先进的功能强大的图创图书馆管理系统,各成员馆可以24小时上传和下载,从而使各成员馆之间真正相互协作,共享编目成果。
3.1 存在的质量问题
数据的质量问题主要有两个方面:①多馆数据,同一条记录重复上载问题;②数据的著录质量问题,如数据著录不规范、数据著录不完整、数据著录差错等。[7]
3.2 解决策略
解决以上两个方面问题主要有4个策略:
策略一,系统技术手段策略——通过技术手段对数据进行比对合并。以广州地区联合编目中心为例,对于已经在联合编目中心的数据,通过系统用“题名、著者、出版社、出版年、版次”等的条件,提取了约14万条相同的数据。根据编目员一个星期的合并操作后,发现有一些地区分馆在做数据的时候就存在一个条码对应一个书目数据的情况,经过与该分馆采编中心联系了解情况后,得知是该馆成立初期时没有专业的图书馆编目人员,其采取了一本书做一条数据的数据处理方法。联合编目中心根据分馆提供的若干信息,与系统商(开发者)商量后,开发者针对该馆情况,把该馆完全相同的数据进行机器自动合并,合并的数据以生成的第一条数据为准。这样既节省了联合编目中心人工合并的人力和时间,也避免了人工合并可能出现的错误,提高了工作效率。
此外,对于新加入联编目中心的分馆,则可以通过“题名、著者、出版社、出版年、版次”等的条件,在数据导入中心馆时,进行数据对比查重,如果一致,则把馆藏信息导入到指定书目记录下即可。若分馆要脱离中心馆,则可以通过馆藏信息进行提取,并且把有关联的书目数据提取出来。
策略二,联编中心人员操作策略。有的合并操作是不能用机器自动操作的,必须人工进行比对合并。对多馆数据同一记录重复上载问题,需要进行数据合并操作。合并原则是:①地区联合编目中心中存在中心馆数据及分馆数据时,首选中心馆数据作为最终数据;②中心馆数据质量不如分馆数据时,可将分馆数据的可用字段补充到中心馆数据中;③若中心馆与分馆皆有馆藏数据,中心馆数据需要修改的内容太多,可最终选择分馆数据,但要将分馆数据的001书目控制号删除,产生中心馆的书目控制号。
策略三,制度建设策略。对多馆数据重复上载、数据质量问题等,皆因以前为分馆独立运营,各自为政造成的。解决这一问题需要订立地区联合编目中心编目细则,确定同一种图书只能做一条书目记录等操作原则。对地区中心馆、分馆的书目数据从采购到编目过程中需要注意的地方进行操作规范。
策略四,数据质量控制策略。地区联合编目中心对分馆数据定期进行审核抽查,并把抽查结果反馈到分馆。中心馆应定期举办编目培训班,以期提高地区分馆编目人员的水平。[8]
3.3 成效
通过系统的统计功能,把题名、著者、出版社、出版年、版次相同的记录全部统计出来,输出表单显示总共为147829种,353900条。广州地区联合编目中心用了6个月时间,把353900条重复数据进行了合并操作,基本实现了一种图书对应一条记录。并在合并操作的同时,对这些数据进行了质量审核,对有问题数据进行了修正操作,提升了地区联合编目中心数据库质量。
随着信息技术的不断发展,传统的编目工作也面临重大的发展和变革,图书馆编目工作也需与时俱进。在现今的信息全文检索年代,编目工作除了对传统文献信息进行编目外,还需要借助新的信息系统对文献内容进行更深层次挖掘,以便更好地揭示文献内容,更好地为读者服务。
[1]百度百科.文献编目自动化系统[EB/OL].[2016-05-02].http://baike.baidu.com/link?url=Az3z6mzUpHaYlBnQ6gjQ _r8b_BOcsvpGYfuwwyLaiE83XU24E02YiIgSLvwknmIBol sDftatsYm2rfwGKqV2Ka.
[2]郑伟,徐宝祥,高琦.“211”大学图书馆管理系统研究——基于“211”大学图书馆管理系统的调查[J].图书情报知识,2010(5):4-10.
[3]吴建中.韩国公共图书馆推行全国一卡通借通还[EB/OL].[2016-05-14].http://blog.sina.com.cn/s/blog_53586b8 10102wb4f.html.
[4]图创公司.图创系统使用手册[M].[出版者不详].[出版时间不详].
[5]广州图书馆.广图概况[EB/OL].[2016-05-09].http://www. gzlib.gov.cn.
[6]全国图书馆联合编目中心.全国图书馆联合编目中心宗旨[EB/OL].[2016-05-02].http://olcc.nlc.gov.cn/.
[7]张元芸.关于联合编目环境中重复数据上传问题的思考——以OLCC数据为例[J].图书馆工作与研究,2014(4):47-49,60.
[8]易向军.联机编目环境下书目数据规范控制研究[J].中国图书馆学报,2011(11):120-124.
陈 雅 女,1980年生。本科学历,馆员。
G254.3
2016-03-31;责编:杨新宽。)