(深圳图书馆,广东 深圳 518036)
按照《美国图书馆学会词汇》的定义,联合编目[1]是指“一组各自独立的图书馆开展的书目原始编目的协作活动,成员馆之间有义务相互提供书目记录”。随着《公共图书馆法》于2018年1月1日起正式实施,“联合目录”工作写入了公共图书馆法法条[2],联合编目的重要性更加凸显。联合编目是地方公共图书馆之间打破空间壁垒,实现资源共享一体化的基础业务工作。总分馆制联合编目是当代城市公共图书馆的主要编目模式,此模式打破了传统图书馆之间的条块分割,利用中心馆的高端设备、技术力量和管理经验,降低成员馆的编目成本,提高编目工作质量,避免书目数据资源的重复建设,实现书目数据资源的共建共享,加快了公共图书馆自动化建设的步伐,促进了区域公共图书馆的发展,顺应现代图书馆的发展趋势。
国内总分馆制联合编目的确有很多优势,使得地方公共图书馆在网络时代快速发展,但也存在一些问题,总结起来主要有以下几个方面:
书目数据是计算机可识别和可处理的揭示馆藏文献资源的信息[3],多个图书馆和信息机构的书目数据汇集组成联合目录数据库,也叫中央书目库,建立互通互联的可以共享的中央书目库是联合编目的核心工作,因此,中央书目库的书目数据质量对整个联合编目工作都有着至关重要的影响。编目工作标准化、规范化是书目数据质量的衡量标准,是实现联合编目,资源共享的关键。总分制下联合编目中,各成员馆接入到中央书目库中的数据比较混乱,体现在:一是数据来源各异,有国家联合编目中心数据、高校联合编目中心数据、各大书商数据等。二是理解规则不同,著录方式不同,尽管我国相继出版了《中国机读目录使用手册》、《中文书目数据制作》等一系列编目工作手册和规范,但由于各编目机构及成员馆掌握规则和理解认识的不同,选择的著录方式不同,结果造成同一文献数据的不规范、不统一。三是细则规定差异,不同的编目机构和成员馆由于使用的编目系统、历史原因或业务需要等,会相应地制定一些编目细则,这也造成了编目数据的不统一[4]。这些不规范,不统一的书目数据一方面给中央书目数据库造成了大量重复数据,另一方面也影响着联合编目人员的工作效率,更给读者检索带来了困扰,进而影响读者的使用体验。
书目质量控制是“建立、组织、管理和维护特定书目记录文档的所有活动”。目前,我国在书目著录、编目格式、主题词表、分类法等方面制定了一系列的标准规范,总分制下的联合编目工作也是以CNMARC作为行业数据交换的标准格式,但目前我国国内还没有实现行业间编目标准的统一[5]。从全国联编中心到各区域联编中心,因统一标准和规范的缺失,容易导致成员馆各自为政、纪律松散,不利于各成员馆的凝聚力和图书馆联合编目业务水平的整体性提高。
人员是编目工作的实际操作者,在整个编目流程中,从著录、标引到名称规范、取索取号,每个步骤都有可能出错,因此编目人员的业务水准、工作态度及综合素质直接影响到书目数据质量[6]。随着互联网+不断渗入图书馆业务的各个环节,学科融合、新兴学科的交叉渗透,对编目人员的知识面、专业性提出了更高要求;另一方面随着各馆购书经费逐年递增,编目业务的外延不断拓展,编目业务外包、跨行业编目在减轻编目工作量的同时也导致书目数据质量下降。有些成员馆未设编目岗,编目工作全部外包,有些图书馆未设审校岗对书目数据质量进行把控,而外包商的专业编目员的数量非常有限,编目团队业务水平良莠不齐,人员流动性大,这些因素都会严重影响书目数据质量。
当前我国的图书编目工作缺乏整体协调,存在着大量的重复和冗余数据。重复和冗余数据产生的原因是多方面的[7],编目规则不统一、编目质量参差不齐以及数据合库是主要因素,大量重复和冗余数据是影响联合目录数据质量的一个重要问题。重复数据不仅造成数据的快速膨胀,还给成员馆使用数据造成不必要的筛选麻烦。合库后,如何处理这些冗余数据也成为各联合编目中心面临的一大难题。
书目质量的控制不仅需要人工校验,也离不开编目系统软件的查重和校验。因此,利用编目系统较为先进的软件技术作为编目员的辅助工具,对于书目数据的质量控制具有重要的作用[8]。现行的各类编目系统软件在判重合并、必备字段检测、自动取号、字段自动追加(例如461字段可以根据225字段自动追加,责任者追加等),重复ISBN审校提示等方面都大大提高了编目的效率和准确率。但是在判重机制的完善性、编目平台界面的友好性、编目流程的进一步优化和更新、数据基本纠错等方面还有提升空间。
随着历史变迁和体制改革,机构名称特别是团体名称因其基本职能、组织结构的变化也经常发生变化,团体名称的中西文全称、简称的错写、漏写等问题,个人名称的重名、别名、笔名、字、西文音译差别等,又导致关系错综复杂。从图书馆学发展视角来看,这种不规范、不统一的中文名称表述现象容易造成信息资源检索点的选择困难和错误,也不利于对其相关数据的统计和挖掘分析[9]。因此,图书馆必须提高对规范工作重要性的认识,重视规范数据库的价值和作用。
完整的图书馆文献编目工作应该是书目数据库建设和规范数据库建设二者的有机结合。在我国,2003年和2015年,国家图书馆分别实现了名称规范和主题规范数据对书目数据的控制[10]。通过规范数据可关联到相关责任者、学科主题、相关团体、著述等资源,从已知的个人、团体、题名、主题拓展到未知、相似、相关、广义的资源。通过规范控制,国家图书馆提高了文献资源的数据质量,提高了文献的查全率和查准率,甚至为下一步数据的关联化、知识化做了准备,并有计划逐步向全国推广规范控制工作[11]。上海图书馆,中科院图书馆也重视并开启了规范库建设,而大多数图书馆在编目工作中并未重视使用名称规范,主题规范库、一定程度上影响了书目数据质量,总体说来,规范库的建设和使用的道路任重而道远。
深圳市2003年正式提出建设“图书馆之城”,其目标是整合全市公共图书馆服务系统和文献资源,在全市范围内为市民提供统一的图书馆服务[12]。统一书目管理是深圳“图书馆之城”开展统一服务的重要基础,2014年,深圳“图书馆之城”召开馆长联席会议,提出搭建“图书馆之城”联合采编平台,要求各成员馆在统一平台上开展联合采编工作。在集中编目等方式实施条件尚不具备的情况下,深圳“图书馆之城”在不改变各成员馆现有编目流程的基础上,将其他成员馆的书目数据进行合库处理,形成了“图书馆之城”中央书目库。截至2018年底,3年多的时间,深圳“图书馆之城”统一服务平台已经整合包括深圳图书馆、深圳大学城图书馆(深圳市科技图书馆)10个区馆的书目数据,中文书目数据达到270万余条。
由于“图书馆之城”统一服务各成员馆编目规则不统一、编目质量参差不齐以及系统判重机制不完善等诸多原因,深圳“图书馆之城”中央书目库中存在大量重复数据。这些重复数据对“图书馆之城”统一服务的整体效果产生了一定的不良影响。为有效控制重复数据产生源头、规范“图书馆之城”各成员馆的编目流程,降低总书目库中重复数据比例,深圳“图书馆之城”的龙头馆和中心馆——深圳图书馆联合成员馆开展了多项提升书目数据质量的实践探索,取得了一定的成效。
2016年底,深圳“图书馆之城”各主要成员馆数据均已全部完成回溯书目数据批导入,中央书目库新增数据主要来源于各成员馆新编数据,这为制定公共图书馆统一服务书目质量控制规范创造了有利的条件[13]。2016年,由深圳图书馆和深圳市标准技术研究院联合起草的《公共图书馆统一服务书目质量控制规范》(简称《规范》),在两年的时间里,经过多轮专家论证、修改,于2017年11月14日由深圳市市场监督管理局发布,并于2017年12月1日起正式实施。此《规范》是深圳“图书馆之城”统一服务书目质量控制的重要技术指导文件,制定过程中结合了图书馆管理的先进理念,考虑了图书馆行业服务变革的新需求。规定了在公共图书馆统一服务书目质量控制过程中,对编目规则、联合编目平台、编目流程、编目培训、数据质量管理等方面的要求,具有较强的科学性和适用性。规范实施后,大大提高了“图书馆之城”书目数据质量,取得了阶段性成果。2018年,中心馆和各成员馆的共享数据利用率几乎都在50%以上,部分馆的数据利用率达到了80%以上(见表1)。
表1 2018年成员馆数据利用统计表
在联合编目环境下,只有进一步合理规划编目流程,才能缩短文献加工处理的时间,同时也减少重复书目数据的产生,最终总体提升编目成效。深圳“图书馆之城”联编中心对中文图书编目流程进行了调整,增设了新书拆包分拣工序,实现了原始编目、套录编目图书在源头上的分流,进而采取不同的处理流程和要求,在一定程度上加快了编目速度。同时,规范了编目流程,从系统软件的设置到编目验收流程到特殊情况处理流程,都详细进行了规定,并形成文档,让联编中心编目人员有则可依。
合库前,深圳“图书馆之城”各成员馆编目人员参差不齐,部分成员馆没有设置审校岗位,即使设置了审校岗位,审校把关也不严,数据没有进行规范的著录就直接导入了总书目库。同时,各成员馆均不同程度地将编目业务进行了外包,而书商提供的外包编目人员不固定,很多外包编目人员没有经过系统培训或者培训不到位就上岗编目。为了提升各编目人员的业务素养,自2015年起,深圳“图书馆之城”的采编协调工作组每年组织举办深圳“图书馆之城”中文图书编目规范培训班,培训的主要内容包括:中文图书编目规则及实例分析、中文图书编目流程、图书馆之城统一采编平台系统介绍等。到目前为止,已成功举办了4期培训班,每期学员都需通过编目考核,取得“图书馆之城”编目员资格证书才能上岗编目。
除了每年举办一期培训班,中心馆还在工作日全年开放为各成员馆编目人员提供免费的编目实操培训,只要成员馆有需求,提出申请,中心馆会安排资深编目人员指导学员从理论到实操进行一对一培训,每次培训为期1-2周。通过集中培训和日常指导两种方式结合,基本可以保证深圳“图书馆之城”各成员馆编目人员在上岗前都经过系统规范的编目培训,整个深圳“图书馆之城”的编目人员素质得到大大提升。
处理大量庞杂的重复数据是联合采编平台数据质量控制工作的非常重要的一项任务。深圳“图书馆之城”经过反复实践调整,对中央书目库中已有重复数据进行了集中清理合并,取得了一定成效。
联编中心在控制中央书目库中新增记录源头质量的基础上,组织专门人员使用专门的数据合并程序开展重复书目数据回溯清理工作,合并工作严格遵循处理原则:对照某几个关键字段确认为同一种书的情况下合并,不能确认同一种书的情况下不合并;合并以国图、CRLnet和CALIS的数据为准;多卷书、平精装、重印本的重复记录处理流程也清晰列出。
据统计,合库初期2014年底,中央书目库ISBN重复的数据达42万多条,占总书目库书目记录的约17%,有的同一种书甚至有多达5条的书目数据。经过近4年(2015-2018年)集中合并处理,处理重复数据记录约24万条。第一轮回溯清理后,重复书目数据(2007-2018年)所占比例大大下降(见表2),相较合并前成效显著。目前,重复书目数据回溯清理工作还在继续进行中,预计2019年底可以基本完成第一轮回溯清理。
表2 中央书目库重复数据处理情况
编目数据的共建,不单体现在数据的制作之上,更体现在对数据质量的监督和反馈之上。例如,全国图书馆联编中心从2010年开始,就把分中心和骨干馆中的资深编目员组织起来,聘为联编数据的质量监控员,负责完成每日书目数据的审校工作[14]。深圳“图书馆之城”也设有专人进行日常数据抽查,对不按规定交送或发现数据质量不佳的情况及时反馈。联编中心还在每年的培训班培训课程结束之后召开深圳“图书馆之城”联合编目平台成员馆年终座谈会,总结并提出联合编目工作中存在的问题,讨论有效方案。联编中心同时建立了图书馆之城采编工作组QQ群,群里汇集了各成员馆编目员,审校,中心馆系统部专员,工作日安排专人值班,更新的培训课件、问题总结、注意事项也会在群中发布。通过线上线下跟踪反馈,全面、高效地支持整个“图书馆之城”的联编工作。
书面质量控制光靠人工校验是不够的,加上编目系统软件的某些功能干预更可以事半功倍。深圳“图书馆之城”中文书目数据质量控制工作的高效化和规范化,更是离不开先进实用的计算机编目软件的支持。各成员馆加入联编系统后,“图书馆之城”取消了原有数据批接收模式,利用ULAS采编系统,按系统权限进行分级控制,建立多种有效机制,堵住产生数据重复的主要源头,同时及时升级更新书目合并程序,稳步提升重复数据处理效率。2018年底通过系统软件遍历和统计,发现中央书目库中还存在一些ISBN不规范、题名缺失、无馆藏和采访的空书目。根据不同的情况,采编协调工作组提出处理方案,ULAS开发和维护工作人员根据新的需求再次更新和设计了编目软件的某些功能模块,为书目质量控制工作实时助力。
针对前文总结的总分馆制下中文图书联合编目普遍存在的问题,参考深圳“图书馆之城”中文书目质量控制的实践经验,对总分馆制下联合编目中文书目质量控制策略提出几点建议:
在总分馆联合编目体系中,编目中心充当组织者和管理者的角色,而各成员馆是联合编目网络的有效节点或终端,在整个联合编目体系运作中,编目中心与成员馆间是互相依赖,不可分割的。工作上,编目中心与成员馆之间不属于上下级的行政管理关系,而是为了资源共建共享这一目的的合约型关系,合约型关系要求合作双方自觉遵守各方的责任,协同合作,书目质量控制工作不单是编目中心(中心馆)的工作,同时也是各成员馆必须参与的工作,联编数据,馆馆有责,人人有责,需要共建、共享,共维护。在书目质量控制工作中不应该将各成员馆边缘化,成员馆在享受联合编目成果的同时,更要思考自身对联合编目业务发展的责任和作用,融入到书目数据质量的建设和维护工作中去。
从国家到地方,从著录格式到编目操作流程,我国的联合编目工作都缺乏统一的规范,第四届全国文献编目工作研讨会也提出过国内编目规则在新的技术环境下的发展和统一,即统一国图与CALIS这两大联编中的编目数据[15]。规范是共享的基础,而联合编目更是以共享为基础而开展的,国家层面的编目规则的完全统一任重而道远,那么各个联合编目中心可以先行建立地方性行业规范或制定正式的具有操作指导性的联合编目规则,来指导该区域联合编目工作。
在我们所处的网络社会、智能社会,各编目中心应该充分利用编目系统软件高效准确等优势,结合具体工作中遇到的问题,向软件开发商提出需求,督促他们完善或更新某些系统功能,以便系统软件更好地为联合编目助力。
编目工作看似简单容易上手,但是实践证明,没有经过专业系统培训的编目人员是难以提供标准专业的书目数据的,甚至是取得执证资格的编目人员,由于编目工作的枯燥单一,时间长了也会有所懈怠。因此,各联编中心一方面要加强对编目人员(特别是编目新人)的专业系统培训,提供多种线下线上的培训形式,实时更新编目人员的业务知识,另一方面要实行奖惩机制,通过统计个人差错率等方式对各成员馆编目人员进行绩效考核,考核不通过的编目人员需要继续参加业务培训,重新考量工作岗位。通过培训加绩效考核两方面结合,为联编中心筛选出专业、工作态度认真踏实的编目人员。
前文提到,忽视规范库的建设和使用在一定程度上影响了书目数据质量,在我国,只有国家图书馆等非常少数的几个图书馆重视并在着手规范库的建设工作,其他绝大部分图书馆包括深圳“图书馆之城”的中心馆都未对此项工作引起重视,需要各联编中心转变思维,做好准备,重视并积极参与到规范库建设工程中去。