CALIS联合目录数据库的质量控制
——以贵州省地方文献书目数据为例

2016-06-27 09:34肖乃菲
大学图书情报学刊 2016年3期
关键词:编目字段书目

肖乃菲

(贵州师范大学,贵阳 550001)

CALIS联合目录数据库的质量控制
——以贵州省地方文献书目数据为例

肖乃菲

(贵州师范大学,贵阳 550001)

摘要:从贵州省地方文献的书目数据入手探讨CALIS联合目录数据库存在的数据质量问题,分析了其中的原因,并提出CALIS联合目录数据库提高质量的举措:打破三级编目员资格终身制、实行成员馆级别升降制、构筑本地-区域性-全国性三级质量控制系统等。

关键词:地方文献;CALIS;书目数据;联合目录数据库;质量控制

联合目录数据库是CALIS重点建设项目之一,到2015年3月已积累了近620万条书目数据,其联机合作编目中心(CUCC)的成员馆达1166家[1](截止到2014年4月30日),含五家非大陆用户(澳门科技大学图书馆、哈佛燕京图书馆、韩国教育学术情报院、香港浸会大学图书馆、香港中文大学图书馆)。CALIS联合目录数据库不仅极大地方便了各成员馆的编目工作,而且以实用性强、数据质量高著称于图书情报界。但是,在实际工作中笔者发现该库存在很多问题数据,尤其是地方文献方面更加突出。这些问题数据的存在,不仅不便于各成员馆的联机套录,而且不利于书目数据的规范化和标准化工作,影响到数据库的整体质量,特别是在有非大陆用户存在的情况下,更是有损于我国图书情报从业人员的形象。本文以贵州地方文献的书目数据为例,探讨书目数据存在的质量问题,分析其产生的原因并提出建设性的对策。

1质量问题

1.1存在重复数据

通过CALIS联合目录数据库检索贵州地方文献时,笔者发现该库存在不少的重复数据,违背了数据库采用同种文献仅保留一条书目记录的原则。如《贵州大学》一书,CALIS联合目录数据库中有两条书目记录,记录号分别为CALB0120111078478m和CALB0120111188817m,且两条数据均为最简级记录;又如《贵州经济普查年鉴(2004)》一书也存在两条书目条记录,记录号为CAL 112006150969的数据为完全级记录,记录号为CALB0120111093484m的数据为最简级(次级3)记录;再如《贵州省情:1949-1984》一书,记录号分别为CALB0120111397694m与CALB0120111108462m的书目记录为最简级记录,记录号为CAL 011999013616DE的书目记录为完全级记录。

1.2数据质量不高

1.2.1简单记录数据多

完全级记录是由编目人员依据书目实体编制的数据,也是CALIS提倡成员馆编制的书目数据。完全级记录比较全面地揭示了文献信息,但CALIS联合目录数据库有部分数据缺失了某些字段,给读者检索、馆际互借、文献传递带来了不便,应尽量避免。如近日笔者以“贵阳医学院”为题名进行检索,共出来12条数据,发现11条数据有缺失字段。(见下表1)

表1

笔者选取了常用的必备和有则必备字段制作了上表,可以看出,除了《贵阳医学院图书馆馆藏英文期刊目录》数据完整,仅有一项错误外,表中有9条数据没有主题标引(606字段),7条数据无分类标引(690字段),6条数据无载体形态项(215字段),7条数据知识责任项(7xx字段)标引错误。

1.2.2主题标引和分类标引缺失或不准确

主题标引和分类标引是书目记录中不可或缺的字段,它们不仅反映了文献的主题内容,还是用户检索文献的重要途径。笔者在使用CALIS联合目录数据库时发现606和690字段缺失或著录错误的书目数据长期存在,从未被修改或覆盖。如上表中的10种地方文献,7条同时没有606和690字段,2条没有606字段,《贵阳医学院学报》的606字段著录不完整(606 0#@a医学),690字段缺失@4子字段,正确的著录应为:610 0#@a医学@a高等学校@a学报@a 贵阳690##@aR@v4。缺少著录项目的数据还有《黔南统计年鉴》《贵州科技统计年鉴》《安顺统计年鉴》《贵州外事五十年》《贵阳市科学技术发展简况汇编》《贵州少数民族民间作品选讲》《和谐贵州与残疾人小康建设》等地方文献书目。

1.2.3责任方式著录不规范

责任方式的不规范主要表现在题名与责任说明字段(200字段)的责任方式著录或知识责任块(7xx字段)。如《贵州大学》一书,记录号为CALB0120111078478m的书目数据中的200字段的@f子字段的信息不是来自规定信息源,记录号为CALB0120111188817m的书目数据中缺少主编信息。该书责任方式著录正确的格式应为:

200 1#@a贵州大学@f贵州大学党委宣传部

314##@a前言提:本书主编郑元宁,朱洪波

701 #0@a郑元宁@4主编

701 #0@a朱洪波@4主编

712 01@a中国共产党@b贵州大学委员会@b宣传部@4编

责任方式错误或不规范的书目数据还有《贵州教育年鉴》《贵州宣传工作年鉴》《贵州省情》《遵义民国军政人物》《遵义胜境》《贵州电力年鉴》等地方文献。

1.2.4连续出版物、丛书的著录不规范

连续性出版物未集中著录的现象在CALIS联合目录数据库中比较严重,以《贵州统计年鉴》的书目数据为例,其卷册信息本应著录在010字段的@b子字段,却著录在200字段。《贵州宣传工作年鉴》《六盘水年鉴》等书目数据也是如此。丛书的著录也没完全依照相关规定,同一套丛书中的某一种或几种把丛书名当成了正题名,没有丛编项,如《遵义文史》丛书,有2-3种数据把“遵义文史”著录在200字段的@a子字段,其余大部分著录在225字段。同样的情况还存在于《遵义文史资料》《黔东南文史资料》等丛书的著录中。

1.2.5著录格式不统一

CALIS联合目录数据库中的地方文献数据没有严格按照著录格式编制的比比皆是。如汉语拼音的著录,按规定应著录在@A子字段,可有些数据却著录在@9子字段;连续性出版物的书目记录中,110字段为必备字段,可有些数据却缺失此字段;又如462字段,CALIS不用此字段,建议用410字段,可有些数据的丛编检索点却是462字段;有些数据的指示符也不准确,如团体名称的著录,若是以名称直序方式著录,则71X对应的指示符应为“02”,但个别数据用的是“01”,反之,该用“01”的时候却用了“02”。

2书目数据产生问题的原因分析

2.1编目规则和细则的不一致

目前,国内联合编目机构呈现多中心化态势,仅全国性的就有全国联合编目中心(OLCC)、CALIS联机合作编目中心(CUCC)、中国科学院国家科学图书馆的联机联合编目系统(UNICAT)以及地方版文献联合采编协作网(CRLNet)。此外,一些地方性的联合编目机构也颇具规模:如上海市文献联合编目中心、广东高校文献网(NULOG)。这些机构编制的数据既遵循国际标准书目著录(ISBD)规定和中华人民共和国文献著录标准(GB3792系列),又依据《新版中国机读目录格式使用手册》符合CNMARC格式要求,但是在一些著录细节问题上存在着差异。这些差异并非是由于编目人员的主观认识差异造成的,而是由于各联合编目机构对CNMARC和著录规则等理解的不同并制订了各自的编目规则和细则形成的。正是由于这些差异的存在,导致编目数据的不统一。为保持数据的统一,CALIS要求其成员馆务必依其制定的一系列标准、规则、细则等进行编目,但是在实际工作中,其大多数成员馆同时是两个或多个联合编目机构的成员,制定的编目规则也是综合考虑了多个机构的编目规则和细则。因此,他们上传给CALIS联合目录数据库的数据难免存在不统一的地方,从而影响到整个数据库的质量。

2.2各成员馆疏于质量把控

2.2.1编目业务全外包,导致书目数据无人审核

近年来,图书馆人员不足问题日益突出。为缓解人手紧张状况,编目工作外包便成了各高校图书馆的首选。编目外包固然可以释放图书馆一部分劳动,节约本馆人力资源,但部分图书馆不再设置编目岗,不再对公司数据加以审核的做法直接导致问题数据流入数据库。这样做的结果必然导致数据库中存在大量重复数据和错误数据。

2.2.2追求上传速度和上传数量,忽视数据质量

笔者根据CALIS联机编目中心的统计数据制作了表2。从表中可以看出,两个月共上载了中文数据25310条,如此庞大的上载量说明有上载权限的成员馆都乐于与其他馆分享本馆书目数据,这是一个可喜的现象。而从删除合并量来看,两个月却只有110条,有些三级编目员因为权限的问题,不能修改数据级别比本馆高的问题数据,又不愿及时向CALIS联机编目中心汇报,于是就重新提交一条新的数据,导致了重复数据的存在。而有些图书馆对取得上传资格的编目员每年的数据上载量有硬性规定,庞大的数字导致编目员一味地追求编目速度和数量。如只制作简单的,没有全面揭示文献本身的书目数据;只按照图书在版编目(CIP数据)进行标引和著录,而不分辨CIP数据的正确与否;错误数据不经审核就直接上载等。这些数据一经上载,便严重影响了联机编目库的数据质量。

表2 CALIS联合目录数据增量统计表(2009年5月1日至6月30)[2]

2.3编目队伍不稳定,编目员业务水平和综合素质不高,责任心不强

目前,在图书馆人力资源管理中绝大多数管理者实行岗位责任制,注重对岗位的轮调,这种做法不仅能使馆员熟悉各项业务的工作流程和技能,还能消除工作厌烦感和有助于换位思考,维护和谐气氛。但是对于编目岗位,因其具有较强的专业性和工作经验的积累,频繁地更换人员必然导致工作的连续性衔接性较差、传帮带不到位等一系列问题,直接导致编目质量的急剧下降。此外,有些编目人员责任心不强,工作过程中三心二意,也会导致一些人为的错误出现,如对套录数据鉴别不认真,丛书名该用书名号而不用、题名和责任者的某个字输入错误等。

2.4CALIS联机合作编目中心(CUCC)数据监控管理措施不完善

为实现对联合目录数据库的数据质量进行监控,CUCC成立了专职机构——质量控制组,负责维护数据质量、实施质量评估、制定相关规则和标准等,其成员皆由高校图书馆的资深编目员组成。按照CALIS的设想,每条数据在提交时,服务器都会自动进行查重,发现是新的数据就让其顺利入库,否则就拒绝入库。而对于无法确定的数据,则入人工判重库,交由以质量控制组成员来处理。从理论上讲,此项措施有效地保证了数据的质量。但在实际操作过程中,由于存在着待处理数据量巨大与质控组队伍人员相对不足的矛盾,再加上在无书情况下很多信息无法正确判别以及人员知识面的缺陷性,尤其是对某些地方文献或专业性文献的处理不够精准,很容易造成同一文献因记录内容相异而无法进行数据合并的情况产生,从而影响了数据的质量。

3质量控制措施

3.1各成员馆质量控制措施

3.1.1建立一支较高素质的编目队伍是质量控制的首要因素

编目员的素质直接决定了编目数据的质量,是影响数据质量的最主要因素。因此,要想提高数据的质量,首先要建立一支高素质、高水平的编目队伍。(1)稳定编目队伍。编目工作在很大程度上是一种积累性的工作,实践经验非常重要,特别是对著录规则和细则的理解,需要经过多年认真的学习和实践积累,绝非能速成的。因此保持编目队伍的相对稳定非常必要,避免由于编目人员的调动造成编目数据质量下降。(2)不断加强理论学习,提升工作能力。现有的著录细则和编目细则总是跟不上新学科、新事物的发展,编目人员必须不断加强理论学习,在实践中成长,提升自身能力。同时管理者也要积极指派编目人员参加CALIS组织的各种培训,鼓励有实力的人员参加CALIS三级编目员认证考试。通过参加培训、考试可以促使编目人员认真研究各项规则和细则,积极实践,必然有助于编目水平的提高。(3)增强编目人员的责任心。良好的工作态度,可以促进个人业务知识和技能的开展,发挥无穷的力量和价值,是工作成败的关键性因素,编目人员的工作也是如此。实践证明,只有具备科学严谨、勤奋务实、积极进取、认真自省、理性合作态度的编目人员才能做出高质量的数据。

3.1.2各成员馆必须高度重视编目数据的质量

数据的质量是数据库的生命力所在,是数据库生存和发展的保障,因此各成员馆必须高度重视编目数据的质量。首先,在认识上应摒弃重数量轻质量的传统观念,始终坚持质量优于数量的原则,只有在确保质量的前提下才可以追求数量的提高,否则盲目追求数量,不顾质量,只会制造出更多的垃圾数据,增加数据库的负担,降低数据库的质量。其次,重视数据的校对与审核工作。校对与审核是保证数据质量的重要环节,是数据质量控制的关键所在,可以说是本馆数据质量得到保障的最后一道防火墙。因此,各成员馆应专设校对与审核岗位,负责编目数据的校对、审核和维护。专设的校对与审核岗位应聘请年富力强、业务能力强、经验丰富、具有较强责任心且获得CALIS三级编目员认证资格的编目人员来担任。无论是本馆自编的数据还是编目业务外包的数据都必须经过自校、互校和终校三道工序才能提交,其中终校就由专职校对人员负责,把好最后的质量关。再次,实施绩效考核与奖惩管理相结合的制度。管理者必须对每位编目人员在一段时间内的工作状况进行考核,其结果应作为年度考核的重要依据,对于表现优秀的编目人员必须给予相应的精神和物质奖励,只有这样才能提高编目人员的积极性,激发他们的活力,有助于数据库质量的提升。最后,重视对问题数据的处理。各成员馆提交给CALIS联合目录数据库里的数据总会有一部分是不符合要求的,对于这些不符合要求的数据应按要求、按规则及时修改,并注意总结,尤其是注意容易出差错的细节,并及时通知相关编目人员,尽量避免出现同一问题,只有这样,才能不断提高本馆的编目水平,提升数据的质量。

3.2CALIS的质量控制措施

3.2.1制定统一的编目规则和细则

在全国性的四大联合编目机构中,OLCC与CUCC以其成员馆多、书目数据量大、数据质量高、实用性强著称于国内的图书情报界。面对当前国内编目规则和细则众多,编目数据无法统一的困境,OLCC与CUCC必须牵起头来,联合其他的联合编目机构,打破条块分割的樊篱,取长补短,既要遵循编目工作的规律又要兼顾其发展趋势,编制统一的编目规则和细则,并以国家标准的形式规定执行。唯有如此,才能真正解决当前编目规则和细则多头化的问题,实现书目数据的统一和资源的共建共知共享。

3.2.2加强对联合编目人员的管理

数据库的质量与编目人员的素质密切相关,加强对编目人员管理,提高他们的职业素质和业务素质有助于数据库质量的提高。(1)加强对联合编目人员的培训。业务培训与指导是CUCC重点工作之一,每年都要在全国各地举办多场培训,为成员馆培养了大批高素质的编目业务骨干。略显不足的是这些培训的对象以未获得CALIS三级编目员资格认证证书的编目员为主。笔者认为,CUCC除了对未获得证书的编目员进行培训外,更应注重对已获得证书的编目员进行培训,尤其是在当前国际上普遍采用RDA规则进行编目的情况下更为迫切。只有通过不断地培训学习,才能造就一支高、精、深的专业队伍,数据质量才能得以提升。(2)严格实施编目员资格认证及数据提交制度。编目员认证制度是CUCC为提升编目人员业务素质,扩大数据来源,提高数据质量而实施的对编目员业务知识和联机操作能力进行检测、评估的一种方式[3],只有参加了CALIS中心举办的业务培训班并获得结业证书的成员馆工作人员才有资格参加编目员资格认证考试。只有获得认证的编目员才有资格提交数据到CALIS联合目录库。对提交上来的数据,质量控制组应定期进行评估,辅之以不定期的抽查。检查结果不合格者,应重新审查其编目员资格,防止有的馆一人拿证多人使用这一恶劣现象的发生。编目员资格也不能实行终身制,应该定期考核,考核不合格者将会被削减部分权限甚至失去编目员资格。

3.2.3建立科学的质量控制体系

CALIS联合目录数据库是由具有上传数据权限的成员馆提交的数据组成,对其进行质量控制实质上是对具有上传数据权限的成员馆进行监控,因此需要建立起科学的质量控制体系。(1)实行成员馆级别升降制。目前,CUCC依据成员馆的编目数据质量和使用方式将其划分为A、A-、B+、B、C、D、Dr、R、S1、S3和非大陆用户等级别[4],分别授予不同的数据处理权限,同时履行相应的义务。笔者认为,中心应制定细则,定期考核各成员馆,并在具体实施过程中引进竞争激励机制,依据评估结果实施升降级别制,这样有助于提高各成员馆的工作积极性,更好地控制数据质量。这种措施也让非985、211高校图书馆有了晋升B甚至B+级馆行列的机会。(2)上载流程控制。CUCC要求具有上传数据权限的各成员馆严格执行“数据经过校验后才能入库”的数据上载模式,这是典型的人工质量监督,有效地保障了数据库的质量。但是,笔者认为CALIS联机合作编目中心应该进一步完善系统,能精准地评判重复记录并减少进入人工干预库的数据数量。(3)实施不定期的数据质量评估。规范数据库管理工作的一项重要措施就是对其数据进行质量评估。为加强数据质量控制,CUCC于2002年专设评审委员会,依据其颁布的一系列规则和细则,从统计数量评估、书目质量评估、专家印象和问卷调查四个方面对所有的B+和 B级以及部分C级共42个成员馆进行了评估。可以说,此次评估效果非常明显。遗憾的是,自此以后CUCC再没组织过类似的评估。笔者认为,尽管评估需要花费大量的时间和精力,但是仍有必要继续执行下去。因为通过评估,不仅有助于CUCC及时了解各成员馆的情况,发现管理工作中存在的问题,提供更优质的服务;同时也是成员馆之间进行横向比较,找出差距,改进工作,提高质量的平台,意义十分深远。

3.2.4改革内部机制,构筑本地-区域性-全国性三级质量控制系统

省中心、地区中心在CALIS三级服务体系中处于中转枢纽的地位,是CALIS与成员馆之间联系的桥梁和纽带,承担着宣传和推广CALIS服务和应用的重任。在成立初期,由于受到人手不足等因素的制约,省中心、地区中心往往承担着“传话筒”式承上启下的作用。经过几年的发展,各省中心、地区中心的实力都有所增强,理应在CALIS建设中发挥更重要的作用,积极参与联合目录数据库的建设就是途径之一。省、地区中心可建立各中心书目数据库,作为全国中心的二级记录库。还应从本省、本地区的编目人员中选拨一批业务能力强、编目经验丰富并具备CALIS三级编目员认证资格的人员组建省或地区编目中心,组成数据质量审核的兼职队伍,对本省、本地区的成员馆所提交的数据进行一次、二次审核,审核合格的存入本中心二级记录库,再提交给CUCC的质量控制组进行终审,审核不合格的直接退回成员馆指导其修改。形成本地-区域性-全国中心的三级审核制度,不仅能减轻CUCC质量控制组的工作量,缓解其人员不足的矛盾,充分发挥各省中心、地区中心在处理地方文献、专业性文献上的优势,而且有助于本省、本地区编目人员的合作与交流,提高他们的业务能力和工作效率。通过层层审核的编目数据,其质量必然会得到有效的保障。

参考文献:

[1] CALIS联机合作编目中心简报[J].联机合作编目中心简报, 2015(1).

[2] CALIS联机合作编目中心简报[EB/OL]. 2009(3).http://project.calis.edu.cn/calis/lhml/jianbao/34/2.htm#2.

[3] 喻爽爽.CALIS联机合作编目服务体系[J].数字图书馆论坛, 2013(1):37-46.

[4] CALIS成员馆清单[EB/OL].http://lhmlcalis.edu.cn/calis/lhml/lhml.asp?fid=FA04&class=4.

(责任编辑:傅正)

On the Quality Control of CALIS Online Union Catalog Database ——A Case of the Local Documentation-bibliographic Data in Guizhou Province

XIAO Nai-fei

(Guizhou Normal University, Guiyang 550001, China)

Abstract:This paper, taking the local documentation-bibliographic data in Guizhou Province as an example, analyzes the existing data quality issues and causes of CALIS Online Union Catalog Database, and puts forward to improve the quality of CALIS Online Union Catalog Database from the aspects of abolishing the system of lifelong tenure of the third class catalogers, carrying out the promotion and demotion system among the member libraries, building the system of three-level quality control of local-regional-national and so on.

Key words:local literature; CALIS; bibliographic data; Online Union Catalog Database; quality control

作者简介:肖乃菲,女,副研究馆员。

收稿日期:2015-11-03

中图分类号:G254.34

文献标识码:A

文章编号:1006-1525(2016)03-0078-06

猜你喜欢
编目字段书目
图书馆中文图书编目外包数据质量控制分析
推荐书目《初春之城》
国家图书馆藏四种古籍编目志疑
粤剧编目整理之回顾与展望
CALIS联机合作编目中的授权影印书规范著录
图书馆集成管理系统在藏文图书编目中的比较研究——以ILASII和GDLIS为例
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述
关于CNMARC的3--字段改革的必要性与可行性研究
本刊邮购书目