联编数据库建设与书目数据的质量控制

2011-03-18 03:28:06李春新
图书馆学刊 2011年10期
关键词:标引编目书目

李春新

(国家图书馆,北京 100081)

李春新 馆员

MARC的问世使得联合编目得以实现,网络技术、通信技术的不断发展使联机实时合作编目成为现实。近年来文献编目工作的重心从传统的著录方式向规范控制转移,FRBR概念模型对书目记录更加立体化,对编目工作产生新的影响,因此,书目资源的共建共享应以标准化、规范化为基础。笔者简要论述了我国联编中心的起源、现状,主要针对书目数据中存在的一些质量问题提出几点改进措施。

1 我国图书馆联合编目中心的现状

我国联合编目中心虽然起步较晚,但经过10多年的发展,已取得了很大成绩。以公共图书馆为主的全国图书馆联合编目中心(简称联编中心,即OLCC)和以高校为主的中国高等教育文献保护中心(简称CALIS)在国内已形成花开并蒂之局面。

全国图书馆联合编目中心于1997年10月成立,其宗旨是在全国范围内组织和管理图书馆联机联合编目工作。目前,该中心已拥有用户达1000余家,成员馆600余家,13家分中心,包括台港图书书目数据库在内的20多个数据库,数据量达600余万条。联编中心依靠国家图书馆的丰富资源和雄厚的编目技术力量,使得其编目整体水平较高并具有权威性,在全国范围内起主导作用。

高校图书馆联盟的CALIS,是中国高等教育文献保障体系的两大服务中心之一。秉承“实现信息资源共建、共知、共享,发挥最大的社会效益和经济利益,为中国高等教育服务”的宗旨,致力于CALIS联合目录数据库的建设,并提供相关服务。CALIS建成于1997年,数据约160余万条,目前拥有成员馆470余家,已经形成相对稳定的数据建设队伍,且随着队伍的壮大和用户发展委员会的组建,联机合作编目中心将进一步强化管理、规范运作,更快、更好地为广大用户提供优质服务。

2 联编中心书目数据质量控制的措施

2.1 OLCC书目数据质量控制措施

为确保书目数据制作的标准化、规范化,OLCC编写修订了《中文图书机读目录格式手册》、《中国机读规范格式手册》、《中文图书名称规范数据款目著录规则》、《中文图书规范数据款目著录规则》等,使之成为全国图书馆联合编目中心全体成员馆共同遵守的标准。在上述标准的严格约束下,所有成员馆制作的书目数据逐渐朝着标准化、规范化靠拢,为数据的共建共享奠定了较为坚实的基础。

2.2 CALIS书目数据质量控制措施

CALIS依据有关国家和国际标准,制订了一系列文献编目条例。2000年底为统一成员馆的书目记录,使数据库中的书目数据尽可能达到规范统一,正式出版了《CALIS联机合作编目手册》,2002年又结合中文图书的特点和联机合作编目的要求,编写了《CALIS联合目录中文图书著录规则》等。

OLCC和CALIS作为国内两大联合编目中心,不断提高读者利用文献的效率,实现目录功能的最大化,是其始终奋斗的目标。但是,由于两大联编中心在使用规范、质量控制等方面存在较大的差异,成员馆对下载的数据不得不进行较大幅度的二次修改,从而在我国图书馆界出现了“加入编目中心越多,工作量越大”的现象。有些图书馆虽然加入了某一联编中心,但因为质量控制措施太苛刻,导致无法上传数据,实际上被剥夺了上传数据的权利,影响了数据的更新,有些成员馆质量措施控制不当,造成数据混乱,其他成员馆在分享资源时,将错就错,出现恶性循环。

3 联编数据库书目数据存在的问题

现代信息技术的发展促使图书馆向网络化转型,以国家图书馆为例,任何一位读者都可以通过国家图书馆公共检索系统,选择任意或多个不同的检索途径,检索到要查找的信息。文献检索系统依赖于文献标引的质量,如何将文献标引质量控制在较高的水平上,文献标引的准确性、专指性和一致性,是至关重要的。笔者结合工作实践,针对书目数据中存在的一些问题与同仁共同探讨。

3.1 文献分类标引中存在的问题

文献分类是在主题分析的基础上,按照《中图法》第5版给予一个准确、恰当的号码。分类的准确与否直接影响到检索功能和检索效果,也影响图书馆文献的利用和使用。

例:2001 @a塔的故事

606 0 @a塔 @x简介 @y世界

690 @a K928.75

《中图法》第5版使用手册中规定在没有专类的情况下分到其上位类。在“世界地理”大类中没有“古塔”的专类号,入“古塔”的上位类为“名胜古迹”类,类号为K917。“K928.75”是中国“古塔”的专号。

3.2 文献格式著录中存在的问题

3.2.1 正题名著录中出现的问题

《中文图书机读目录格式使用手册》中规定,文献的正题名信息源为题名页(题名页对面、反面为附加题名页),原则上客观照录。规定信息源有两种或两种以上文种题名时,应选择与图书正文文种相同的题名为正题名著录(即正题名可以是外文)。

例:《Second Language Teaching and Learning》此文献题名页上既有中文题名又有英文题名,正文文种是英文。按照著录规定其书目数据应为:

2001 @a Second Language Teaching and Learning

@d第二语言教与学

@f(英)Divid Nunan著 @g高远导读

5101 @a第二语言教与学 @z chi

同时,100字段中最后的题名语系代码要改为相对应的正确代码。上例中应将100字段的题名语系代码由ea改为ba。有的编目员选择中文题名“第二语言教与学”作为正题名,而把英文题名作为并列题名来著录,这是有悖于著录规则的错误数据。

3.2.2 多卷集系列出版物著录中出现的问题

书目数据库中对于“…白皮书”、“…红皮书”、“…蓝皮书”等皮书系列出版物有不同的著录形式。有的记录将“…皮书”著录在225字段,有的著录在300字段或200字段。如社会科学文献出版社出版的系列图书——《经济蓝皮书》,这套丛书从1992年起每年都以《……年中国:经济形势分析与预测》为题名出版。此书在联编书目数据库中,几乎每一种书由于正题名和丛书名著录的不一致而对应有2~3条不同记录。

例1:2001 @a 1993年中国 @e经济形势分析与预测

2252 @a经济蓝皮书

例2:2001 @a 1993年中国:经济形势分析与预测 @e经济蓝皮书

例3:2001 @1993年中国:经济形势分析与预测,又名,经济蓝皮书

这种对文献题名形式著录的不一致,势必影响文献检索的查全率、查准率。

3.3 文献主题标引中存在的问题

3.3.1 文献主题标引不准确

例1:2001 @a爱上玻璃彩绘

606 0 @a手工艺品 @x制作

690 @a TS973.5@v4

向华杰挥舞着刀子的样子仿佛在镜子中更清晰了,最后,只余下一片刀光的残影,在殷明的眼前挥舞着。“来吧,来吧。”刀光中,似乎有个声音一直在呼唤着。无数次的心理挣扎在他的脑子里激烈交锋着,无数次的试探和想像像幻灯片在他的脑子里不断闪现,无数次的渴求和犹豫被这个声音变得越来越清晰。殷明缓缓地把刀子对着自己右手凸起的筋脉,缓缓地颤抖着刺了下去,一阵痛感突然惊醒了他。血涌了出来,他猛地一甩手将刀子丢进面池。

作为标引的入口词,要考虑到与主题概念的内涵与外延相符的专指词,在没有专指词时,再考虑用上位类词或组配标引,“手工艺品”无论作为主题的内涵与外延都太宽泛,不够专指,读者在主题或关键词的检索中很难查到关于“玻璃彩绘”的文献,正确的主题标引应为:

2001 @a玻璃 @x彩绘 @x技法(美术)

690 @a J52 @v4

例2:2001 @a工程系统可靠性数值分析方法

606 0 @a系统工程 @x可靠性 @x数值分析

690 @a N945.17@v4

本书是关于工程系统可靠性和安全性的定性与定量的基本理论及计算方法的著作,而非系统科学的著作。按《中图法》N949“系统科学在各方面的应用”类目注释:专论入有关各类。所以,文献应分入工程数学类下的“可靠性理论”类目,其正确的主题标引应为:

606 0 @a工程 @x系统可靠性 @x数值分析

690 @aTB114.3@v4

3.3.2 文献主题标引深度不够

由于计算机检索系统具备强大的信息存贮功能和数据处理功能,所以它适于对文献主题进行深度标引。而大多文献因其内容具有的多元性与交叉概念的隐性或局部主题,同样具有标引的价值。如果忽略对这部分主题的标引,不仅使得检索途径简单,同时也失去了计算机存贮功能和检索的真正意义。

例:2001 @a「文明冲突」的背后

606 0 @a伊斯兰教 @x研究

690 @a B968@v4

该文献阐述了伊斯兰教与国际社会的关系以及中东问题的国际化,作为文献的隐性主题“国际政治”与“中东问题”同样具有标引的价值。为了揭示该文献的完整性,主题应标引为:

606 0 @a伊斯兰教 @x关系 @x国际政治

606 0 @a中东问题 @x研究

690 @aB968@v4

690 @aD815.4@v4

3.3.3 文献主题标引的不一致性

主题标引的一致性,是指对同一主题的文献所赋予的检索标识要一致。把主题概念相同的文献集中在同一检索标识下,有利于读者快速、准确检索到他所需要的文献。否则,其一可导致主题检索混乱,使同一主题的文献流失;其二使读者在海量的信息中检索不到符合要求的文献信息,检准率大大降低。

例:2001 @a色史

606 0 @a长篇小说 @y美国 @z现代

690 @a I712.45@v4

《色史》是作者“殉情三部曲”中的一部,在大系统中也是以“三部曲(作品)”为入口词,因此应与大系统保持一致。正确的主题应标引为:

606 0 @a三部曲(作品)@x长篇小说 @y美国 @z现代

690 @aI712.45@v4

4 书目数据标引中存在的问题及对策

4.1 分类标引中要注意的问题

分类标引中出现的错误大致可分为两种情况:其一是标引人员的业务素质欠缺,对《分类法》运用不够熟练;其二是粗心大意所致。作为标引人员应不断加强业务学习,努力提高业务技能,同时还应注重敬业精神的培养,整体素质的提升必然会带动工作上的进步。

4.2 正题名著录应注意的问题

标引人员除了要深刻理解、熟练掌握机读目录格式使用手册外,在遇到系列文献和需要集中著录及分散著录的文献时,一定要谨慎对待,首先要检索数据库有无此文献的记录,如有则按照先前的记录进行著录,以保证数据的一致性;如无此文献记录,可与校对人员商讨,选择正确的著录方式,最大限度地保证数据的质量。

4.3 注重主题标引深度

标引深度不够主要是由于标引人员对文献内容的分析、理解不全面和不深入所致。建议标引人员对文献进行主题分析时,既要重视文献的整体和显性主题的标引,也要兼顾到文献内容的多元性和交叉概念,对具有检索价值的隐性主题和次要主题同样应赋以标识,这样可以提高文献的查全率和查准率。

4.4 选词要注重专指度

主要表现在标引人员对文献的主题概念与词表中主题的外延与内涵的相互关系的转换是否适度,选择主题词要与文献的内容相吻合,有专指词的就不要用组配形式。如:“生命伦理学”是专指词,在标引中就无需组配“生命科学”@x伦理学。组配标引要符合概念组配的原则,避免字面上的组配形式。如果选词过于专指,又影响查全率,因此在实际工作中要把握好这个度。这就需要标引人员熟练掌握运用《词表》,积累标引工作经验。

4.5 主题标引不一致的原因分析与对策

标引的一致性是相对的,非一致性是绝对的。文献内容的主题标识有多种多样,不同的人由于对文献内容的理解、分析、判断不同,从而导致标识的结果有所差异,即使是同一标引人员在不同的时间段对同一文献主题的标引也会有所不同。我们要正视这个事实,采取积极的态度,努力克服造成不一致的主观因素,把主题标引产生的不一致控制在最低限度,提高标引的规范控制。

综上所述,在网络环境下,文献标引工作面临着新的考验,实现联机编目以及资源共享的前提是要以数据质量作保证,提高书目数据的质量,规范化、标准化是当务之急。

[1]徐宁.使用CNMARC格式进行中文图书著录时应注意的细节[J].图书馆学研究,2004(7).

[2]戚文.浅议CALIS联合目录数据库书目质量控制[J].图书馆论坛,2004(1).

[3]姜新年.OLCC、CALIS、CRLNet书目数据质量控制比较分析[J].图书馆学研究,2004(12).

猜你喜欢
标引编目书目
推荐书目《初春之城》
都市人(2022年3期)2022-04-27 00:44:57
国家图书馆藏四种古籍编目志疑
天一阁文丛(2020年0期)2020-11-05 08:28:36
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
粤剧编目整理之回顾与展望
戏曲研究(2017年3期)2018-01-23 02:51:01
本刊对来稿中关键词标引的要求
图书馆编目业务外包发展探讨
河南科技(2014年22期)2014-02-27 14:18:37
本刊对来稿中关键词标引的要求
本刊邮购书目
图书在版编目(CIP)数据
全国新书目(2009年8期)2009-05-22 11:31:16