提高图书馆OPAC检索效率的策略

2009-10-13 03:29何俊伟
现代情报 2009年8期
关键词:策略

董 莉 何俊伟 斯 芸 刘 蓉

〔摘 要〕指出当前图书馆OPAC书目系统检索效率低的原因主要是由于MARC数据著录中存在问题,并对造成数据质量问题的原因进行分析,最后提出改善图书馆OPAC检索效果的对策。

〔关键词〕图书馆OPAC;MARC数据;检索效率;策略;检索点

〔中图分类号〕G252.7 〔文献标识码〕A 〔文章编号〕1008-0821(2009)08-0166-03

Strategies of Improving Literature Search Efficiency by Library OPAC SystemDong Li1,2 He Junwei2 Si Yun2 Liu Rong2

(1.School of Information Management,Wuhan University,Wuhan 430072,China;

2.Library,Dali University,Dali 671000,China)

〔Abstract〕This paper pointed out the cause of document search with lower efficiency through OPAC system and analysed the problems of MARC data,and finally put forwards the measures of improving literature search efficiency by library OPAC sys tem.

〔Key words〕library OPAC system;MARC data;literature search efficiency;strategies;access point

OPAC是英文 Online Public Access Catalogue 的缩写,即联机公共检索目录,是供图书馆读者查询馆藏资源的联机目录检索系统。它改变了过去利用卡片目录手工检索馆藏文献的状况,通过计算机网络对馆藏的信息资源进行检索,是现代图书馆检索信息资源的重要工具。

OPAC作为图书馆计算机集成管理系统的核心组成部分,集中体现了图书馆文献组织的成果。它不但是图书馆开展各项工作的基础和前提,同时也是现代图书馆向读者提供馆藏书目查询最重要的途径和网络服务项目之一。它的检索功能是否强大,显示的内容是否全面,很大程度上影响到用户对图书馆的评价和馆藏资源的利用率和保障率。

但是,读者通过OPAC进行馆藏资源查询时,检索效果却常常不尽人意,不是检索出大量无关结果,让人难以选择;就是返还结果为“零”,让人十分沮丧和失望。造成误检、漏检的结果有多方面的原因,如集成管理系统本身也存在一定的原因。本文则主要从MARC数据制作方面的问题来探讨造成误检、漏检的原因,这是导致书目数据库混乱和OPAC系统检索效率低的最主要原因。

1 MARC数据著录中存在的问题是造成图书馆OPAC检索效率低的主要原因

图书馆的书目数据库是由无数条MARC记录构成的,MARC即Machine-Readable Catalogue,机器可读目录,是现代图书馆利用计算机组织文献的手段。如果其数据制作中存在问题,将直接造成图书馆目录体系的混乱和读者的误检和漏检。以下是目前图书馆MARC数据著录中存在的主要问题。

1.1 MARC格式中重要字段著录的遗漏

所谓重要字段,主要是指题名、著者与主题词等这些读者检索中最常用的检索途径[1],未在MARC格式中相应的生成这些检索点的字段进行著录,结果是读者通过OPAC检索时查不到这些书,极大地影响了图书馆文献资源的流通和利用,降低了文献资源的保障率。

如CNMARC格式中,有的图书馆在遇到并列题名以及其他多种题名(封面题名、书脊题名、丛书题名、原文题名等)时,仅仅只在“200题名责任”字段做版权页的正题名,而没有在4-5这些能够生成检索点字段进行相应其它题名的著录或字段的复制,导致目录的检索功能大为降低。例如,“英文原版教材”是一个重要的检索词和检索途径,但是在大理学院的OPAC检索中,无论用“题名”还是“文献名”检索项,均不能检出一本,其实该馆有不少这方面的藏书。漏检的原因是:“225丛编项”字段是对文献丛编的客观性描述,它本身是不可检索的,其检索点形式记录在连接款目410字段和461字段[2]。如果数据中遗漏4-字段的著录,就不能检出以丛书名为检索词的文献。所以,未进行生成检索点字段的著录就造成了漏检。

1.2 MARC格式中字段著录的混乱和错误

如翻译者的字段著录,有的著录在“701人名等同”字段,有的著录在“702人名次要”字段;还有的在著录生成检索点的字段701的外国著者时,人名前加上国名,或原文姓名不进行倒置等等,都导致目录汇聚同一责任者文献的功能减弱,造成读者从著者途径检索时查不到某一著者的大量著作。比如,用大理学院图书馆的OPAC检索英国著名女作家J.K.罗琳(J.K.Rowling)(《哈利•波特》系列书作者)的著作,在“作者”项进行馆藏书目的查询,返还的4个结果没有一个是《哈利•波特》系列书之一,而是中国人名为“罗琳”主编的书,或是美国的“罗琳斯”的著作;用作者原名“Rowling”检“中文图书”,则返还结果为“零”,其实该馆收藏了不少此作家的《哈利•波特》系列书,用翻译名“罗琳”检索不出的原因是因为在“701人名等同”,这个生成检索点的字段,著录为“(英)罗琳”, 加上了国名;并且因为没有复制一个“701人名等同”字段来著录作家的原名“Rowling”,就造成了以上漏检的结果。

1.3 MARC格式中字段指示符使用的不正确

如“200题名责任”字段的指示符1是题名检索意义指示符,当它取值0时,表明本字段的题名信息(@a)不作检索点,当它取值1时,本字段的题名信息(@a)才能作为检索点。但是在套录编目时,编目员往往不注意此处的指示符,也会对检索造成问题。

1.4 多余的MARC数据

是指完全相同图书却有2条或更多的MARC数据,如,查大理学院图书馆的金盘书目检索系统,《鹿苑长春》有3条MARC数据记录,其实这3条记录都指向同一本书,索书号也完全相同,都是I712.45/6014;有时,多余的MARC数据还存在或分类号的不同,如《药用高分子材料学》有2个号:R94/8727和TQ31/8727;或区分号的不同,如《现代英语惯用法简明词典》:H316/2124和H316/2124/1982。以上这些情况造成了书目数据库的冗余庞大、读者检索的噪声、分类查重工作的障碍以及编目员的无所适从。

此外,MARC格式著录中还存在其它问题,如录入文字的错误、无法调出的字忽略不著录且不加任何说明、随意添加空格以及全角/半角、英语/汉语等不同情况下不加注意的著录等,都会影响到书目数据的规范和质量,造成读者检索时的漏检和误检。为了避免这些问题的出现和找到针对性强的解决策略,有必要对其产生的原因进行分析。

2 书目数据存在问题的原因分析

2.1 突击加工,无暇顾及MARC数据质量

比如说,高校图书馆为了迎评,要达到评估指标对纸质图书的数量要求,必须在短期内购入大量的图书。在分编任务繁重的情况下,只能追求分编、套录工作的速度,赶进度的结果是无暇顾及书目制作的质量问题。

2.2 编目规则的滞后

首先,由于我国图书著录标准发展滞后,致使制作编目数据的机构和书商各行其是,这是造成著录标准不统一、著录内容不规范的主要原因之一。其次,著录规则源于编目实践,某些具体规定只能不断从编目实践中总结、提升[3]。这样著录规则落后于编目实际,就导致了数据的不一致现象。

2.3 编目规则的变动和缺乏可操作性

首先,为了适应科学技术发展引起的出版物变化,文献的分编规则只能不断的修订、改动;其次,所有的分编规则都不可能囊括实际分编工作中遇到的各种具体现象,并进行具体的操作指导。此外,分编规则本身也不是完美无缺,也存在制定的规则前后矛盾或不统一等现象。这在某种程度上导致了馆藏书目数据的混乱。

2.4 分编人员专业水平的局限和对分编规则的理解各异 实际编目中,由于各个分编人员专业知识水平高低不同,看问题的角度不同,自然对规则的理解也各不相同,往往会出现对同一文献的描述、著录不一致。

2.5 缺乏专门人员进行数据维护

从实际工作的角度说,由各类人员编制的书目数据存在问题是必然的,就是再仔细、责任心再强、专业知识再多的人,也不可能保证制作的数据完美无缺;加上回溯建库、突击加工、多馆合并、规则变动等种种客观因素和条件限制,致使书目数据库存在各种问题,而且这些问题只能在投入流通使用之后才逐步显现出来。如果对出现问题的数据缺乏专门人员及时修正、进行维护,那么,越往后书目数据库的混乱现象会更加严重。

2.6 对院系资料室的共享数据缺乏指导

高校文献资源实行共享后,各系、院资料室所藏文献的MARC数据就纳入了图书馆的OPAC检索系统。因为这部分资源的书目数据一般由系、院资料员制作,他们的分编知识自然不能和专业的图书馆员相比,而图书馆又常常忽略对其进行专业上的指导,所以,数据出现问题的可能性较大,这也是造成书目数据混乱的一个因素。

3 提高图书馆OPAC检索效率的策略

提高OPAC检索效率最根本的方法,是保证每一条新做的MARC数据都以较高的质量进入书目数据库,并且还要对历史遗留的问题数据记录进行修改,理顺整个目录体系,才能让读者通过图书馆的OPAC进行高效率的检索,获得较高的查全率和查准率,提高读者满意度和馆藏资源的利用率。

3.1 分编人员应牢固树立“从读者检索的角度”进行文献编目的意识 机读目录与传统的卡片目录相比,最大的优势在于通过MARC格式的字段著录能提供更多的检索途径,其强大的检索功能是卡片目录远不能及的。但是,要发挥好计算机检索的优势,前提是分编人员必须牢固树立“从读者检索的角度”进行文献编目的意识。站在读者检索的角度对文献进行描述要求我们:进行文献编目时务必注重生成检索点字段的著录;在客观著录原则与读者检索习惯冲突时,选择读者检索习惯用词作为检索点入口词进行著录。

增强书目的检索功能,为读者增加更多更有用的检索点,也是近年来盛行于国际编目界的观点,如《FRBR》(《书目记录的功能需求》)和《the Statement of International Cataloguing Principles》(《国际编目原则声明》,俗称法兰克福原则)等国际编目规则条例,主张将目录功能扩展到发现、识别、选择、获取和导航[4]。

3.2 制定详细的分编规则

由于分编规则的滞后、变动、缺乏可操作性以及各馆服务对象、学科设置的不同、藏书组织的具体性和分编人员的变动性等原因,制定适用于本馆计算机软件的分编细则很有必要,有助于规范来源不一、质量参差的套录数据,保证数据制作的质量。

3.3 重视分编人员专业技能的培训,提高书目制作质量 只有具备较高专业素质的人员才能保证书目制作的质量。尤其是面对当今日新月异的信息技术以及国内外编目理念的变化,更应注重对分编人员进行专业技能的培训,这是提高编目数据质量的重要保证。

3.4 注重收集实际使用中的错误数据,并设专人进行数据维护 由于编目数据存在错误的不可避免以及当时不易发现,只能通过读者的查询和图书馆的各项服务工作来检验和发现,所以各服务部门应注意收集和记录平时使用中的错误数据,并且图书馆应设专人进行数据维护[5],其职责是对新入库的MARC数据进行审校和对反馈回来的错误数据进行修改。此外,此人还负责对系、院资料室的文献分编进行指导。这样有利于达到优化数据、理顺目录体系、提高OPAC检索效果的目的。

3.5做好规范控制工作

规范控制(Authority Control),又称为权威控制,是为确保标目(检索点的形式)在检索款目及书目系统中的惟一性和稳定性,而建立、维护、使用规范款目和规范文档的工作过程[6]。这是从根本上提高OPAC检索效率的手段。我国编目界这方面的工作比较薄弱,一贯重视对文献进行客观描述,而忽视文献之间的横向关联,导致存在大量同书异名、同名异书、同人异名、同名异人的情况[7],极为影响检索的效率和准确率。我国应尽快建立如美国LC[8]那样供所有图书馆共享的规范记录数据库,这将有利于各图书馆做好规范控制工作。プ苤,我们应充分利用计算机管理系统的优势,不断提高MARC数据制作的质量,尽量完善各个有价值的检索点,确保能从每一个可能的角度和途径检索到文献,为读者提供高效率的OPAC检索,提高图书馆文献资源的利用率。

参考文献

[1]王绍平,汤莉华.OPAC vs搜索引擎——从上海交大看我国高校师生的信息获取行为[J].大学图书情报学刊,2008,(2):63-68.

[2]陈立红.从检索角度谈410字段和461字段的著录规则[J].晋图学刊,2005,(6):49-51.

[3]文榕生.文献编目再论[J].中国图书馆学报,2007,(3):103-106.

[4]胡小菁.“国际编目原则声明”研究[J].大学图书馆学报,2005,(9):57-59.

[5]孙秀娟.现代图书馆的数据维护[J].航海教育研究,2006,(1):107-109.

[6]黄俊贵.规范控制概说[J].高校图书馆工作,1999,(3):1-8.

[7]冯亚惠.我国图书馆目录规范控制的分析研究[J].图书情报工作,2007,(8):102-104.

猜你喜欢
策略
基于“选—练—评”一体化的二轮复习策略
几何创新题的处理策略
例谈未知角三角函数值的求解策略
我说你做讲策略
“我说你做”讲策略
数据分析中的避错策略
高中数学复习的具体策略
“唱反调”的策略
价格调整 讲策略求互动
2016年理财策略——少折腾