李美红
〔摘 要〕文章分析了广州大学城六所高校图书馆及CALIS的书目数据,以中国古代帝王的名称规范和名称主题为例,探讨我国高校图书馆在规范控制方面普遍存在的问题,及其对书目利用效益的不良影响,指出主题词表与标目法选词不一致是重要原因之一,并提出相关对策。
〔关键词〕规范控制;名称规范;名称主题;书目利用;高校图书馆;CALIS数据
〔中图分类号〕G254 〔文献标识码〕A 〔文章编号〕1008-0821(2009)03-0107-05
1 书目的检索利用效益与文献资源的利用是密切相关的
我国高校图书馆每年都投入巨额资金用于购置各种文献资源,包括中外文数据库和纸质文献,但是现实中的利用情况,包括本校读者利用和各校相互之间的共享利用情况,并不那么令人乐观。究其原因,书目信息的挖掘和利用是其中极为关键的因素。一直以来,各个图书馆都投入了不少人力和物力,用以编制或购置各种书目,但是,对书目的检索利用和效益等方面,历来缺乏系统全面的、有针对性的研究。
书目的检索利用效益研究应该包括多个方面。比如检索系统功能、读者素养以及书目数据的质量与组织。笔者认为,规范的书目数据及相关的规范控制工作是书目利用效益的基本保障,是提高文献利用率的基础。由于篇幅所限,本文仅探讨书目数据规范这一方面。由系统提供的某一检索途径入手,相关文献的查全率应该是其中最为基础的、最为重要的一个方面。
2 案例及分析
2.1 案例对象的选取
广州大学城10所高校中包括了各种类型的高校:重点综合性、理工类、师范类、艺术类、医药类、地方综合性等高校。这10所高校可以说是我国高校的一个缩影,本文选择了其中最有代表性的中山大学(以下简称中大)、华南理工大学(简称华工)、华南师范大学(简称华师)、广东外语外贸大学(简称广外)、广东工业大学(简称广工)、广州大学(简称广大)这六所进行了研究。众所周知,CALIS数据在我国高校图书馆中有着非常重要的影响,所以笔者在选择广州大学城这几所图书馆书目数据的同时,也将CALIS中心的书目数据作为研究对象,以期在一定程度上较完整地反映我国高校图书馆的书目检索利用效益现状。
由于中国古代帝王有本名及谥号、帝号、庙号、年号等多种称号,在作为个人名称标目或个人名称主题处理时,则必须统一、规范,才能保证相关文献的查全率。与其相关的书目数据较能体现图书馆在名称规范和名称主题方面的工作,以及相关文献的查全率,可在一定程度上反映书目数据的利用效益。在这里我们选择了大名鼎鼎的朱元璋与乾隆皇帝,对他们的相关文献的著录与标引情况进行研究。各馆数据情况如何,我们来看以下两组案例。
2.2 案例一
朱元璋(庙号太祖、年号洪武)。根据《中国分类主题词表》(以下简称《主题词表》),其规范的名称主题是朱元璋[1]。另一方面,根据《中国文献编目规则》(第二版)中标目法(以下简称《标目法》),唐以后历代王朝,以帝王庙号为标目,但如果帝王的本名比其他称号更为著称,可以本名为标目。明太祖的本名为朱元璋,较其年号洪武、庙号太祖知名,应用本名为标目[2]。实际上,第一版的《中国文献编目规则》标目法规定也是如此。
2.2.1 以主题词作为检索点
表1显示:
(1)6所高校图书馆与CALIS情况相似,3种形式基本上都有选用。其中,用朱元璋作主题词的书目占了七八成之多,只有一小部分数据选择了明太祖或洪武皇帝。可以说,大部分书目数据的个人名称主题词选择是正确规范的。
(2)将各馆所得的3项结果在本馆范围内进行对比,基本上不存在吻合记录。在CALIS数据的3项结果中,“朱元璋”与“明太祖”的、“明太祖”与“洪武皇帝”的结果分别吻合1条记录。原因是编目员在同一条书目数据里,同时在600@a个人名称主题字段和610@a非控主题词字段著录2种形式。
(3)记录的字段主要是在受控的600@a字段,极少数是著录在非控的610@a字段,包括按规则实际上应该是非控主题词的“明太祖”和“洪武皇帝”。这说明在著录过程中,有些馆并没有严格依照《主题词表》来确定受控的个人名称主题,还是带有一点随意性。著录在600或610字段,对当前的检索结果影响不大,但是,从编目理论及OPAC系统的长远发展来看,这种不够规范的数据,还是有可能对数据的整合及资源的共享产生不良影响。
总的来讲,用上述3者中的任何一个作为主题检索词,都会产生漏检。选用朱元璋能达到七八成的查全率,其次是洪武皇帝,最低的是明太祖。
2.2.2 以责任者作为检索点
在CALIS中文图书著录细则说明中,特别强调个人名称在600@a主题词字段应是规范的检索点形式,并要求与70X@a标目字段保持一致。
表2显示:
(1)6所高校馆与CALIS数据情况类似,名称标目均出现了较为明显的偏差。数据最为集中的是明太祖,而不是《标目法》规定的朱元璋。结果显示,要想查全作者为朱元璋的文献,在上述多数馆都得用2种不同名称进行检索。比如在中大、华师和广大馆,都得分别用责任者“朱元璋”和“明太祖”进行两次检索,才能保证查全率。而在CALIS,则还要加上“洪武皇帝”。
(2)另外,将各馆所得的3项检索结果在本馆范围内进行对比,不存在吻合记录。
(3)分析通过责任者“明太祖”检索得出的书目,在200字段基本上都著录有“明太祖”。依照编目规则,200字段一般依文献著录信息源著录。
这些情况表明,编目员在工作中没有严格依照《标目法》,而是偏重于忠实文献信息源,忽略了数据的规范与统一。由于没有相关的参照指引系统,书目的查全率肯定是差强人意的,相应地,文献的查全率也是不能令人满意的。
让我们再来看看下一个案例。
2.3 案例二
清代第六代皇帝乾隆皇帝也是老少皆知的历史人物,本名爱新觉罗•弘历,年号乾隆,庙号高宗,依据标目法,规范的名称标目为清高宗。但是,依据《主题词表》,其规范名称主题词却是乾隆帝。
2.3.1 以主题词作为检索点
表3显示:
(1)每个馆选用的主题词最少有2种:乾隆皇帝、乾隆帝。在《标目法》中被选作规范标目的“清高宗”,只有4家馆少量选用,其本名弘历则很少采用。
(2)仅仅一字之差的前两者占了大多数,而且这两者之间,在各馆的“排行榜”上进行的斗争非常激烈,作为规范名称主题词的“乾隆帝”也只是略占上风而已。如用主题词“乾隆帝”在中大OPAC上检索,查全率可达61.54%,在华工则是“乾隆皇帝”的查全率可达66.67%。相比表1中朱元璋在各馆普遍高达七八成的查全率,拥有更多称谓的乾隆皇帝,其主题词途径查全率明显偏低。
这再次表明,编目员在确定主题词时,带有一定的直观性、随意性,或是凭印象,而不是严格依照《主题词表》。如前所述,在没有相关的参照指引系统支持的情况下,书目信息的检索利用效率可想而知。
2.3.2 以责任者作为索点
表4显示:
(1)除了《主题词表》选定的乾隆帝较少用作名称标目外,乾隆皇帝、弘历、清高宗在各馆均有一定程度上的采用。结果表明,在中大、华工、广外馆及CALIS数据中心,要查全乾隆皇帝作为责任者的文献,必须分别用“乾隆皇帝”、“弘历”和“清高宗”进行3次检索,这比起例一中的情况更为复杂。其中,中大的数据显示,个人名称规范词“清高宗”占了76.47%,其查全率居榜首。其次,CALIS的比较集中在“弘历”,占65.88%。但是,依照《CALIS联合目录规范控制过程详细说明》,明、清皇帝,以“年号+皇帝”作为标目的名称部分。而且,弘历既不是《标目法》规定的规范标目,也不是《主题词表》规定的名称主题词。
(2)将各馆所得的各项检索结果在本馆范围内进行对比,不存在吻合记录。
(3)与例一情况相似,检索得出的书目信息显示,200字段的责任者名称形式与70X@a名称标目形式基本对应。再次表明,编目员的规范意识不够,偏重于依据文献著录信息源,对名称标目的规范形式没有重视。
表3和表4对比,可发现一个有趣的现象:《标目法》指定的个人名称规范“清高宗”很少被用作个人名称主题词,相应地,《主题词表》指定的个人名称主题词“乾隆帝”则很少被用作个人名称标目。这与CALIS著录细则中的要求明显是背道而驰的。
在没有相应的参照指引系统的情况下,同一人名称标目形式多样,对书目信息的查找与文献的利用而言,绝对不是件好事。更麻烦的是,同一人的名称主题词形式与名称规范形式还不一致,这不仅给编目员在标引时增加了工作难度,也给读者检索带来不必要的困扰。极不利于书目信息的规范化、标准化及其开发利用。
3 研究结果
3.1 存在的问题
通过分析上述4个表格,我们可以发现,上述6所高校馆与CALIS数据,在对个人名称进行著录和标引时,情况大致相同,说明这六所CALIS成员馆的书目数据确实深受CALIS的影响。普遍存在以下几个问题:
(1)关于同一实体的名称标目不统一,存在多种形式,同一馆之间、不同馆之间都存在这种问题。
(2)关于同一实体的名称主题不统一,存在多种形式,同一馆之间、不同馆之间都存在这种问题。
(3)关于同一实体的名称标目与名称主题不统一,同一馆之间、不同馆之间都存在这种问题。
(4)关于同一实体的名称形式越多,通过单个名称形式为检索词所得的查全率越低。
上述这几个问题,都直接影响各馆书目信息的检索与利用,对大学城文献信息资源的整体开发和利用也是一个障碍。在书目的手工年代,编目员还会考虑到为名称的不同形式作参照和引见,以方便读者查找,保证查全率。到了计算机管理普及的今天,普遍在一款书目里只选择一种名称形式作为检索标目,在当前各高校普遍没有名称规范文档及相关的参照指引系统的情况下,导致相关文献的查全率下降,极不利于书目信息的利用,也直接影响文献资源的开发和利用及各馆之间的资源共享。规范有序的书目数据可起到知识地图的作用,为读者查找各种所需的信息,提供高效率的指引,与此相对应的是,缺乏规范控制的书目数据制造的麻烦,恐怕也不能令人乐观。
3.2 造成这些问题的主要原因
3.2.1 没有确定权威的关于名称标目的选取规则
关于名称标目的选取,国内存在多种指导性规则,但一直没有权威的参考书得以全面推广施行。《标目法》虽然是号称“中国文献编目规则”中的一部分,实际上并没有得到全面贯彻与执行。各馆与CALIS明显没有严格依照执行。例如明太祖朱元璋,各馆根据各自制定的编目细则,选择了不同工具书作为参考依据。《标目法》有特别说明,认为其本名比其庙号更为知名,规范名称应为“朱元璋”。然而,有的馆依据《辞海》,选择“明太祖”,有的馆依据张明东的《古代帝王名称规范表》,认为明代帝王以年号为人所熟知,应用“洪武皇帝”作为规范名称。没有确定权威的、统一的工作指导用书,何来规范统一的数据?这应该是名称标目选取不一的重要原因。
3.2.2 编目员的规范意识明显不够
整体而言,编目员的规范意识明显不够,有时比较随意。例如名称主题“乾隆帝”与“乾隆皇帝”之间,虽然只是一字之差,却是规范与非规范的差别,而编目员在标引主题词时,有时会凭借文献上的相关信息和个人的直观印象,选择“乾隆皇帝”,而不是通过查找《主题词表》来确定。在处理名称标目字段时,则明显偏重于客观著录。如文献著录信息源上显示为弘历,就著录为70X@a弘历,如果著录信息源上是“乾隆皇帝”,就著录为70X@a乾隆皇帝。另外,现在的计算机编目系统比较先进,普遍都可设置成存盘时根据7XX字段自动生成200的责任者相关字段。所以,在某些编目员的意识里,常常会忽略这两个字段的不同要求(按规则,200的责任者相关字段强调依据文献信息源如实著录,7XX字段则必须是名称的规范形式),下意识地就跟随了文献著录信息源提供的形式,而将名称规范的要求抛在脑后。
3.2.3 《主题词》与《标目法》的选词不一致
这也是导致数据混乱的重要原因之一。在CALIS的著录细则说明中,特别提到个人名称在作为名称主题时,应与其名称规范形式保持一致。而实际上,《主题词表》与《标目法》关于同一个人而选词不一致的,并不只是极个别现象。请看表5:
表5显示,两者在中国古代帝王的本名和庙号之间,展开了拉锯战。双方各自选择自己认为某个帝王最为世人所熟知的称呼形式。而实际上,作为名垂千古的帝王,不少人的本名和庙号、都是世人所耳熟能详的。比如李世民和唐太宗,很难确定哪个称呼更为世人所知。两者存在不一致的地方,表5只是列举了中国古代帝王中的一部分,其它关于同一实体的名称规范与名称主题存在不同形式的情况,本文就不再一一列举。
而作为有着重要影响的CALIS,在其业务指导文件《中文文献规范控制原则》中,建议按其所列的顺序优先选择参考工具书,来确定不太熟悉的名称。其中,《主题词表》仅排在第五位。另外在中国古代帝王名称部分,特别提到可参考张明东一书。
这些客观环境在无形中增加了编目员的工作难度与压力,令编目员无所适从、思维混乱,就是同一编目员在不同时间也容易做出不同的选择。
3.3 解决的措施
3.3.1 进一步加强规范控制工作
图书馆编目界应树立以读者为中心的书目服务意识,重视规范控制的一系列工作。如前所述,各馆各编目员在处理书目数据时未能将同一实体的名称标目都统一采用某种形式,同样地,读者在检索时,也不可能都直接统一用某种名称形式来查找某一实体的相关文献。
换个角度分析一下,假如编目员的名称标目都统一了,比如在标引名称标目乾隆时,不考虑文献著录信息源提供的形式,都统一标引为规范名称“清高宗”,而在OPAC没有规范文档连接的情况下,读者根据文献题名页上出现的名称形式“弘历”,又如何能找到所需文献?所以,编目界应重视书目信息资源的实际效益,而不只是闭门造车,埋头苦干,不问结果。
规范控制(Authority Control)可以将同一检索点的不同表示方式之间建立起联系,保证查全率与查准率[3]。它是通过查询规范文档来维护书目记录中标目的惟一过程,其核心是要有规范文档。IFLA于2005年公布《规范记录的功能需求》(英文简称为FRAR),其草案文件中明确指出了规范文档的5个作用:记录编目员的各种决定;作为参考工具;控制检索点形式;支持检索书目文档;连接书目记录和规范记录[4]。目前我国的国家图书馆的书目数据已经基本实现了这5种作用,截至2005年底,其中文名称规范记录已有60万余条。CALIS也在2003年9月启动规范数据库建设项目,2004年8月建立联机规范系统实验数据库,目前已建立466 740条中文个人名称规范记录,据称试验库中已实现书目控制及检索控制的基本功能[5-6]。只是笔者在其OPAC上的浏览结果暂时无法显示这点。国内图书馆编目界历来喜欢各自为政,这两大巨头在名称规范库建设上的合作影响尤为深远,直接关系到全国书目信息资源及文献资源的共享与利用。
3.3.2 统一名称主题与名称规范
毫无疑问,关于同一实体的名称主题与名称规范两者不应脱节[7],名称主题完全可以依靠名称规范数据库。个人名称主题在第一版的《主题词表》只有4 765条,2005年出版的修订二版的电子版中,收录的也只有10 144条,加上团体名称及题名才共计2万条[8],与上述两大名称规范库的收词量不可同日而语。另外,《主题词表》更新缓慢,极难跟上信息的发展。而国家图书馆中文名称规范数据库已成功实现规范数据与书目数据的挂接,每月新增约6千条。既可避免两者不一致的情况,又可及时更新,避免不时出现的情况:某个人名称主题未收录于《主题词表》,而导致各馆处理方式不一,影响书目数据的统一及共享。而且,《主题词表》本身数量庞大,要更新与维护绝非易事,让名称主题直接依靠于名称规范库,在减轻《主题词表》压力的同时,也可大大减轻广大编目员的工作压力,还可提高工作效益。
参考文献
[1]国家图书馆《中国文献编目规则》修订组.中国文献编目规则(第二版)[M].北京:北京图书馆出版社,2005.
[2]中国图书馆图书分类法编委会.中国分类主题词表[M].北京:华艺出版社,1994.
[3]陈霞佩.联机规范控制系统的构建[J].图书馆杂志,2004,(11):29-31.
[4]王洋.FRAR与中文名称规范控制[EB].http:∥www.nlc.gov.cn/service/fuwudaohang/conf2006/conf2006zwangyang.htm,2008-06-20.
[5]王静.CALIS联合目录及联机规范控制系统项目进展介绍[EB].http:∥www.lib.tsinghua.edu.cn/bianmu/experience/files/20080425wangjing.ppt,2008-04-25.
[6]CALIS联合目录规范控制过程详细说明[EB].http:∥www.calis.edu.cn/calis/lhml/calislhml.htm#6,2008-04-01.
[7]编目精灵.名称主题与名称规范――由国家图书馆的做法谈起[EB].http:∥catwizard.bokee.com/4563560.html,2007-01-18.
[8]王阁.《中国分类主题词表》“专有名词”采用表外控制的建议[J].图书馆学刊,2007,(5):117-119.2009年3月第29卷第3期现?代?情?报Journal of Modern InformationMar.2009Vol.29 No.32009年3月第29卷第3期资源共享的一种有效途径——文献传递服务Mar.2009Vol.29 No.3