中文主题规范控制工作实践与展望

2010-03-22 19:57丁建勤上海图书馆上海200031
图书馆建设 2010年8期
关键词:上海图书馆词表标引

丁建勤(上海图书馆 上海 200031)

1 上海图书馆中文主题规范控制模式的演变

1.1 印本词表控制模式

20世纪90年代,上海图书馆参与了中国国家书目回溯数据库的建库工作[3]。根据建库要求,主题标引统一使用印本《中分表》进行主题规范控制,即标引时应按《中分表》选词。这一阶段虽已采用MARC(Machine Readable Cataloging,机器可读目录)格式进行书目数据编制,但主题规范控制实际上还停留在卡片年代。因为当时国内软件缺乏名称规范和主题规范控制的技术支持环境,一般仅抽取主题标引标识生成索引文档以支持检索,所以主题规范控制尚依赖于印本词表。应指出的是,由于历史原因,上海图书馆始终没有建立卡片式中文主题目录供读者检索使用。

1.2 印本词表结合机读主题规范库模式

1996年12月上海图书馆新馆对外开放,新馆引进的HORIZON图书馆集成管理系统开始启用,大量中文书目数据装载进该系统。此后不久,上海图书馆中文普通图书编目也开始进行主题标引。由于HORIZON系统具备支持名称规范和主题规范的技术环境,能够从书目数据相关字段中抽取数据元素自动生成规范数据并实现与书目数据的自动链接,因此上海图书馆主题规范控制进入了印本词表结合机读主题规范库模式阶段。

然而遗憾的是,由于缺乏机读主题规范控制工作的实践经验和业务研究,上海图书馆采编部门尚未深入思考HORIZON系统环境下书目规范控制的可能模式,书目数据主题标引依旧采用卡片目录的叙词先组散组式方式,在HORIZON中生成叙词标题化主题检索标识及其文档。加之,当时上海图书馆的人力资源有限,并没有对这些规范数据进行必要的维护,导致了零参照记录的普遍存在。从这个意义上说,这种标题化主题文档在功能上几乎等同于标题索引文档。正如有的业界专家所言:“不同的图书馆、不同的标引员可能对同一主题选择了不同的标引形式,若不对标题标目建立规范记录和参照系统,所有的标题标目都是失控的,书目主题标引的规范工作形同虚设。”[4] 100为保证标引一致性,2001年上海图书馆中文采编部试编制地方志、计算机文献主题标引规范工作文档。但由于条件限制,这一标引规范工作文档并没有生成机读形式(如CNMARC规范格式等)。

1.3 《中分表》电子版结合机读主题规范库控制模式

2005年9月《中分表》第2版及其电子版正式出版,上海图书馆在引进并装载《中分表》局域网版后,《全国报刊索引》编辑部和中文采编部相继开始使用《中分表》电子版进行主题规范控制。由于《中分表》电子版具备多种检索途径、多样化的匹配方式和友好的用户界面,极大地方便了标引选词工作。这一时期,上海图书馆采编部门在前阶段编制中文主题标引规范工作文档成功经验的基础上,尝试利用《中分表》电子版的技术环境建立嵌入式的电子化主题标引规范工作文档,以便于在《中分表》电子版中同步查检利用、完成标引选词。经过初步研究发现,编制工作至少可以在增加入口词、组代词、增词、外文标识词和词表修订信息等领域进行,而且在实现手段上可以利用《中分表》电子版提供的“用户评注”功能,这为今后理想化的规范控制提供了数据汇总积累[5]。

2 上海图书馆中文主题词汇和引用次序的规范控制

上海图书馆中文主题词基本都取自《中分表》,其词汇和引用次序规范控制也基本按照《中分表》及其使用手册的要求进行,但在实际应用中,仍根据需要进行一些必要的补充和完善。由于技术条件有限,这些完善方法一般仅记载在印本词表或印制纸本资料(包括在计算机上输入生成的Word文档及其打印成的纸本资料)中。当然在具体实践中,上海图书馆也鼓励编目员根据具体情况作出自主判断。

2.1 词形控制

上海图书馆的词形控制要求严格按照《中分表》进行,即标引时应选用正式词,其书写形式必须与词表中的词形保持一致,如括号限定中的括号“( )”是主题词的有机组成部分,应予保留。但是根据实际情况,部分词形控制也有例外处理方式。

(1)著作题名主题不再保留词表中的书名号“《 》”。

例1:《诗经》

记录控制号:S067048

(《中分表》电子版形式)

$a诗经$x注释

(上海图书馆采用的形式)

(2)个人名称主题中的附加成分尽可能与名称标目保持一致,如添加子字段标识符、增加$b子字段数据元素等。

例2:皮尔斯(Peirce, Charles Sanders 1839-1914)

美国唯心主义哲学家,实用主义的创始人。

记录控制号:S056926

(《中分表》电子版形式)

$a皮尔斯$bC.S.$gPeirce, Charles Sanders$f1839~1914$x传记

(上海图书馆采用的形式)

(3)对于中国行政区划名称主题,由于《中分表》词形未能保持一致,所以要求一律使用专名加通用名形式。

例3:三亚市

记录控制号:S114969

烟台

F 龙口市

文登市

记录控制号:S085824

(《中分表》电子版形式)

$a旅游指南$y三亚市

$a冶金工业$x地方志$y烟台市$z1956~1985

(上海图书馆采用的形式)

2.2 词义控制

词义控制遵循词表的相关规定,对于某些存在不同理解的词汇尽可能做到内部统一。例如,针对词表中并存的“作品集”、“文集”、“选集”、“别集”、“总集”等词,内部要求“作品集”一般用于文艺作品,“选集”一般用于个人多学科文集,暂不使用“别集”、“总集”两主题词;对“短篇小说”和“中篇小说”两词的区分也作出内部硬性规定。

2.3 组代词

上海图书馆中文编目除使用《中分表》规定的组代词外,也根据需要补充一些组代词,应注意的是这种组代词宜纳入主题标引规范工作文档,实现规范控制。

例4:工商行政管理志

Y 工商行政管理——地方志

(上海图书馆采用的形式)

2.4 增词

上海图书馆中文主题词除取自《中分表》外,对于名称主题和年代词允许自行增词,当然在词形上应符合一定的要求。

例5:$a地方财政$x地方志$y宜春市$z1910~1995

(“宜春市”为上海图书馆增词)

2.5 引用次序控制

由于目前上海图书馆依旧采用先组散组式组配形式,因此标引引用次序对于HORIZON系统标题化文档仍具有相当的价值。上海图书馆主题词组配词序遵循国家标准《文献叙词标引规则(GB/T 3860—1995)》[6]的相关规定,即采用主体因素、通用因素、空间因素、时间因素和文献类型因素的引用次序。同时,针对文献类型词的不同理解和认识,2005年上海图书馆还编制了《文献类型主题词汇总表》。

3 上海图书馆中文主题规范控制工作的展望

上海图书馆中文主题规范控制工作已经开展了10余个年头,积累了一定的实际经验和业务研究成果,但仍需根据需要和可能着重开展下列工作。

3.1 密切跟踪《中分表》Web版的进展,积极探索Web版环境下的主题规范控制新模式。

《中分表》Web版是在前期电子版(单机版和局域网版)的基础上开发的,试图为我国各类信息资源的组织、检索和利用提供一个最大、最全面、可扩展更新的知识体系及一个通用的数字型检索语言交换平台,预期将实现多项崭新的功能[7],从而为各馆建立和完善主题规范控制提供有力的支持。因此,应组织有关人员密切跟踪《中分表》Web版的编制、发布情况,深入了解业内主题规范控制的新进展,积极测试和评估新的技术环境(如Web帐户访问、镜像、下载、MARCXML等标准数据交换格式和Web Service标准的数据接口等),根据需要和可能积极探讨中文主题规范控制的可能模式,积极探索读者利用电子化主题规范文档进行书目检索的可能性,努力改善用户体验。

3.2 强化主题词的修订和更新,保证主题规范控制的统一、有效。

目前上海图书馆中文主题词来源多样且不统一,既有《中分表》第1版主题词,也存在《中分表》第2版主题词,同时还有上世纪90年代中国国家书目回溯数据库和国家图书馆分类法词表组编制的增词。这些词相互之间可能存在一定的冲突,甚至有些增词未被电子版所采纳。

例6:艾滋病

(《中分表》第1版正式词)

式中,a为可持续发展综合评分,bj为各等级的隶属度,aj为各等级的评分,本式为了突出占优势等级的作用,利用各级隶属度bj为权重进行加权平均计算。为了提高水资源承载力评价结果的精确性,本文进行了一级准则层模糊评价和二级综合评价。

获得性免疫缺陷综合征

D 艾滋病

爱滋病

记录控制号:S000525

(《中分表》电子版形式)

例7:土匪

(《汉语主题词表》增词表正式词,而《中分表》电子版无论是正式词还是入口词形式均不收录该词)

因此,建议根据人力资源和可能的技术环境,积极创造条件整合主题词,根据需要和可能更新并维护主题规范库,保证主题规范控制的统一有效,提高中文主题规范控制工作水平。

目前,《中国图书馆分类法》网站已经开通,编委会将利用网站发布包括《中分表》在内的“修订试用”文件,“目的是对《中分表》的主题词和类目作及时的补充和修改,供广大用户试用”[8],“一般公布时间为1-6个月”[8],“公布时间结束,编委会将把没有不同意见的内容作为正式修订内容转入‘修订快讯’,并视修改量对《中分表》机读版作相应修改升级”[8]。随着Web版的正式推出,主题词的修订发布形式将更为便捷,因此建议采取有效措施,积极收集和评估修订数据,根据需要和可能同步动态更新规范库。在数据格式上,应积极倡导和争取编委会统一发布多种格式的修订更新数据,从而方便利用CNMARC规范格式记录头标区5字符位代码①和035源记录标识号(other system control numbers)②,以实现同步更新。

3.3 协调名称规范和名称主题规范的关系,健全规范控制体系。

在建有名称规范的情况下,名称主题一般应直接取自名称规范文档,从而明确描述性编目和主题编目的分工,节省人力,避免可能的冲突,同时也免除了目前存在的某一名称形式在名称规范中是规范受控的而在名称主题里却可能是非控词的尴尬。

例8:中国共产党七届四中全会(1954)

记录控制号:S096248

(《中分表》电子版形式)

中国共产党中央委员会全体会议(11届,6次:1981:北京)

(《中国文献编目规则(第2版)》23.1.2.2a条款2附例1)

例9:傅青主(1607-1684)

清初思想家、医学家。

记录控制号:S023376

(《中分表》电子版形式)

(清) 傅山(1607~1684/1685)

单纯参照 傅青主(1607~1684/1685)

系统号:000019030

(国家图书馆名称规范形式)鉴于上海图书馆实际上并没有典型意义上的中文名称规范控制,因此建议积极创造条件健全规范控制体系,统筹名称规范和名称主题规范控制,全面汇集和评估《中分表》已有的名称主题及其形式,着力解决名称规范和名称主题规范的有机统一,实现同步更新维护。从这个意义上说,上海图书馆宜继续维持现行名称主题直接增词的做法并将之纳入规范控制体系,力争避免零参照现象的出现[11],如依据相关标准完善词间关系以健全款目著录事项等。

3.4 继续加强主题规范数据的编制和积累

上海图书馆在长期的中文普通图书编目实践中相对比较注意分类主题标引规范事项的记录。因此,在进一步总结前阶段编制和使用中文主题规范工作文档经验的基础上,应根据需要和可能,坚持日常积累和专门编制相结合的方针,积极编制和积累主题标引规范数据。

在文档类型上,应优先考虑采用分类主题一体化文档的编制方式,以适应一体化标引工作需要。在理论上,分类主题一体化文档既可以采用基于类目涵义的一体化对应方式,也可以采取基于文献标引的一体化对应方式。基于类目涵义的一体化对应方式要求充分分析分类法类目的确切涵义和范围,将符合条件的主题词无遗漏地对应在该类目之下,并用主题法形式揭示分类法类目的内容,如《中分表》第1卷现行编制模式;而基于文献标引的一体化对应方式则要求以文献为依据,将标引同一文献的分类号与主题词建立等同关系,并不断地积累文献样本数,从一体化标引的结果中采用数理统计方式形成一体化文档,如CALIS中文书目分类—主题整理项目[12]。

在数据语种上,应积极创造条件逐步建立相互连接引用的多语种规范数据文档,或者编制和维护作为非正式主题词的并列数据形式。近年来,上海图书馆为适应业务发展的需要,开展了境外数据编制服务,为境外图书馆编制中文图书的MARC21书目数据。按照海外用户的要求,上海图书馆主题标引一般应采用《国会图书馆标题表》(Library of Congress Subject Headings,简称LCSH),因此可能会积累一些书目数据《中分表》和LCSH的标引成果。鉴于中文叙词表其他语种与汉语对照索引大部分是采用直译其他语种语词,而不是与其他语种的词表相对应(可能有部分是对应词),所以可以积极汇编与中文主题相对应的LCSH并列数据,或者以适当的方式添加与《中分表》原译文不一致的英文主题标识词,为今后实现映射互操作创造条件。

当然,为保证中文主题规范控制的统一、有效,还应进一步制订和完善标引、审校和数据维护过程中涉及的增加和修改规范数据的规章制度,切实保证标引规范工作文档运行的规范化和制度化。

3.5 加强同行交流,努力实现中文主题规范控制的共知共建共享。

近年来,联机联合编目对上海图书馆中文图书编目工作产生了重大深刻的影响,联机套录已成为重要的编目方式。在新的编目环境下,若继续实行一馆独立编制和维护主题规范文档,则很难实现预期的规范控制目标。因此,有必要充分利用联机联合编目平台,加强与各成员馆和用户的业务联系和交流,大力倡导中文主题规范数据的共知共建共享理念,积极收集和评估各成员馆的规范数据,努力扩大共识,力争形成相对统一的编目中心主题规范工作文档,以促进主题标引标识的一致性。

同时,力争在第一时间积极探讨在《中分表》Web版环境下中文主题反馈新机制,加强与编委会的业务联系,协助做好词表的维护修订工作,提高词表的更新时效性和修订适用性。此外,必须保证在编目工作中对中文主题规范数据库所做的修改与维护及时反馈到编委会网站的修改库中,作为待批准的临时数据,由编委会及时、快捷地处理,使主题规范数据库得到实时更新[4] 101。这就要求努力解决可能存在的编委会集中管理和各图书馆希望享有一定的自主权(如新增词、入口词、组代词、本地标目更改、特殊说明和规定等)之间的协调问题。

注 释:

①5字符位代码用于具体说明记录状态,即n表示新记录、c表示修改记录、d表示删除记录。

②035源记录标识号用于说明源记录的记录号和产生该号的机构。

[1] 刘湘生,汪东波.文献标引工作[M] .北京:北京图书馆出版社,2001:43.

[2] 刘湘生.中国分类法和主题法一体化词表的编制和应用[G] .香港图书馆协会学报,1996(18):67-68.

[3] 富 平. 北京图书馆中文书目数据库建设的回顾与展望[J] .北京图书馆馆刊, 1996(2):8-12.

[4] 富 平,刘小玲.中文书目规范控制的理论与实践[M] . 北京:北京图书馆出版社,2007.

[5] 丁建勤.主题标引规范工作文档的编制和应用——在《中分表》电子版环境下[J] .国家图书馆学刊, 2009(4):70-74.

[6] 国家技术监督总局.文献叙词标引规则(GB/T 3860—1995)[S] .北京:中国标准出版社,1996.

[7] 《中图法》Web版简介[EB/OL] .[ 2010-01-06] .http://clc.nlc.gov.cn/ztfdzbweb.jsp.

[8] 修订试用说明 [EB/OL] .[2010-01-06] .http://clc.nlc.gov.cn/searchque.do.

[9] 国家图书馆《中国分类主题词表》编辑委员会.中国分类主题词表[M] .2版.北京:北京图书馆出版社,2005:22-23.

[10] 卜书庆《.中国分类主题词表》(第二版)及其电子版手册[M] .北京:北京图书馆出版社, 2006:222.

[11] 丁建勤.叙词增词标引的适用及其规范化[G] //中国图书馆学会.中国图书馆学会年会论文集:2008卷.北京:国家图书馆出版社,2008:308-312.

[12] 陈志新《.中国分类主题词表》的两种对应依据[J] .国家图书馆学刊, 2006(2):61-63.

猜你喜欢
上海图书馆词表标引
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
图书馆中文图书借阅排行榜(2019年12月)
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
数字阅读推广新形式研究
中美公共图书馆社交媒体营销比较研究
创新创业环境下公共图书馆企业信息服务的转型
叙词表与其他词表的互操作标准
本刊对来稿中关键词标引的要求
本刊对来稿中关键词标引的要求