秦 静 刘洁萍 (国家图书馆 北京 100081)
随着名称规范库中数据量的日益增加,同名责任者的规范记录也越来越多,在规范库中准确找到同名责任者的规范记录的确是一件令编目员备受困绕的事情。究其原因是多种多样的。目前中文名称规范库中存在一些推断信息词比较随意及挂接障碍的情况,致使同名责任者的规范记录不具有唯一性和准确性。 笔者在工作实践中收集了一些具有代表性的例子,希望从这些实例当中能够发现问题所在,从而找出解决问题的办法,尽可能保证中文名称规范库的数据质量。
例如, 李辉 (信息工程 );
李辉 (计算机);
李辉 (微机技术);
李辉 (图像处理 );
李辉 (计算机教育);
李辉 (电子电路)。
上述实例可能是不同编目员在不同时期建立的,但最后的结果却是为区分而区分。虽然用一些题名关键词等作为附加成分具有唯一性,但从同名标目群体关系角度看相对复杂,对规范库挂接造成干扰,没有达到所设想的规范目的。这种简单区分也无法控制重复记录的积累,很难说具有科学性,只能说“规而不范”。这种为了区分而刻意制作的规范记录,不仅没有达到规范控制的目的,反而造成了数据库混乱,增大了编目员推断同名责任者的区分难度,降低了数据质量,也给今后数据维护带来许多问题。
例如, 马银春 (人间交往);
张伟 (篮球);
宋建忠 (出土文物);
张力 (养牛);
赵春 (发改委);
李明 (年鉴) 。
从以上例子中,我们看到附加成分用词的随意性较大,选择的“人间交往”、“篮球”、“养牛”、“年鉴”、“出土文物”等词,既没有体现出责任者的职业特征,也没有描述出其研究的学科特点,这给后续的名称规范工作带来了很大的困难。没有做到区分用词与科学术语体系的和谐统一。
例如, 张力(畜牧),江苏畜牧兽医职业技术学院动物营养与饲料科学研究员;
张力(研究员),江苏畜牧兽医职业技术学院研究员。
谢振元(英语),北京国际关系学院英语教授;谢振元(1933~),国际关系学院英文教授,广东梅县人。
方强(1936~),西北政法学院教授、中国心理
学会法制心理专业委员会副主任,山西五台人,合著有《犯罪心理学》、《罪犯改造心理学》、《青少年犯心理学》等;
方强(1936.1~),西北政法学院教授,中国心理学会法制心理专委会副主任,中国法学会理事,山西五台人,著有《法制心理学概论》等。
赵文明(人生哲学);
赵文明(管理学)。
通过比对附注说明发现,上下两条均为同一个人的重复记录。重名的概率如此高,如果编目员不规范附加成分并区分用词的选取顺序,就很容易重复建立规范记录,失去利用规范数据汇集责任者所有作品的意义,从而误导读者,造成检索结果不准确。
按照统一标目的原则,一个特定的标目一般只能代表一个人。为保证同名标目的唯一性,需要用附加成分进行区分。为了规范标目附加成分,使规范数据趋于标准化、国际化,可参考AACR2 (Anglo-American Cataloguing Rules,2nd Edition; 英美编目规则,第2版)和《国际编目原则声明》(草案)的有关规定:个人生卒年作为首选,其次依据性别、朝代、国别、籍贯、职业、称号、学科专长等信息对同名责任者进行区分;附加成分则分为自然属性和社会属性两种,自然属性包括生卒年和性别,是绝对固定的属性,社会属性指的是责任者的职业、称号、职称等,相对固定,但有时会发生变化[1]。因此,区分同名标目时责任者的自然属性信息应优先于其社会属性信息。
如果无法找到责任者生卒年或者无法区别相同的姓名,学科方向、职业、职称等社会属性可作为区分信息使用。①如果用学科进行区分,可以参考《中国图书馆分类法》(以下简称《中图法》)中各类目内容。例如,崔凯(公司董事),此责任者是工学、管理学博士,北大纵横管理咨询公司合伙人,兼任新农开发和亚盛集团等上市公司独立董事。参照以上信息,责任者的区分信息既可用学科体现,又可用职业体现,根据“相对稳定持久的信息优先于暂时易变的信息”[1]的原则,附加成分应选取他的固定可靠的信息“管理学博士”。再如,张力(养牛),此责任者任职于中国农业科学院兰州畜牧与兽药研究所,主编有《饲料添加剂手册》等。按照学科体现,附加成分应使用“畜牧学”。②如果按照职业名称进行区分,可以参考《中华人民共和国职业分类大典》。例如,谷祥盛(咨询师),现为国家注册咨询师,曾任湖南力元新材料有限公司品控中心主管、中山隆城日用品集团QE(Quality Engineer,质量工程师)主管、湖南省检验检疫协会及湖南省质量管理体系促进中心高级咨询师等。因此,用社会属性作附加成分区分时,要使用那些像终身院士、博士等稳定持久的信息,少用或者不用那些易变的信息,如职称、官职等。
众所周知,图书分类法是按照一定的思想观点、以科学分类为基础、结合图书资料的内容和特点分门别类组成的分类表,类目的确立全部从科学概念出发编制而成。如何规范同名标目的附加成分,分类法为我们提供了规范学科词途径,编目员可以借助分类法或主题词表使同名责任者的附加成分用词更加准确、规范。寻找合适的术语是专业领域内“知者的责任”,解决传播问题是术语规范工作的内容,二者相互支持,不可偏废。借助分类法或主题词表信息可使区分信息用词与《中图法》完美结合。由于这些词都是科学定义,所以笔者认为,名称规范的区分信息不能随意。例如,李亚杰(道路),根据本书主题标引为:
6060 $a高速公路
$x交通运输管理
$y中国
$j文集
因此,其中责任者区分用词应当使用相对规范的主题词“交通运输管理”较为合适。
随着经济社会的迅猛发展,新学科、新职业不断涌现,给同名标目的区分带来了一些困难。当没有现成的、恰如其分的词语供编目员使用时,就需要用一些合成词解决区分问题。在实际工作中,编目员创造的新合成词不但要有缘由根据和明确意义,更要服从语法、符合逻辑。合成词的构成要遵循表意精确、搭配合理、拒绝口语化及消除歧意的原则。笔者在名称规范库中找到一些有问题的例子,如陈卓(文物)、成立(脊椎病)、张伟(篮球)、李亮(侠义小说)、张力(养牛)等,希望能引起广大编目员的注意。
如何更好地解决同名标目的区分问题是规范工作的重点、难点。通过长期实践,我们逐步摸索出以下方法:
建立规范记录时,书中每一处提供信息的角落(如前言、后记、封底、注释等)或者书中给出的任何简单信息,都有可能成为查找责任者详细信息的线索。
例如,书目记录《通向大国之路的中国国家安全战略》的责任者“李承”在规范记录库内有同名标目,书中又没有提供责任者信息,在互联网上也无法直接检索到相关信息。但在该书后记说明的结尾处有“编者于上海”的字样,另外还列有其他相关责任者的姓名。于是挑选其中的一个名字“张克难”,在互联网上输入检索词“张克难 上海”,结果在南方网、人民网、东方网等多个网站都找到了“张克难”的信息:“解放军南京政治学院上海分院教授”,由此我们推断,李承有可能与张克难同属一个单位,于是把检索词改为“李承 解放军南京政治学院上海分院”,最终找到了责任者李承的详细信息:“李承(将军),上将,解放军南京政治学院上海分院院长、教授”。
又如,人民美术出版社的一本高校教材《动漫艺术》的责任者“洪涛”,书中未提供责任者信息,在互联网上输入检索词“洪涛 动漫”,有“中国人民大学艺术学院洪涛教师”的信息:“曾任《儿童漫画》副主编,出版过《宝莲灯》等连环画读物”。非常凑巧的是,本书的封面画恰恰就是宝莲灯的人物造型。由此,我们基本能够断定,这段网上信息就是我们要找的该书责任者洪涛的信息。
再如,书目记录《时评巴中》的责任者“闻水”,规范库内有同名标目,书中却无责任者信息。该书内容由若干篇小文章组成,阐述了四川省巴中市的社会经济发展状况,且每篇文章后都有“巴中日报”的字样。通过这个细节,我们考虑责任者有可能是巴中市人,也有可能任职于巴中日报社。于是在互联网上输入检索词“闻水 巴中日报”,在一篇新浪博客中我们找到了责任者的具体信息,从而建立了规范记录,问题迎刃而解。
现在大部分图书基本上都能提供一些责任者信息,但是内容有繁有简。在建立规范记录时,我们要借助这些简单信息,逐步查找出他的完整信息。例如,书目记录《仲裁法学》的责任者为“李政,徐秋菊,韩红俊”。书中前言处有责任者李政的简单介绍“西北政法大学任教”,名称规范库内又有同名标目,因此责任者信息要进行适当补充。在互联网上输入“李政 西北政法大学”后,建立的名称规范记录为:
200 0 $a李政$c(女,$f1964~)
3000 $a西北政法大学民商法学院民事诉讼法教研室副教授。浙江嘉兴人。
从上述实例得出:①在建立规范记录时,不要轻易建立“白板”记录(即名称规范记录2--字段没有限定词的规范记录);②关注图书中任何可能与责任者有关联的信息,这些信息有助于同名标目的建立;③当书中仅提供了责任者的简单信息,一定要做相关的内容补充,建立一条完整的规范记录。
经过十余年国际规范控制实践,国际图联对《UNIMARC/规范格式》进行修订完善,并于2001年发布了新版《UNIMARC/规范格式》[2]。2001版UNIMARC(Universal Machine Readable Catalogue,国际机读目录格式)规范格式新增加了23个字段,120字段(个人名称编码数据字段)即是其中之一。但是目前我国使用的标目法是1991年修订的,没有120字段。同名标目中的120字段是标识是否已区分的个人名称编码数据字段,是一个选择使用字段,区分代码为“a”(已区分)和“b”(未区分)。当前,由于同名标目数量的激增,编目员大量使用此字段,它的积极作用也日益显现出来。首先,120字段控制了“白板”记录数量的增加,在一定程度上净化了个人规范数据库的空间;其次,120字段把所有未区分的同名标目聚集在一起,为将来的整合工作提供了便利条件。有的编目员担心,在一个同名标目下面挂接十几个甚至几十个书目信息会给规范记录的建立、维护工作带来麻烦。笔者认为,这种担心大可不必,只要编目员对责任者的信息源经过了认真的查找和鉴别再进行挂接,就不会对数据维护工作造成更多的困难,而且还能为整合数据提供责任者线索。
例如,200 0 $a王刚
810 $a礼仪师培训教程 专著
810 $a机械制图 专著
810 $a成功学习计划 专著 高中数学 选修2-1
810 $a外企日语会话宝典 生产管理篇 专著
810 $aCOMSOL Multiphysics基本操作指南和常见问题解答
810 $aAutoCAD 2009中文版建筑设备工程制图实例精解 专著
810 $a成长初体验
810 $a世界酷车大百科
810 $a0-2岁天才宝宝孕育必读 专著
830 $a本标目暂无确切信息区分,日后需进一步维护。
120 $aub
同名标目规范记录启用120字段的作用,是把那些没有找到区分信息的同名标目集合在一起,便于今后的区分工作。但有相当部分的编目员尚未正确认识及使用该字段,常常在没有经过认真查找、分析信息源的情况下使用这个字段,导致当前有120字段的同名标目群变得越来越庞杂,弱化了此字段应发挥的作用。笔者建议,编目员在建立同名标目规范记录时要谨慎使用120字段,不可太随意,而应在确认没有责任者信息源后再挂接有120字段的规范记录。例如:200 0 $a刘世英
810 $a水产饵料生物学
810 $a赢在战略
810 $a朱新礼创业人生
830 $a本标目暂无确切信息区分,日后需进一步维护
120 $aub
而数据库中另有一条规范记录:
200 0 $a刘世英$c(广告策划)
3000 $a广告策划人,广天响石企划机构董事长、 亚洲资本论坛副秘书长、《亚洲资本》杂志副总编。著有《广告也幽默》、《蒙牛传奇》等。
810 $a广告不是万能的 专著 减少广告浪费的10条忠告
810 $a分众的蓝海 专著 江南春的创意神话
通过对责任者信息的分析,得出“白板”记录名下的《赢在战略》、《朱新礼创业人生》两本书的责任者“刘世英”同“刘世英(广告策划)”是一个人,由此我们将“刘世英”规范记录中收入的两本专著,归入标目为“刘世英(广告策划)”规范记录中。因此,使用120字段后,数据的维护问题将是今后工作中的重点。
综上所述,对于目前名称规范库中大量有120字段的同名标目群,如何从其参考数据来源项(即810字段所表示的书目记录)里择出能够确认的书目记录,将是今后数据维护工作的重要组成部分。
目前,我国中文名称规范工作正处于发展阶段,通过近几年的实践,已经积累了丰富的经验,但是相应的标准和规则应当及时跟进,尤其是面对日益庞大的数据库,规范维护就显得尤为重要。当前国际图书馆协会和机构联合会(International Federation of Library Associations and Institutions,简称IFLA )为推动国际规范控制进程,开展了卓有成效的工作,提出了《规范记录的功能要求》(Functional Requirements for Authority Records,简称FRAR),并在《国际编目原则声明》中提出,为区分相同的名称实体,必要时应该给实体的首选名称和非规范名称补充更多的识别特征。因此,要整合规范数据库,首先要协调和统一标准,并且明确规范控制中是否所有书目数据中的名称规范标目都要做规范数据、是否所有名称都要作区分、规范记录是否面面俱到等问题[3]39。要想不给今后的整合工作和日常的维护带来负担,应重视实用性和可行性。
我们都见过浮雕,浮雕其实就是一块石头,但是它集合了雕刻手法、艺术,被赋予了某种内容后变成了一块集合了多种属性的精美石头。规范工作就像这浮雕一样,是经过编目员对各种信息的精心分析、筛选、甄别后,变成的一个面向多种对象信息的综合体。同名标目的区分是个人名称规范工作中的一个难点,也是今后需要解决的工作重点,希望能与同行们做进一步的交流和探讨,多关注国际编目进展,强化书目规范控制。
[1]富 平,黄俊贵.中国文献编目规则[M].2版.北京: 北京图书馆出版社, 2005: 338-342.
[2]刘小玲.中文文献书目规范控制工作研究报告[EB/OL].[2005-05-06].http://srsp.nlc.gov.cn/download/ProdDoc200701016926312850.pdf.