邱翠云
摘要:主题标引的适度性是衡量主题标引质量的重要标准之一,在计算机编目日趋取代手工编目的今天,主题标引的适度性标准发生了变化。结合调查实例,分析主题标引适度性方面存在的问题,提出采用全面标引,扩大标引的网罗度和选用专指的主题词,增强标引的专指度等对策和措施,使主题标引达到适度性要求,提高文献检全率和检准率。
关键词:文献;主题标引;主题标引适度性;主题标引网罗度;主题标引专指度
中图分类号:G254文献标志码:A 文章编号:1002—2589(2009)26—0080—03
文献主题标引是根据文献内容赋予文献检索标识的过程,是建立文献检索工具和检索系统的基础前提,是文献编目的重要环节。衡量主题标引质量的要素很多,其中主题标引的正确性、适度性和一致性是衡量主题标引质量的三个重要标准。正确性反映文献内容与检索标识的相符程度,适度性反映文献内容检索标识数量的完备和确切程度,一致性反映不同的标引人员对同一文献或相同主题的文献赋予检索标识的一致程度。主题标引达到以上三个标准的质量较高,反之质量较低。在计算机编目日趋取代手工编目的今天,主题标引的正确性和一致性标准保持不变,但主题标引的适度性发生了变化。本文结合调查实例,分析主题标引适度性方面存在的问题,提出适度标引文献主题的对策和措施,使主题标引达到适度性要求,提高文献检全率和检准率。
1.主题标引的适度性理解
适度性作为衡量主题标引的重要标准之一,它反映文献内容检索标识数量的完备和确切程度。适度的主题标引包括标引的网罗度要适中、标引的专指度要适当。标引的网罗度(广度)是指对文献内容进行标引的完备程度,具体表现为标引的主题数量的多少。标引一篇文献究竟使用多少个主题词才算适中呢?我国国家标准局GB/T 3860一1995《文献叙词标引规则》规定标引一篇文献所用叙词数量为“手检系统平均标引用词2-5个,机检系统平均标引用词4-10个”。规则明确规定手检系统和机检系统主题标引数量范围,机检系统平均标引用词高于手检系统的2-3倍,这是主题标引适度性的一个重要变化,也是计算机编目的优势所在。标引工作中标引人员如何把握好标引用词的数量呢?首先应视文献的具体内容而定,一般而言,文献研究的对象和论述的问题,文献中有参考价值和检索意义的内容都是主题标引的具体对象;其次应考虑检索系统的性能;另外还要考虑到文献类型、标引语言类型、服务对象等因素最终确定标引用词数量,也许少于5个,也许多于10个。过高或者过低的网络度都会影响文献的检索效率。
标引的专指度是指标引用词揭示文献主题内容的确切程度,具体表现为选用的主题词能够恰如其分地揭示主题概念的内涵和外延,不是过宽的上位词,也不是过窄的下位词,如“动物学”就不宜用“生物学”来标引。主题规范词表未收录的一些新概念、新事物、新技术,如在文献中作为论述和研究的对象或者具有检索意义的也应当作为自由词加以标引。
标引的网罗度和专指度的综合反映就是标引的深度,标引深度也要适中,标引深度过大或者不足都会对检索效率产生负面影响。一般认为,标引一篇文献时必须符合三个条件:一是文献已比较具体论述了的内容;二是有一定的参考价值;三是可以成为检索对象的。据此可知,一篇文献如果同时具备这三个条件而不给与标引,则认为是标引不足;如果未同时具备这三个条件而给予标引,则认为是标引过度。要想使标引深度达到一个理想的层面,必须处理好标引的网罗度和专指度。
2.当前主题标引适度性方面存在的问题
笔者通过访问我国部分高校图书馆和公共图书馆的馆藏书目数据,发现其主题标引的适度性存在以下问题:
2.1标引的网罗度小,停留在浅标引水平
较之传统的手工编目,计算机编目的主题标引用词数量应增加2-3倍,事实上笔者调查的图书馆多以整体标引为主,对局部主题、从属主题和隐性主题不予揭示,不管文献内容的复杂与否,主题标引用词多在2-5个,总体来看主题标引的网罗度小,停留于浅标引层面。
2.1.1漏标局部主题和从属主题
整体主题概括某篇文献的主要内容或者基本内容,而局部主题和从属主题只概括某篇文献的部分内容,一篇文献整体主题只有一个,局部主题和从属主题可以有很多个。标引时,整体主题易被标引人员感知和辨别,局部主题和从属主题往往易被忽略和漏标。据调查发现,专科性或综合性文集、选集、全集等类文献的局部主题极易漏标。如:《鲁迅经典全集》一书,多数图书馆标引“鲁迅著作” 这个整体主题,漏标“小说”和“诗歌”这样的局部主题。另外那些具有属种关系的主题概念中,种概念即从属主题概念也是易漏标的对象:如《资源生物学》一书由绪论、资源植物篇、资源动物篇、资源微生物篇和附录5部分组成,“生物资源”作为该书的整体主题标引,从属主题“植物资源”、“动物资源”和 “微生物资源”则不予标引。
2.1.2隐性主题一般不予标引
隐性主题是指文献中没有直接表达出来,不是显而易见的,而是隐含在文献内容中的主题。它不像显性主题那样较容易分析和辨识,需要标引人员反复的审读文献,先析出显性主题,在此基础上深入挖掘才能概括出来。由于隐含主题具有隐含性、相对性及模糊性等特征,使得隐性主题的辨识和提炼具有一定的难度,它不但花费标引人员审读分析文献的大量时间,而且对标引人员所掌握的标引技术和所具备的学科知识要求较高,因此在实际标引工作中隐性主题一般不予标引。如《固体废物处理技术及工程应用》一书,多数图书馆只标引“固体废物处理”这个显性主题,对隐性主题“环境污染”不予标识。
2.2标引选词不够专指,存在泛指标引
标引人员从文献析出相关主题概念后,依据主题词表把主题概念转化成相应的叙词,这个叙词应与所揭示的主题概念在内涵和外延上相符,只有表中没有直接与主题概念相对应的专指叙词时,才考虑组配标引和上位词标引。事实上,不少图书馆标引时违反主题标引专指性规则,选用的标引词与主题概念不完全相符,存在偏差。如《医学美学》一书主题标引为:6060#@a医学@j教材,该例用泛指的主题词“医学”代替专指的主题词“医学美学”。
2.3忽视自由词的辅助标引
自由词是“文献中使用,而词表未收,可随需要增补,不作为正式标引检索用词,但可实际用于检索,具有较大的识别功能的词,CNMARC称其为非控主题词”,自由词是未经规范的自然语言,具有较高的专指性、直接性、识别性等功能特点。使用自由词标引可以弥补叙词标引的不足,扩大主题词检索范围,是计算机主题检索的重要手段,可是很多数图书馆在主题标引时忽视自由词的辅助标引,表1是笔者对自由词标引的调查数据:
上述表1笔者以自由词“和谐社会”作为检索词从主题字段检索国家图书馆等五家图书馆的书目数据库,检索结果见表1,笔者查看这5家图书馆相关书目数据的MARC格式发现,它们在610字段极少对“和谐社会”作非控主题词标引,表1的5家图书馆中北京大学图书馆不对自由词“和谐社会”作标引外,国家图书馆和清华大学图书馆对自由词“和谐社会”作标引也只局限于硕博士论文和电子资源,武汉大学图书馆和上海图书馆仅有少量文献对自由词“和谐社会”作标引。
2.4原因分析
产生上述问题的原因可归结为这几个方面:一是受标引人员标引技术水平、知识背景和专业素质制约。标引员对文献内容了解不充分,不能深入分析文献的研究对象、研究方法,习惯从文献标题推测主题内容,对主题概念的概括不全面,遗漏那些具有检索意义的主题、从属主题、次要主题和隐性主题。二是多数图书馆套录CALIS或者书商配送的书目数据,CALIS各成员馆上传的数据标准不一,质量参差不齐,书商配送数据亦然,图书馆使用套录数据后在主题字段的审核方面没有严格把关,致使主题标引不合格的数据也送入馆藏书目数据库。三是目前全国缺乏一部详尽的主题标引细则,《汉语主题词表》和《中国分类主题词表》作为文献标引的主要工具,其修订工作远远滞后于各种新生事物的出现,不能满足当前主题标引的需要。