控制主题标引质量 提高文献检索效率

2010-04-11 12:44
河南图书馆学刊 2010年3期
关键词:词表标引主题词

李 楠

(辽宁省图书馆,辽宁 沈阳 110015)

1 以主题标引为基础是文献检索的重要途径

从文献的检索手段来说,分类法和主题法都是揭示文献内容的检索语言,分类法是用人工标识的分类号标识文献并按其学科知识体系组织起来,它能满足读者按学科体系检索图书的需要,但不熟悉分类法及分类规则的读者则检索比较困难,其不足之处是:类目检索的复杂性、同主题图书的分散性、适用范围的局限性。优点就是有序性,便于排架。相比较而言,主题检索语言是用规范化的自然语言来标识文献内容的主题,并将其按字顺组织起来,它可以随着科学的扩展和增加而不断的自我扩充,是一种开放性的体系。它具有读者检索的直接性、反映主题的灵活性、同主题图书的集中性以及使用范围的广泛性。因此,主题检索更为方便易行、简洁明了,是文献检索的重要手段之一。

2 控制主题标引质量,提高文献检索效率

2.1 衡量主题标引质量的因素

主题标引工作质量的衡量,涉及到多种因素,如标引的准确性、针对性、适用性、相关性等,但最核心和最关键的因素则是标引的专指性、网罗性和一致性。

2.1.1 专指性,亦称专指度,是指主题标识与文献主题概念的相符程度。它是根据对主题概念揭示的精度衡量标引质量的一个因素。较高的专指度有助于提高检准率,满足用户对特定主题文献的查找。例如,对“个人微处理机”这一主题的文献,如果直接用“个人微处理机”这一专指主题此标引,用户可以直接从该主题词下检索相应的文献;而如果用“微处理机”这一上位词标引,用户就必须找遍“微处理机”下的全部款项,才能检全有关“个人微处理机”的所有文献,从而必然会增加查找时间,影响检准率。要保持适当的专指度,必须在准确提炼主题概念的基础上,选择词表中与待标概念内涵、外延最接近的主题词加以转换。

2.1.2 网罗性,亦称标引深度,是指一种文献所论述的各个主题概念被确认并转换成检索标识的完备程度。通常指一种文献被赋予主题词的平均数量。较高的标引深度有助于提高检全率,但会影响检准率。相反,降低标引深度,可以提高检准率,但不利于从次要主题角度检出文献,必然会影响检全率。因此,关键是应当采用适当的标引深度。不同的检索系统应当根据其设备条件、文献类型、服务需要,规定相宜的标引深度。

2.1.3 一致性,是指标引人员对同一主题内容文献标引的一致程度。标引的一致性可以指不同标引人员之间的一致性,也可以指同一标引人员本身的一致性,即在不同时间标引同一主题文献所给主题词的一致程度。提高标引一致性,有助于集中同一主题内容文献,提高检全率和检准率。

2.2 影响主题标引质量的因素

2.2.1 主题分析,是根据主题标引和检索的需要,对文献内容特征进行分析,提炼主题概念的过程。主题分析是主题标引的基础。主题分析的准确与否影响文献标引的结果,同时直接影响到检索效率。主题分析误差归纳起来主要有以下三种情况:

2.2.1.1 主题概念提炼不足,即提炼的主题概念少于应提炼的主题概念。由于主题概念提炼不全,标引的主题词少于文献论述的主题概念,甚至没有把有价值的或符合检索要求的主题概念提炼出来,造成漏标、漏检,从而影响检全率。如“《古文观止》(插图本)”,本书是以吴楚材、吴调侯编选的《古文观止》为底本,在此基础上进行编排、注释和点评。所以标引“古文观止—注释”的同时,还应标引“古典散文—文学评论—中国”,否则造成漏标、漏检。

2.2.1.2 主题概念提炼过度,即提炼的主题概念多于应提炼的主题概念。包括两种情况,一种是提炼的概念是文献未论及的主题概念,另一种是提炼的概念文献虽然做了论述,但不符合检索系统需求的。出现这样的误差,会造成误标和过度标引,影响检准率。如《走向21世纪的亚太经济》,文献重点研究了亚太地区经济发展潜力和趋势,在比较研究中提到了欧共体和北美自由贸易区的一些统计数据,所以应标引为“经济发展—亚太地区”,若把“欧共体”和“北美自由贸易区”也提炼出来就属于过度提炼,因为没有检索价值。

2.2.1.3 主题概念提炼错误,即提炼的主题概念与文献主题概念不相符,没有把文献中的主题概念正确的提炼出来。出现这一误差会造成误标和漏标,影响检全率和检准率。

2.2.2 主题概念转换。主题分析得到的主题概念,是以自然语言方式表示的,为了有利于标引的规范和一致,必须以词表为工具,将析出的主题概念转换为规范化的主题词。主题概念的转换分为两种情况。其一是直接转换,这是一种只需要使用此表中一个叙词就可以表达文献主题概念的转换,这种转换方式比较简单,只要主题概念提炼正确,采用适当查词途径,就可以准确迅速的完成转换过程。例如,“无线电干涉仪”,直接转换为“射电干涉仪”即可;其二是分解转换,这是一种根据词表收词情况,在将复杂主题概念分解成相应基本概念的基础上进行的转换。这是主题标引的难点之一,应当注意掌握基本规律和方法。例如,“铁路集装箱运输”,分解形式为“铁路运输—集装箱运输”,“回族史”分解形式为“回族—民族历史”,“肺脓肿”分解形式为“肺疾病—脓肿”,“水下慢速特技摄影”可分解为“水下摄影—慢速摄影—特技摄影”。这里应当注意严格按照逐步减少内涵的方式,按照相应的概念关系类型,用最接近的主题概念,最专指的分解形式进行分解组配,同时主题分解的结果不得冗余和缺损。

2.2.3 查表选词。要做好这一工作,一般应当在熟悉词表结构组成以及各部分功能的基础上,掌握查表抽词的规律,同时要善于利用同义词、近义词进行查找,如查找不到“国外投资”,可查“海外投资”或“对外投资”;善于对某些复合学通过变换次序查找,如在查不到“库存物资量”时,可变换词序,查一下“物资库存量”;善于采用扩大外延的方式进行查找,在查不到“周刊”时,可以查一下它的上位概念“期刊”或“定期期刊”。注意如果有专指叙词,就不能用其他形式代替。

2.3 提高主题标引质量的措施

要保证主题标引质量,使标引结果达到适当的专指度、合理的标引深度、较高的一致性,主要取决于标引人员素质、标引工作管理水平、词表质量以及标引规则的完备程度。

2.3.1 提高标引人员素质。主题标引工作是一项专业性强,有一定难度的技术性工作。要胜任这一工作,标引人员必须具备以下知识和素养:

应当具有熟练的业务技能。必须熟悉使用的标引工具,充分了解其编制原理、组成结构,熟练掌握标引规则和标引工具的使用方法。同时,还应重视对图书馆学、情报学、文献检索以及主题法基本知识的了解和实践经验的积累,不断丰富自己的业务知识,提高对各种标引问题的分析和处理能力。

应当建立合理的知识结构。要具有一定的科学知识,同时,知识面要广一些,对与标引有关的各个知识领域的研究对象、科学分支以及新学科、新技术、进方法等,也应当有所了解,能够认真地研究好各种文献内容,自如处理好各种内容的文献。

2.3.2 加强标引工作的组织管理。一方面,要加强标引过程的管理,严格遵守标引程序,每一工作环节均要按照标引要求进行,并指定有经验的人员把关校验,尽量减少不必要的误差。另一方面,进行质量分析和管理。除及时解决标引中出现的问题外,还应注意发现影响标引质量的带有普遍性的问题,有针对性地予以解决。

2.3.3 选好标引工具。词表是主题标引的工具和依据,词表的好坏直接影响标引的质量。《中国分类主题词表》是一部较好的分类主题标引工具,利用该词表能够提高标引效率,减小标引误差。使用词表第一卷“分类——主题对应表”进行标引时,一般是在分析了文献所论述的内容主题及科学属性之后,先确定分类号再从该类目所对应的主题词或主题词串中获得主题标识,但常常也会出现对应的类目中找不到相应的主题词或主题词串,这是由于词表中的某一类目所对应列出的主题词或主题词串不可能完全穷举,或是由于该主题词对应另一类目更为合适的原因,因此要仔细参看注释说明,选择恰如其分的主题词或主题词串。2.3.4 指定明确的标引规则。一般应根据本单位的特点、设备条件及入藏文献情况,制定详细实用的标引工作细则。对主题标引方式、标引深度、主题分析要求等作出具体规定,以便标引人员有章可循。

3 掌握并灵活运用检索系统功能,提高文献检索效率

网络环境下检索文献的方法很多,书目数据库能够使读者非常方便地查找所需要的各种文献信息,而机读目录提供的检索点又是多种多样的。在查找文献时应根据情报需求的特点,灵活地把分类检索、主题检索、著者检索等方式结合起来,以提高检索效率。比如把分类法的组性检索与主题法的特性检索结合起来,用分类号限定检索的科学领域,用主题词限定检索的事物,可以得到较好的效果。

[1] 侯汉青,马张华.主题法导论[M].北京:北京大学出版社,1991.

[2] 徐引箎,霍国庆.现代图书馆学理论[M].北京:北京大学出版社,1999.

[3] 刘五一.对修订《中国分类主题词表》的探讨[J].图书情报工作,2000,(11).

猜你喜欢
词表标引主题词
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
档案主题标引与分类标引的比较分析
本刊对来稿中关键词标引的要求
叙词表与其他词表的互操作标准
本刊对来稿中关键词标引的要求
我校学报第32卷第5期(2014年10月)平均每篇有3.04个21世纪的Ei主题词
我校学报第32卷第6期(2014年12月)平均每篇有3.00个21世纪的Ei主题词
2014年第16卷第1~4期主题词索引
《疑难病杂志》2014年第13卷主题词索引
本刊对来稿中关键词标引的要求