档案主题标引与分类标引的比较分析

2019-05-09 01:29贞,
资源信息与工程 2019年2期
关键词:标引类目主题词

毕 贞, 向 禹

(1.中南大学 档案技术研究所,湖南 长沙 410083; 2.中南大学 信息安全与大数据研究院,湖南 长沙 410083)

档案标引是档案工作中的一项基础而重要的内容,随着一些手工操作环节被计算机所取代,标引工作常常被忽视。不管是传统档案工作,还是现代档案工作,甚至电子文件及电子档案的标引工作依然重要。在“互联网+”和大数据时代,研究档案标引,对档案信息检索效率起着至关重要的作用。

档案标引按照检索体系区分为主题标引和分类标引。两种方式有相似的地方也有各自的特点,需要从各个角度进行分析,评判一个标引方法好坏的标准就是依据检索效率,即使两种方法各有优缺点,无法彻底比较出好坏,但通过比性分析,可以在具体情况的时候运用合适的标引方法。

1 定义分析

从《档案管理学》中分别得到主题标引与分类标引的含义,往纵向延伸出这两类标引更具体的划分,根据定义可以直观的看出主题标引与分类标引的区别。

1.1 主题标引的定义与分类

主题标引是对档案内容进行主题分析,赋予主题词标识的过程。它在档案检索中有两项任务:一是从档案文献中分析、提取有关某一主题的档案信息;二是将得出的主题概念,按照主题词表标出主题词。主题标引从采用标引语言是否规范的角度来区分,有自由标引、受控标引、混合标引(半受控半自由标引)。自由标引又称非控标引,是指使用自然语言中的词,即档案材料中出现或从未出现的未经规范的自由词进行标引。受控标引,是指严格根据主题词表中的规范化的主题词进行标引。混合标引,是指在标引时除使用主题词表中规范化的主题词外,也同时使用一些未规范化的自由词、关键词来标引。

1.2 分类标引的定义与分类

档案分类标引是将档案文献进行主题分析,赋予分类标识的过程。分类标引根据标引的程度又分为整体分类标引、全面分类标引、分类互见标引。所谓整体分类标引,就是对一份文件、一个案卷,只给一个分类号,概括标引。全面分类标引的含义是指一份文件或者案卷有若干主题,依据所属类目分别给分类号。分类互见标引,指一份文件或者一个案卷论述的主题涉及几个类目,标出一个主要的类号之后,再在其他类目中作重复整体标引,标出的类号,称为互见分类号。

由此可见,主题标引与分类标引都是根据一定的标引依据来进行标引工作的,两者都是将档案主题进行分析之后再进行标引,前者的依据是主题词,后者的依据是档案内容的主题分类号。

2 程序分析

标引既然是一个工作过程,那么必然有程序。通过图1、图2的流程图将主题标引和分类标引程序中的每一步骤进行对照,得出结论。

图1 主题标引流程

图2 分类标引流程

仔细分析图1和图2 之后,发现主题标引与分类标引程序的第二步和最后一步都是一样的(第二步都是对主题分析,最后一步都是将得到的结果进行审查),可见在对档案进行标引时,都必须运用到主题分析这一步,证明了阅读文件、了解主题是所有标引工作中必不可少的一部分;在最后都进行审核查对是为了证实前面标引结果的正确性,使结果更为严谨。而在第一步程序中,主题标引是要阅读文件,了解文件的主题;分类标引则需要慎重选择好采用何种分类表,国家档案局制定了《中国档案分类法》,它包括了中华人民共和国档案分类表、新民主主义档案分类表、民国档案分类表,在分类工作进行之前就要从这几个分类表中选择最合适的分类表取用。这个步骤非常重要,如果没有选择出最合适、最正确的表,直接会影响到后面标引工作的进行。至于中间几个过程,虽然看起来含义不一样,实际上将类名和主题词当成标识符号一样看待的话,这两种方式除了第一步,标引流程大致相同。只是分类标引的前提——选择分类表,是充分必要条件。

3 规则分析

标引工作必须按照规则制定的标准来进行,违背了规则那么工作将变得没有意义。对主题标引和分类标引的基本规则进行分析也是对比两种方法的主要依据,根据标引的规则可以看出标引工作的本质。

3.1 主题标引的基本规则

标引必须持客观态度;核心是揭示文件或案卷论述的主要事物或问题;选定的主题词必须是正式主题词;必须使用词表中最专指的主题词标引;当词表中找不到最专指的主题词时,则应选用最直接相关的两个或者两个以上的主题词进行组配标引。

3.2 分类标引的基本规则

档案分类标引必须依据《中国档案分类法》及其分类原则,辨清类目的确切含义,不能脱离类目之间的联系和类目注释的限定来孤立地理解类目的含义;档案标引的内容必须是档案文件中论述较为具体的,切勿标引过度或者标引不足;分类标引必须符合专指性要求,选出最切合的类目,给予正确的分类号;分类标引应能为利用者提供必要书录像的检索途径,多主题的情况下,每个主题都应该要有分类号(最多三个);最后是保持一致性,在无法归类的情况下归入最相似的类目。

综上所述,主题标引和分类标引的基本规则在理论上相似。都是对具体内容具体分析,一切原则都必须与事实相符,这些规则都服务于保持标引结果的准确性,在实在无法给出标引结果的情况下,找出相似的或者有亲密联系的主题词(类目)进行标引,联系具有普遍性,任何事物都处于普遍联系之中,整个世界是相互联系的统一整体,所以标引结果具有理论性。但无论是主题标引还是分类标引,所有标引的基本规则都围绕“实事求是”展开。

4 方法分析

如若一份档案只有一个主题,那么标引方法就很简单明了,只需要将这一个主题找出来然后对应相应的主题词表或者分类表进行标引。但是现在的档案在大多数情况下可能不止有一个主题词,那么就需要用一定的方法进行标引。

4.1 主题标引方法

涉及到多主题的档案时,主题标引运用到了概念限定组配和概念相交组配两种方法,概念限定组配通过主题词间存在的语义关系和语法关系,一个概念用一个或者多个主题词,限定概念与被限定概念之间有并列关系,不能存在相交关系。“资本主义国家”这一主题概念,就是通过“资本主义”这个主题概念和“国家”这个主题概念次进行限定组配,使概念专指度更高。概念相交组配,是几个主题词具有概念交叉关系,而这几个主题词的外延又能找到交叉点或者有重合的部分,譬如说,“女人”与“学者”这两个概念进行组配,会得到“女性学者”这一专指程度更高的概念。

4.2 分类标引方法

假如不同的方面来论述同一个主题,那么将会按照分散和集中的要求录入相应的类目。多主题的情况下(按照情况选出最切合的三个主题,分别选出第一主题,第二主题和第三主题,不超过三个),主题是并列关系的话,那就给每一个主题都给予分类号;主题是从属关系的话,主题应该分清上下关系,选出最上位的主题,并给予分类号;还有几种可能,假如主题间的关系是因果关系,一般应该标引结果方面所属类目的分类号;若几个主题论述是受影响关系的话,则按受影响的主题赋予分类号。如果几个主题是论述理论与应用的关系的,则应用所属类目赋予分类号。

主题标引在遇到多个主题词时用的标引方法是将概念进行组配,涉及到的是主题词的语义关系和逻辑性质;分类标引遇到同样的情况时,考虑的更多的是主题词之间的关系。在多主题条件下,两者都会利用运用到多标识符号的方法,但是方法又不大相同。前者侧重概念,后者侧重关系。

5 总结

主题标引的灵活性较强,因为其方法使用的依据为主题词,在该方法的使用过程中,主题词表会因为更多新事物、新学科、新研究的出现而增、删、改,不受结构的限制,检索者能通过标引上的主题词直接、客观地了解到档案的主要内容,专指性是它的主要特性。但是可能会有主题分析会产生误差、主题词组配容易出错、不规范用词比较泛滥等问题出现,就导致了标引结果准确率的降低。该如何避免这些问题呢?首先可以对自由词进行规范化处理,无论是自动标引还是人工标引,都要进行自由词的登记。建立自由词词表,逐步确定自由词词性和语义关联关系,加强管理。在进行自然语言与档案语言之间的转换时,要遵循主题词表的原则,使转换过程更具有原则性。最后,还需要更进一步地完善主题词表,在新事物、新学科、新研究出现的时候,积极主动去了解,不一定要等到这种新主题词汇在档案中出现再考虑是否添加到主题词表,要有预见性,可以提前做准备。当然,也要注重主题词表中对主题词质量的控制,选出的主题词必须要有理论依据来支撑。

分类标引具有较高的适应性,它既可以适应标引文件,也适应利用者检索,而且也适应组织目录、档案的排架。但是它着眼于事物的方面,研究和确定它属于什么范畴以及它与事物之间的纵横关系,强调系统性,能反映事物的共同方面。所以它只强调系统性,专指性不强。在分类标引工作过程中可能因为程序的第一步——确定使用何种分类表的错误,而导致后面的程序都往错误的方向发展,所以,档案标引人员不仅要非常了解《中国档案分类法》,熟悉每一个分类表的列类标准和列类原则、方法、类目、含义,还要对一些类目划分和排列的隐含规则还有类目隐含内容有所了解和掌握。才能按照分析出来的主题,从分类表中找出最合适的类目。在日常生活中,有的档案并没有那么“单纯”,牵扯到几个门类或者在一个门类中的多个问题,这不仅仅要反映出主要类目,其他的相关类目也要反映出来,这样才能为利用者提供较多的检索途径和达到充分反映的要求。分类标引看似简单操作,其实也需要灵活多变的思维来进行标引工作。分类标引的深度应该适可而止,不能标引过深也不可标引过浅。

综上所述,主题标引和分类标引虽然有共性,都围绕寻找主题词展开工作,方法思路也大致相同,但是二者在标引文献所用的标识符号、方法侧重、功能等方面也存在着根本的差别。主题标引具有直观性、灵活性、专指性的特点,对于档案检索来说,精确度高,有利于对有特殊性质档案的检索。分类标引具有结构性、间接性、严密性等特点,对于标引和检索来说,容易掌握,易标易检,便于族性检索。它比较适用于计算机认读方式的标引工作,特别是数据库表的标引工作。既然主题标引和分类标引之间既有共性又有特性,于是有的学者提出如果能把两者的优点相互结合、各取所长,作出主题标引和分类标引一体化的假设。现在看来,需要考虑的因素较多,一体化的假设能否被证明还有待考究。

猜你喜欢
标引类目主题词
中医古籍医案知识元标引方法的思考及对策
作者书写关键词须知
本期练习题类目参考答案及提示
智能传感器的智慧战略,新技术创造新价值
《中图法》(5版)“K历史、地理”大类的修订
《中图法》(5版)“R医药、卫生”类修订探析
取消公文主题词的真正原因是什么?
公文主题词消失的原因浅析
浅析《中国图书馆分类法》(第五版)G25类修订特色及问题