对《中国档案主题词表》未能广泛使用的几点思考

2010-08-15 00:53陈正娇
文山学院学报 2010年3期
关键词:词目词表主题词表

陈正娇

(文山学院办公室,云南文山 663000)

《中国档案主题词表》 (为表述方便,以下简称《中词表》)收录了不同历史时期出现的具有检索意义的词汇。在计算机技术广泛推广运用的今天,经过改版的《中词表》仍然未达到预期的效果。档案检索语言应该如何应对社会的发展成为了档案学学者研究的一个新课题。

一、《中词表》的使用及影响

《中词表》是中国档案主题标引与检索标准化的工具书,是国家标准《档案著录规则》的配套项目,于 1986年 7月由国家档案局成立《中词表》编委会着手编制,于 1988年 8月编成,同年 12月《中词表》第一版由档案出版社出版。该表由前言、说明、主表、范畴索引组成。《中词表》试行本经过 3年的试行,从 1992年 3月起开始进行修改,直至 1995年 12月修订出版。再版的《中词表》新增词目 2134条,删除词目 3531条,订正错误 405处,增补词间关系 (参照项)1.5万余处;将主表款目排序改为依词目音序、调序结合字型笔画排列,订正了词目首字笔划检字表的错漏现象;调整了部分范畴类目;编制了词族索引和人名、机构名两个附表。其中人名表收录明清以来名人 11771位,机构名表收录明清以来中央级党、政、军、社团、企事业机构名称 1900个。[1]这次修订使《中词表》在一定程度上得到了较大的完善与提高。

综上所述,不难看出:《中词表》自编制到第二次修定,历经两代,耗时 9年余,几乎处于编制修改状态中,其使用价值体现甚少。尽管再版的《中词表》有了较大的完善与提高,但是,自 20世纪 90年代中期至今,文本检索成为检索的主流,且结构较为完备,词汇比较丰富,选词统一、规范,而具有较强专业性的《中词表》却只能蒙上层层灰垢。这样一本倾注了众多档案工作者大量心血的工具书,不能充分发挥作用、体现价值,不仅违背了《中词表》编委会的编制初衷,造成人力、财力等资源的浪费,也势必对档案工作者的工作积极性带来不良影响,进而影响我国档案事业的发展。

《中词表》作为档案界的第一个标准化的主题词表,却不能充分发挥作用、体现价值,是什么阻碍了它的应用与发展?档案界内人士应如何应对挑战,使其价值得以充分体现是不可忽视的问题。

二、《中词表》未能广泛使用的原因分析

20世纪 80年代以来,随着科学技术的迅猛发展,计算机技术广泛普及运用,各行各业的管理都大踏步地向着信息化的标准迈步,我国档案工作的重心也必须面对挑战:由实体管理转向信息管理。《中词表》的出台无疑会受到界内人士的关注。因此,《中词表》颁布十几年来,在很大程度上促进了我国档案事业的发展,但是,我们也必须看到,很多档案馆 (室)并没有广泛地使用、甚至没有使用《中词表》对档案进行标引,《中词表》的检索意义与价值不能得以体现。如果我们仔细推敲,并不难发现其中的原因:

(一)自然语言对检索语言的冲击

自然语言,是指直接使用未经过控制的自然语言中的语词作为标识,进行信息资源的标引和检索。使用自然语言标引和检索的实践,可以追溯到我国唐代类书的编制和西方 13~14世纪的圣经语词索引。作为一种标引和检索方法得到社会广泛使用,则是在计算机出现以后。[2](P287)20世纪 90年代以后发展起来的互联网主要由文本组成,这进一步扩大了全文检索的使用范围。目前文本检索实际上已经超过受控系统,成为检索的主流。由此不难看出,相对于规范的人工语言而言,在档案检索中使用自然语言,可以取消复杂、费时、耗力的档案标引工作,或至少可以降低标引工作的难度和成本,使大多数未经过专门的档案标引与检索训练的用户,用自己熟悉的语言直接查询各种数据库,提高检索效率。如:“虽然美国已经出现了多个挑战 Google的自然语言搜索引擎,但是 Google对此的兴致并不高,Google的研发负责人日前表示,网民太懒,他们并不愿意输入一个完整的句子,Google更关心词组层面上的自然语言搜索技术。”[3]在计算机广泛普及运用的今天,自然语言所具有的专指度高、词汇更新及时以及面向用户能力好等优点使普通用户在档案检索中更习惯于使用自然语言。这在很大程度上冲击了检索语言的使用,对《中词表》的使用与推广造成了障碍。

(二)《中词表》本身的局限性

如词表的结构比较简单,只有主表和范畴索引、功能略显不足;词间关系显示不够完整、严谨,参照度比较低;一些同义词、近义词未加合并,词汇的等同率不高;有些词很少用,另一些常用词又未被收录等。[1]首先,《中词表》主要适用于各级各类综合性档案馆 (室)庋藏汉文档案的主题标引和检索,企事业单位的文书档案及各级机关一般公文、资料的主题标引和检索亦可参照使用。但《中词表》对科技档案中的词汇收录较少,所以不能完全满足专业档案机构的需要,必要时还需采用中央专业主管机关档案部门编制的有关专业词表。[4]其次,从使用效果上来看,由于主题检索语言被移植到档案工作领域的时间不长,既缺乏成熟的理论做指导,更没有多少现成的经验可资借鉴,因而使得《中词表》的推广与使用一直举步维艰。最后,《中词表》自诞生起,其标准化程度明显不够。档案主题词标引规则方面的标准没有制定出来,档案界也没有明确指定某个规则作为本行业的参照标准。如用主题词标引时,有的用《中词表》,有的用《汉语主题词表》,有的用专业叙词表,有的用本单位、本部门、本行业的主题词表,还有的用关键词来标引。[5]以上种种都妨碍了其推广使用。

(三)档案标引工作量太大

我国历史悠久,卷帙浩繁,而档案标引工作起步晚,加之之前没有统一的档案标引标准,所以档案标引工作就被搁置了。如截止 2005年底,云南省档案馆共保管档案、资料 693069卷 (册),其中民国档案 299169卷。[6]按现有的工作效率,民国档案光著录标引一项工作就得花费上百年的时间。历史档案尚且如此,更何况现行档案?档案标引工作量太大对档案标引工作带来的难度,影响了档案标引的质量,而且,长期的档案标引工作的实践还证明:档案标引工作存在容易错标、漏标、过渡标、粗标等诸多亟待解决的问题。档案标引工作从过程上看既简单又枯燥,需要依赖人工对档案信息进行著录、标引和录入,整个过程环环相扣,如果哪一环节出了错误,整个档案标引工作的劳动成果就会付诸东流。因此,在大工作量、高准确度和档案标引专业人员少的状态下,档案标引工作一拖再拖,工作量有增无减,给档案标引人员带来巨大的压力。

三、对 策

(一)开发主题词和关键词转换系统软件,建立平行系统

自然语言虽然具有专指度高,能提供比较多的检索点,词汇更新及时和面向用户能力好等优点,但自然语言也有其缺点,如词性、词义不规范,语义模糊现象的存在,词汇间语义关系不能全面地显示等。因此,自然语言不可能完全取代规范化的人工语言,而必须与档案检索语言结合应用。为此,档案人员应努力实现档案检索语言自然语言化,开发主题词和关键词转换系统软件,同时在一个系统中采用主题词和关键词进行标引和检索。例如在档案检索系统中,可以仿照网络搜索引擎同时使用分类检索系统和关键词检索系统的形式,同时提供《中词表》与关键词检索途径,用户可以根据自己的检索需要挑选适合的方式,或通过使用不同的系统改进检索效果。

(二)改进《中词表》,使之更适应社会发展

再版的《中词表》有了较大程度的完善与提高,但随着社会的发展,笔者认为要提高《中词表》的科学性和实用性,还有很多工作要做。如要对主、附表的词目以及词间关系进行增删改,将词目译为英文,作出英译名索引,这也是适应改革开放的需要,有利于我国一些历史档案的对外开放。具体说来,首先,一方面要解决《中词表》个别专业收词过多,不同专业之间收词数量不平衡的问题,从实际出发对词汇加以调整,增加科技、经济发展和深化体制改革中出现的新词目,删除实践证明没有标引和检索意义的词目,调整补充词目间的用、代、属、分、族、参关系,多管齐下,使之具有更广泛的指导性。另一方面,要以《中词表》为源词库,有计划、有规范地编制一批与之在选词原则、词形词义规范以及用代关系等方面完全兼容的篇幅较小而又切合专业档案部门需要的系列专业词表。其次,要推进档案检索语言的计算机化。若将计算机用于辅助编制、管理分类表和叙词表,则可克服手工编制、管理分类表和叙词表耗资、费时、投入多、效率低、差错率高等缺点。并且要抓紧推进实现词表的机读化,从而达到与《中词表》的地位和使用需要相对称的目的。最后,要明确《中词表》的权威地位。一个词表能够顺利发展并得到广泛接受,硬性的规定即标准化必不可少,而《中词表》自诞生之日起就面临着标准化程度不够和标准制定的系统性相对欠缺的尴尬境地。[5]因此,确定《中词表》的权威地位,提高其标准化程度势在必行。

(三)档案检索人员要主动开展档案标引工作,不能有“等、靠”思想

档案人员要有高度的社会责任感和敬业精神,充分发挥自身的主观能动性来对待档案标引这项工程。在熟悉《中词表》的基础上,本着对档案负责、对将来负责、对社会负责的思想,积极主动地标引。档案标引工作人员不能抱有“等、靠”的思想,而是应该从实践利用的角度出发,将自己的聪明才智奉献给档案事业,做好档案标引工作,为档案的提供利用打下坚实的基础。

四、结 语

《中词表》是我国一部大型综合性的档案叙词表,其结构较为完备,词汇比较丰富。它作为档案分类标引的主要依据,极大地促进了档案分类整理工作的开展,其完善与提高对我国的档案事业的发展有积极的促进作用。但是,从上述我们也可以看出,《中词表》还有很长的路要走。以上是笔者对《中词表》的一些粗浅想法,如有不当之处,诚请各位同仁批评指正。

[1] 周铭,吕榜珍.《中国档案主题词表》发展的历史回顾与展望 [J].机电兵船档案,2006,(1):28.

[2] 马张华.信息组织[M].北京:清华大学出版社,2001.

[3] Google称自然语言搜索不关注完整句子 侧重词组[EB/OL].http://www.lanfang.net/action-viewnewsitemid-23306,2008-05-10.

[4] 李小岗.继承与创新——《中国档案主题词表》与《汉语主题词表》之比较[J].云南档案,2008,(12):27.

[5] 李春雷.试析《中国档案主题词表》未能广泛推广使用的客观原因[J].云南档案,2008,(6):44.

[6] 吴强.彩云之南的记忆宝库——云南省档案馆[J].档案春秋,2007,(12):57.

猜你喜欢
词目词表主题词表
藏语传统辞书词目编排法探析
《〈汉语主题词表〉构建研究》
《〈汉语主题词表〉构建研究》
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
《〈汉语主题词表〉构建研究》
《〈汉语主题词表〉构建研究》
中国典籍外译过程中存在的问题与策略研究
白编《近代汉语词典》词目补遗
叙词表与其他词表的互操作标准
日语中“V1+V2型复合名词”的分类
——基于《广辞苑》从有无对应动词形角度