档案文献检索策略的构造及其实现是一个比较复杂的过程、由于用户的检索需求具有较大的随机性以及检索者对用户需求的分析和表达也往往因人而异,再加上检索系统本身功能上的不完备等多种原因,因而在构造检索策略的过程中必然会存在着一些产生检索失误的潜在根源,使检索者无法完成既定的检索目标或出现一定的检索偏差。只有通过正确分析失误的原因,采用各种反馈途径和调节方法对检索策略进行修改、完善和调整,才能最终实现有效检索,提高检索效率,达到既定的检索目标。
一、检索策略的动态过程及反馈模式
在计算机检索的条件下,由于用户的提问需求与文献标识之间的对比匹配是由计算机完成的,机器不具备人脑那样随机应变的思维活动,而是严格地执行人们事先编好的程序。因此,在构造检索策略时,需要对各方面问题作出周到、全面的考虑,对可能影响检索策略实施的因素作出事先的安排和处理,并纳入检索策略的运行过程之中。通过设计的反馈模式使检索策略明确化、形式化并固定化,以便尽可能减少检索失误的潜在根源和人为的决策失误。
一般来说,在设计检索策略的反馈模式时应考虑到以下几个方面的因素:
(1)用户的提问需求是否被准确地进行了主题分析;(2)所选数据库是否恰当;(3)所选检索送行是否恰当;(4)提问的概念组面是否被转换成了一组合适的检索词或分类号等检索项;(5)检索项的逻辑组配是否正确与完善,即检索表达式的网罗度与专指度是否恰当;(6)是否考虑了检索项的构成条件和原则;(7)所选择的关于检索结果的输出格式内容是否满足用户的相定性判断;(8)是否充分利用了各种反馈途径与调节方法;(9)是否有目的、有针对性地进行了检索效果的评价分析。
总之,通过充分利用各种交互途径和反馈信息,尽可能地疏通反馈渠道,使整个检索过程成为一个不断进行动态平衡的流通回路,使检索状态的过去、现在与将来紧密相关,并将检索过程中的动态变化以及由反馈调节所引起的检索效应都尽可能地纳入系统的控制之下,从而使检索目标与检索效果之间的距离逐步缩小,使检出的结果与用户的提问需求趋向一致。
二、检索策略的调节方法
影响检索策略构造优劣的因素有很多,但由于用户提供的提问需求以及他们可能利用的计算机检索系统的客观条件各不相同,这样,对于某—特定的利用提问需求,检索者可能选择不同的检索途径和检索项,并由此构造出不同的检索表达式。这是构造检索策略的关键。因此,当用户对检出结果不满意时,应随时进行分析比较,主要通过适当调节检索表达式中的泛指词、专指词和相关词之间的数量比例及逻辑组配关系,以达到要求的查全率和查准率的比例来改善检索效果。而其中查全率和查桩率是目前报述检索结果的最好、最常用的指标,也是衡量检索策略优劣的根本标准。因此,对于检索策略调整的重点也应放在通过调节查全率和查准率的比例关系以改善检索效率,使用户获得满意的检索结果。
检索策略中影响查全率和查准率的因素很多,但主要都包含在检索系统的收录范围、检索语言、标引和检索等方面。所有这些因素又可以概括为人为因素和客观因素两类。
(1)人为因素的影响。在编制档案检索工具时,由于收录的档案文献不全面、不明确和在标引时人为造成的各种错误,使人们在从事文献的存贮和检索过程中自觉或不自觉地造成查全率和查准率的下降,这些因素被称为是“不合理影响因素”。
(2)客观因素。在档案文献检索中,无论怎样调整检索策略,无论怎样改进检索工具的质量,要同时实现查全率和查准率的100%是不可能的。因为它们之间存在着反变关系,也就是说,在排除了人为因素影响的前提下,提出了查全率往往就会相对地降低查准率,反之亦然。具体来讲,检索时不能全面描述检索要求;检索策略过于简单;检索表达式中使用逻辑与太多,或者不适当地使用了逻辑非;数据库(或检索工具)选择不当;检索途径和检索方法过少等,都会造成查全率的下降。而使用不适当的检索词;检索系统不具备逻辑非功能和反馈功能,逻辑或使用不当;检索表达式中允许容纳的词数量有限;截词部位不当等则会造成查准率的下降。
(一)调节检索策略中提高查全率的主要方法
要提高查全率,主要应从扩大检索范围入手。常用下列调节检索策略的方法:
(1)降低检索的专指度。可以从词表中或检出的文献中选—些相关词补充到检索表达式中去,即增加用逻辑连接的相关检索向;或者,去掉一些用逻辑与(AND)连接的非主题限定词,这样对于提高查全率的效果一般比较直观明显。
(2)删除检索式的某个概念组面。这样,就可以通过降低检索表达式的网罗度而扩大检索策略的范围,以达到提高查全率的目的;但同时可能检出一些与用户提问需求无关的文献,从而降低了查准率。
(二)调节检索策略中提高查准率的主要方法
大多数检索课题的特点是高专指度的,而不是泛义的,对档案文献检索而言,尤其如此。专指度的内容多数情况下是由各方面的因素彼此制约而成的,为了提高检索课题的查准率,在有一定查全率的基础上再进行缩检,可以主要利用调节检索策略的方法。
以上说明了调整档案文献检索策略所用的各种方法及其对查全率和查准率的影响。由此可见,检索策略的构造过程,实际上就是一个通过各种反馈与调节的方法不断地消除检索行为的模糊性与随机性的动态的决策过程。检索策略与用户的提问需求以及检索结果之间所存在的差异,通过反馈形式传递到检索系统,使检索者和用户根据具体情况分析失误原因,分别采用各种相应的反馈途径和调节方法,及时改变检索策略的方向、强度和内容,最终使检出结果与用户的文献需求趋向一致。
(作者单位:齐齐哈尔市碾子山区审计局)