由维丽
信息检索通常指文本信息检索,包括信息的存储、表现、组织、查询、取词等各方面,其核心的内容为文本信息的检索与索引。信息检索起源于19世纪下半叶图书馆的参考咨询和文摘系列工作,发展到20世纪40年代,检索与索引已成为图书馆的一项独立服务项目。下面我们就来具体的分析一下信息检索大至经历的几个阶段。
一、手工检索
手工检索是传统图书馆的主要检索方式,如手工目录查询,手工分类等,所有的操作都是由馆员们亲手完成的,方法简单,灵活度差,而且费时费力。随着时间的推移,科技的进步,手工检索系统也应运而生了,手工检索系统是通过手工利用各种检索工具进行信息的检索。根据检索工具的形式,手工检索系统可以分为书本式检索和卡片式检索系统书本式检索系统是以印刷出版物形式出现的,为人们查找各种信息所使用的检索工具,如各种文摘、题目或图书目录、索引期刊、参考工具等。书本式检索系统是最早形成的信息检索系统,也为计算机信息检索的产生奠定了坚实的基础。卡片式检索系统是以卡片组成的存储和信息检索的检索系统,如图书馆的各种卡片式目录及书上特有的编码排序等。与书本式系统相比而言,它更便于积累和更新,适合各单位、个人建立使用,成本较低。随着计算机技术在图书管理中的应用,卡片式检索系统也将逐步被计算机目录系统所取代。
二、计算机检索
计算机检索是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索地方法。也就是计算机检索人员利用计算机信息技术,全面运用自己所了解和掌握的计算机信息数据库提供的各种操作,进行人、机的积极配合,从而快速,有效地查找获取信息的过程。这种检索方式也正是目前我国高科技图书馆所大面积采用的手段。计算机检索要经历大致六步。
1.接受课题。这里的接受是指被动接受,是用户主动提出问题,等待我们去解决。
2.分析课题。分析课题是制定检索策略的主要依据,也是正确使用数据库、编写检索,运用各种运算符的先决条件。它包括对课题内容的定位;自由语言与数据库标引语言的对等;检索要领的选择等。对课题的分析,直接影响检索策略的质量和检索的最终结果。
3.选择数据库。检索人员接受某一课题后,要对课题进行仔细的分析研究,以便准确选择适宜该课题的数据库类型。包括所选数据库是按何种方式组档;所选用的检索项;以及检索项目采用的是哪种检索方式等。
4.确定检索策略。检索策略是检索人员对检索信息要达到的目标的预想。其目的是为查全率和差准率。查全率是指系统检索时能检出相关文献的能力,查准率是指系统检索时拒绝不相关文献的能力。
5.编制检索式。是指检索人员针对本课题的要求,选择检索词的逻辑算符、裁词算符、位置算符等各种组配形式,以达到最合理最科学的选择方式。它同样关系到提高文献查全率和查准率的问题。
6.整理检索结果。这是计算机检索中的一个极为关键的环节。它涉及到用户满意度的问题。如果检索结果正确,用户的满意度就高,反之,用户满意度就会大大降低。从用户满意度中可以对工作人员的工作质量进行评估,以便从中总结经验,吸取教训,取长补短,从而提高服务质量。另外,还可以对一些问题进行总结,整理归档,以便再遇到同类问题时,不走重复路,提高服务效率。
近些年,计算机检索手段逾渐完善,计算机检索系统也逐步发展了起来。计算机信息检索系统主要由计算机硬件及软件系统、数据库、数据通讯等设施构成。根据其内容特点可分为:计算机单机检索系统;计算机光盘检索系统;计算机联机检索系统;计算机网络检索系统。其中计算机单机检索系统是计算机信息检索系统的早期形式,是将信息检索数据库系统建立在独立的计算机硬盘上,直接在一台计算机上进行存储和检索信息,计算机光盘检索系统是以光盘存储为数据库的存储介质,利用计算机和光盘驱动器进行读取和检索光盘上的数据信息;计算机联机检索系统是由大型计算机系统数据库,检索终端及通讯设备组成的信息检索系统;计算机网络检索系统包括局域网络检索系统和广域网络信息检索系统,这种系统也将我国的检索事业带入了一个崭新的阶段。
三、网络信息检索
网络信息检索是一个复杂的过程,它涉及到信息需求的形成与表达,检索策略的制定,检索工具的选择,检索点的确定等多个过程和环节。目前网络检索的方法有这样三种。
1.漫游法。也被人称为“偶然发现”,这是在Internet中发现信息的最原始方法,当你还在Internet上尽情“遨游”和“冲浪”时,你也许会意外的发现一些很有价值的信息,当然,有时也可能会一无所获。所以这种方法是很盲目的,没有可靠性。
2.网络地址法,也被称为“地址浏览”法。就是在寻找信息时,首先进入地址栏浏览,就像走进图书馆的书库,然后在书架上直接翻阅,查找所需书籍一样。www提供的超文本方式可以看做是浏览的一种特殊形式。
3.搜索法。这种搜索就像是通过索引或分类卡片来帮助查找一样,在Internet中有许多不同的搜索引擎,比如百度、yahoo、Google等等。他们都有不同的搜索优势。
有人会认为这种检索方式太复杂像海底捞针一样,想找到点有用的信息太困难了,其实不然,在实践中,我们发现这种网络信息检索是存在一定技巧的。比如我们可以先分析检索课题,明确检索要求,弄清楚课题学科的属性、专业范围和相关内容后,选择适当的词语,确定检索项。再将检索项之间进行逻辑组配,编制检索表达式。不管是数据库还是网上的搜索引擎,基本都具有逻辑组配检索功能。由于已确定的检索项表达的主题概念间存在逻辑关系,可通过布尔运算符和位置运算符对检索项进行组配。这样检索出的内容便会大大提高可利用率。
虽然网络检索方法具有很多明显的优势,但同时也存在着很多漏洞。因为他对检索人员的专业性要求很高,检索人员要在检索时尽可能将全部表达主题概念的检索词组配完全,也就是要把所有同义词和异环词都运用进去,否则就会出现漏检的情况。汉语本身就是一种比较复杂的语言,在检索时,如果只为了提高查全率而忽略了查准率;就会造成误检现象。检查结果不是太多就是太少,很难控制和把握。
所以,我认为,今后我国图书馆信息检索方式发展的大方向既是智能化检索。
智能化检索就是把现代人工智能的技术与方法引入到信息检索系统,使后者具有一定程度的职能特征,在更高的层次上完成它的功能。智能化信息检索的最终目的便是使信息检索系统“理解”文件包含的信息内容和用户对信息的需要程度,然后有针对性的对此要求做出灵活的准确的反应,从而实现检索的智能化。□(编辑/永安)