网络信息资源的关键词检索策略探析

2018-12-28 02:49师忠凯
中国管理信息化 2018年20期
关键词:搜索引擎检索数据库

师忠凯

[摘 要]随着我国网络技术和信息技术的蓬勃发展,推动了社会进一步实现信息化,更多的用户开始选择使用网络获取资源和信息,而关键词检索是获取和搜索信息的重要途径。但是想要节约检索时间、提升检索效率,用户需要掌握使用关键词检索的技巧和方法,保证搜索的查准率和查全率。本文主要针对网络信息资源的关键词检索策略进行分析和探究,希望能够为广大用户提供借鉴。

[关键词]网络信息资源;关键词;检索

doi:10.3969/j.issn.1673 - 0194.2018.20.075

[中图分类号]G354[文献标识码]A[文章编号]1673-0194(2018)20-0-02

0     引 言

随着人类社会逐渐实现网络化,计算机和因特网已经在世界范围内得到全面普及,网络中的资源和信息众多,是人们获取信息的主要途径,但是如何从海量的网络信息中,在最短时间内找到自己需要的信息,是用户需要掌握的重要技术。当前,网络信息资源检索方法较多,而关键词是用户最为常用的重要方式,但是使用关键词进行信息检索需要用户具备丰富的经验。关键词也可以称为自由词,其概念属于语言范畴,体现了文献资源的主题,具有较强的检索意义,能将文献从海量的信息中快速提取出来。当前,关键词检索是全部搜索引擎普遍采用的检索方式,虽然在检索学发展早期,关键词由于在手工环境下具有较高的操作难度而受到冷落,但是随着计算机的普及和网络技术的发展,知识和信息更新的速度显著提升,关键词再次受到重视,并且逐渐成为搜索引擎的重要检索方式。

1     关键词检索

分类浏览和关键词是网络信息资源检索的两个重要方式,随着时代的发展,关键词逐渐成为用户普遍使用的重要检索方式,其可以根据用户输入的关键词让检索完全实现自动化,虽然单一关键词会降低检准率和检全率,但是通过科学的检索策略,能够帮助用户快速获取资源。

2     关键词检索的主要优势

2.1   检准率较高

关键词语言是一种较为精确和专指的词汇,其来自全文、摘要、网页题名或者网站中任何一个有意义的词汇,用户使用关键词进行资源检索,能够在最短时间内获取想要的信息。例如,利用当前被人们广泛使用的百度搜索引擎,当用户输入“山羊养殖技术”后,就会出现大量有关山羊养殖技术方面的资源,用户可以结合自身的需求灵活选择观看和下载。

2.2   简单易学

关键词检索具有简单易学的优势,可以满足不同用户对资源检索的需求。以往的手工检索主要使用受控语言,检索具备一定难度,很多用户需要长期学习才能掌握检索方式。关键词检索来自自然语言,专业程度较低、摆脱了词表控制,用户不需要专业培训,结合自身需求就可以自由灵活地表达信息需求和主题概念,可以帮助用户快速获取想要的资源。

2.3   数据库更新时间短、容易维修

当前,所有搜索引擎都采用动态跟踪软件,为了满足用户的实际需求,程序时刻处于运行中,根据科学技术的更新情况,及时改变和增删关键词,通过关键词检查,数据库的更新时间更短、也更加容易维修。例如,我国知名的搜狐网站,数据基本一日数更,但是如果采用人工标引,数据库可能需要一个月或者几个月才能更新一次。

2.4   降低成本

在信息时代,网络资源呈现海量化和无序化,面对不断膨胀的信息资源,通过人工标引检索方式难以满足用户需求,成本也更加高昂。自动标引不仅可以满足时代的发展要求,还具有建库成本低、效率高以及速度快的优势。关键词以自然语言为基础,特别适合动态跟踪软件,例如用户在输入“昆虫”“机器人”“玩具”“雪佛兰”等词汇后,网页会自动给出与之相关的资源,可以有效降低检索成本,也正是因为该原因,才使关键词检索受到搜索引擎和用户的青睐。

3     网络信息资源的关键词检索策略

3.1   词组检索

词组检索是当前用户最为常用的检索方式,但是只有关键词准确合理,才能保证获取想要的资源,确保检索的准确性和深入性,如果关键词不合理,用户难以对网络资源信息进行有效挖掘,获取的文献也难以满足自身的实际需要,因此,用户只有对关键词检索进行深入了解后,才能合理选择关键词,保证组配正确,进而获取有用的、想要的资源。例如,同一关键词可能存在不同的英文翻译方式,用户只有掌握正确的中文关键词组配方式,才能防止出现漏检的情况。对于刚刚接触网络资源信息的用户而言,想要全面获取想要的信息,需要将所有英文相关词和同义词都作为关键词,虽然检索信息量更大,更是在有效甄别可以获取更多的有用信息。

用户在使用关键词检索的过程中,如果使用单一词组,虽然具有较高的查全率,但是查准率却难以保证,很多资源都是无用信息,用户需要在海量的资源中进行甄别,从而必然会浪费用户更多的时间。因此,通常情况下,用户都需要利用两个或者两个以上的关键词进行信息检索,通过合理组配关键词保证检索的查准率和查全率。在检索过程中,用户要结合自身的实际需求,把握信息资源的重点,合理组配和编制关键词,进而才能准确地获取想要的信息,但是用户需要注意,关键词并不一定会出现在标题中,也可能出现在网页正文中。

3.2   布尔检索

布尔检索是一种高效的检索方式,其利用逻辑算符进行关键词检索,是搜索引擎和情报检索系统最为重要的检索方式。当前,较为常用的布尔检索算符包括:“NOT”(-)、“OR”(+)、“AND”(*)3種,例如,用户输入“管理AND数据库”,互联网会给出同时包含“管理”和“数据库”两个词的资源信息;又例如用户输入“管理OR数据库”互联网会给出至少包含“管理”和“数据库”一个词的资源信息;再例如用户输入“管理NOT数据库”,互联网会给出只包含“管理”,却不包含“数据库”的资源信息。因此,用户只有全面掌握布尔逻辑算符,才能提升信息的检查率和查准率,获取自己想要的资源信息。

3.3   截词检索

截词检索是当前较为常用的关键词检索技巧,在英文检索中被广泛使用。由于英文构词更加灵活,词干上配上不同的后缀和前缀会衍生出更多的新词汇,很多词汇之间的含义虽然相同,但是如果检索方式不正确,会出现漏检的情况。截词检索是方式出现漏检情况的重要方式。其主要是指用户对词汇进行合理截断,利用其中第一部分开展关键词检索,符合这部分词汇的字符都会显示出来。截词检索主要分为左右截词、中间截词、左截词和右截词4种方式,利用截词检索能够切实提升信息查全率,并且拥有字面成族、智能延伸的作用。

3.4   限定检索

随着信息技术的蓬勃发展,网络中的资源信息呈几何数量增加,而想要在最短的时间内获取有效的资源,用户可以采用约束检索或者缩小检索的方式进行信息检索,而这种方式为限定检索。该检索方式较多,使用也更加灵活,例如用户用字段的方式进行检索,可以有效缩小检索范围,限定方式可以是URL、内文、标题、网页层次以及网站等,还可以是专家推荐、收费情况、范围、类型、语言以及日期等。通常情况下,限定检索属于一种较为高级的关鍵词检索,可以帮助用户快速过滤不需要的信息,节约用户的精力和时间。

3.5   加权检索

加权检索属于对关键词关系进行表示和限制的方式,其属于布尔检索的升级版或者改进版。由于布尔检索无法列出检索结果的等级,用户也就不能分辨信息的有效性和重要性,而通过加权检索可以帮助用户判定字符串和检索词,对文献命中的影响程度,结合权值不同,依序列出更加重要的资源信息。但是在具体使用中,搜索引擎的加权检索功能存在较大差异,其在检索结果、权值计算和加权方式方面都不相同。

3.6   概念检索

目前,我国搜索引擎的关键词检索功能,其主要方式是利用计算机对用户输入的关键词进行机械匹配,更加注重字符所体现的外在形式,无法匹配字符所代表的主题,导致检索具有一定的局限性。概念检索属于一种全新的关键词检索方式,其试图突破以往关键词匹配的表面性缺陷,从关键词的意义和概念方面满足用户对信息资源的需求。例如,用户在输入“酒精”这一关键词后,网络会给出大量有关酒精的信息,但是用户可能希望将“酒精”与一种溶剂、一种反应物或者一个产品联系起来,因此,只有搜索引擎具备更高的智能性,才能满足用户的需求。

4     结 语

在信息时代,人们获取信息的方式更加多元化,而网络作为当代人民生活和工作的关键组成部分,更多的使用者选择利用网络获取资源,关键词检索也逐渐受到人们的青睐。关键词检索具有使用方便、简单易懂的优势,但是想要切实提升资源信息的检全率和检准率,用户需要掌握相关检索技巧,而相关部门也要加大科学研究,提升关键词检索的智能化程度,进而满足用户的使用需求。

主要参考文献

[1]闵超,孙建军.基于关键词交集的学科交叉研究热点分析——以图书情报学和新闻传播学为例[J].情报杂志,2014(5).

[2]陈巧云,李艺.中国教育技术学三十年研究热点与趋势——基于共词分析和文献计量方法[J].开放教育研究,2013(5).

[3]宋亚辉.竞价排名服务中的网络关键词审查义务研究[J].法学家,2013(4).

[4]张婷燕,赵文婷,窦睿.网络信息资源的关键词检索策略[J].山西科技,2013(4).

[5]马惠珠,宋朝晖,季飞,等.项目计算机辅助受理的研究方向与关键词——2012年度受理情况与2013年度注意事项[J].电子与信息学报,2013(1).

[6]安源.2000-2009年图书馆信息服务领域研究现状分析——基于词频分析法和共词分析法[J].情报科学,2012(6).

[7]曹树金,马利霞,郑敏.用户网络信息查询需求研究[J].情报科学,2006(6).

[8]张琪玉.网络信息检索工具的分类体系——网络信息检索工具发展的方向与提高竞争力的途径(连载三)[J].江苏图书馆学报,2002(4).

猜你喜欢
搜索引擎检索数据库
2019年第4-6期便捷检索目录
专利检索中“语义”的表现
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
国际标准检索
国际标准检索