浅议搜索引擎

2014-07-24 16:38尹振鹤
无线互联科技 2014年5期
关键词:电子信箱搜索引擎站点

尹振鹤

摘 要:搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。它主要是用于检索网站、网址、文献信息等内容。本文将从搜索引擎的工作方法和使用技巧等方面进行阐述。

关键词:搜索引擎;元搜索引擎;关键词

1 搜索引擎的工作方法

1.1 目录式搜索引擎

这是一种网站级搜索引擎。目录式搜索引擎由分类专家将网络信息按照主题分成若干个大类,每个大类再分为若干个小类,依次细分,一般的搜索引擎分类体系有五六层,有的甚至十几层。先由程序自动搜集信息,然后由编辑员查看信息,人工形成信息摘要,提供目录浏览服务和直接检索服务。由于目录式搜索引擎的信息分类和信息搜集有人的参与,因此其搜索的准确度是相当高的,缺点是需要人工介入、维护量大、信息量少、信息更新不够及时。Yahoo就是这类搜索引擎的代表。

1.2 全文搜索引擎

根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。

1.3 元搜索引擎

这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个预先选定的独立搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。优点是返回结果的信息量更大、更全,缺点是用户需要做更多的筛选。第一个元搜索引擎,是美国华盛顿大学硕士生Eric Selberg和 Oren Etzioni开发的Metacrawler。元搜索引擎的搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。

2 搜索引擎的使用方法与技巧

2.1 科学选择关键词

搜索引擎不具备智能识别能力,往往不能很好地把握用户到底想要什么,它只能在现存的数据库中查找匹配的关键词,这种匹配相对比较盲目。因此,选择合适的关键词是成功检索的第一步。关键词的选择虽然没有什么定式,不过也有一些规律可循,在提取关键词时力求做到规范,避免口语化,便能达到事半功倍的效果。

2.2 使用双引号进行精确查询

如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。例如,欲搜索某些学校的电子信箱,一般策略是在搜索框内输入“xxx学校”,也可以尝试如下两种方法提高搜索效率:(1)同时输入两个关键词,缩小检索范围,即“xxx学校email”或“xxx学校电子信箱”;(2)关键词中加入电子信箱关键信息,即“xxx学校@”。因为任何电子信箱中均有“@”,“@”成了查找电子信箱的关键符号。通过这两种方法,很容易就能将学校的电子信箱搜到。

2.3 使用加号(+)、减号(-)限定查找

很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(-)限定搜索结果不能包含的词汇。

2.4 灵活运用使用通配符

很多搜索引擎支持通配符号,如“*”代表1连串字符,“?”代表单个字符。

2.5 使用逻辑词辅助查找

比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND(和)、OR(或)、NOT(否)及NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。

2.6 按文件类型查找

如需要查找简历模版时可以构建如下检索式:“简历模版filetype:doc”,此时能搜到word格式的简历模版。此处的filetype:doc是限定检索文件的类型,该字段必须在英文状态下录入,而“简历模版”是检索的关键词。两个字段之间必须用空格隔开。同理,如果需要检索市场营销的教案也可以构造“市场营销教案filetype:ppt”的检索式,检索结果为ppt格式的市场营销教案。该检索式支持txt,ppt,xls,pdf,mp3,swf等常见文件类型。

2.7 巧用快照

有时会搜到访问不了的“死链网页”和过期文件,而看其内容摘要很符合需要。此时可利用搜索引擎提供的网页快照功能查阅此类文献。

2.8 使用不同的搜索引擎

不同的搜索引擎,其信息覆盖范围有差异,我们平时搜索信息时仅集中于某一家搜索引擎是不明智的,因为再好的搜索引擎也有局限性,而使用优秀的搜索引擎可以达到事半功倍的效果。

2.9 留意搜索引擎返回的结果

由于竞价排名业务的推广,搜索引擎返回的Web站点顺序会影响人们的访问。所以,为了增加Web站点的点击率,一些Web站点会付费给搜索引擎,以在相关Web站点列表中显示在靠前的位置。好的搜索引擎会鉴别Web站点的内容,并据此安排它们的顺序,但许多搜索引擎无法鉴别。

[参考文献]

[1]王慕东.搜索引擎的发展状况及使用技巧.信息系统,2001(4).

[2]陈春阳.如何利用网络搜索引擎检索网络信息资源.兰州工业高等专科学校学报,2003.

[3]张曼玲.现代信息检索[M].哈尔滨工程大学出版社,2000.

猜你喜欢
电子信箱搜索引擎站点
基于Web站点的SQL注入分析与防范
2017~2018年冬季西北地区某站点流感流行特征分析
首届欧洲自行车共享站点协商会召开
怕被人认出
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
通 知
广告主与搜索引擎的双向博弈分析
通 知