网络搜索引擎及Google在信息检索中的应用*

2013-11-18 13:23崔希红
潍坊学院学报 2013年2期
关键词:位置

崔希红

(潍坊学院,山东 潍坊 261061)

网络信息资源具有来源广泛、形式和种类多样、数量巨大并不断增长等特点,如何从数以万计的各类表现形式的网络信息中查找出满足特定需求的信息,是一个经常让我们感到非常困惑和迷茫的难题。面对这些种类繁多而且杂乱无章的巨大的网络信息资源,搜索引擎(Search Engineer)为我们提供了检索网络信息的途径。

搜索引擎可以说是一种互联网络信息资源检索系统,是提供互联网络信息资源检索服务的网站。通过它,可以帮助用户从浩瀚无际的互联网络信息中查找到所需要的各类信息。因此,对搜索引擎的应用做必要的介绍,是高校图书馆馆员及信息素养教育的从业者的重要任务和职责所在。

1 搜索引擎的概念和分类

搜索引擎是一种用于帮助Internet用户在互联网上查询信息的搜索工具,它以一定的策略在Internet中发现、搜集信息,并对搜集的信息理解、提取、组织和处理,为用户提供检索服务,从而起到信息导航的作用。通俗的讲搜索引擎是一种互联网络信息资源检索系统,是提供互联网络信息资源检索服务的网站。

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)、元搜索引擎(Meta Search Engine)。

全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

目录索引类搜索引擎虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

2 国内外主要搜索引擎介绍

2.1 常用英文搜索引擎

优秀的搜索引擎可以让用户更加方便快捷、更加准确地获取需要的网络信息。通用的英文搜索引擎有Yahoo(http://www.yahoo.com)、Google(http://www.google.com)、AltaVista(http://www.altavista.com)等。鉴于实践过程中,大部分读者对英文搜索引擎知识的缺乏,有必要对它们的主要功能和基本情况加以详细的介绍:

表1 主要英文搜索引擎介绍

2.2 常用中文搜索引擎

中文搜索引擎从其提供商的不同,可以分为两类。一类是国外的英文搜索引擎提供商在其原有的搜索引擎基础上提供引擎的中文版,如“雅虎中国”、“中文Google”等;另一类是国内的搜索引擎提供商开发的基于中文网络资源和中文检索系统的搜索引擎,比较知名的有百度、搜狐、新浪等。其中以百度为代表的许多中文搜索引擎在广大大学生中已经得到了十分广泛的应用。

2.2.1 百度搜索引擎(http://www.baidu.com)

百度搜索引擎于1999年底在美国硅谷由李彦宏和徐勇创建。致力于向人们提供“简单,可依赖”的信息获取方式。总量超过3亿页以上。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求,是目前国内最大的商业化全文搜索引擎,深受网民的喜爱。

2.2.2 Google中国(http://www.google.com.hk/)

“Google中国”为谷歌(Google)在中国的称呼之一。虽然从2006年Google进入中国市场以来,经历了各种风波,但迄今为止,它仍然是广大高校同学常用的重要搜索引擎之一,尤其是以整合全球信息源的高效和广博,得到了大家的认同。

2.2.3 搜狗(http://www.sogou.com/)

搜狗是搜狐公司于2004年8月3日推出的全球首个第三代互动式中文搜索引擎。搜狗以搜索技术为核心,致力于中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获取速度,为用户创造价值。

2.2.4 雅虎中国(http://www.yahoo.com.cn)

中国雅虎是美国“Yahoo”公司于1998年5月推出的中文搜索引擎,于1999年9月正式开通。它收录了全球因特网上众多的中文站点,为全球中文读者提供中文Interent导航服务。

当然,一些诸如“网易”、“搜搜”等著名的中文搜索引擎在大学生读者中也有广泛的应用率。读者可以根据自身的研究和专业需要加以使用。

3 Google中文搜索引擎介绍及应用

Google与百度这两种搜索引擎是大家最为熟悉的,甚至到了依赖的程度,然而Google与百度中的一些应用技巧却并不为大家所熟知。因此,有必要对Google加以详细介绍,以满足读者的实践信息需求。

3.1 Google的起源

Google创建于1998年9月,创始人为Larry Page和Sergey Brin,他们开发的搜索引擎屡获殊荣,是一个用来在互联网上搜索信息的简单快捷的工具。从1998年创立以来,Google富于创新的搜索技术和典雅的用户界面设计使Google从当今的第一代搜索引擎中脱颖而出。Google是全球最大的并且最受欢迎的搜索引擎,主要的搜索服务有网页、图片、音乐、视频、地图、新闻、问答等。虽然Google在中国的发展历经了种种风波,但因其高学术性,对全球资源的高效整合,收到了广大应用者的欢迎。

3.2 Google的中文界面

Google中文界面简介明确,搜索框“一目了然”,同时可以进行中英文的界面转换,页面上方可以实现“地图、图片、新闻、Gmail、翻译”等不同功能的实现,同时,在注册登录后,还可以享受更多个性化服务。“手气不错”是很多读者及其容易忽略的一项重要功能,它可以直接到相关度最高的网站,而不必经过检索结果的再次删选。Google高级搜索提供了输入项、网页语言、网页区域、文件格式、日期、关键词位置、网域、权限等自定义搜索结果,以更接近用户的检索需求,提供检索效率。

3.3 Google的一些重要检索功能

大学生对Google的使用往往满足于在检索框中输入检索词,得到检索结果后进行筛选,这种方法往往耗费较多的时间和精力,如果能为他们介绍一些简单的小技巧,例如利用“filetyp”语法来限定某一类文献形式,无疑能提高他们的检索效率,达到事半功倍的效果。

3.4 Google的学术搜索

Google学术搜索是一个可以免费搜索学术文章的网络搜索引擎,由计算机专家Anurag Acharya开发。Google学术搜索(Google Scholar)秉承着“站在巨人的肩膀上”的宗旨,成为提供可广泛搜索学术文献的简便方法。读者可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。Google学术搜索可帮助读者在整个学术领域中确定相关性最强的研究。在Google学术搜索主页上的“统计指标”可以为用户提供各种不同学科的热门出版物,以及代表这些出版物影响力“h指数”,这对用户的学术研究来说是十分有益的。值得注意的是,读者在学术搜索上发现某篇文章的引述,希望能获取该文章的全文时,仍需要了解本地图书馆是否提供了该文件的访问权限。

4 结束语

搜索引擎的学习和应用是一个长期的过程,需要在信息活动和行为实践中加以不断培养。作为信息素养教育的从业者,希望读者能通过实践应用的培养过程,具备获取和利用搜索引擎来检索信息的技能、方法,在信息意识、信息道德、信息知识等多方面达到信息化社会的需求,并把这些功能应用在学术和科研过程中,愉悦地徜徉在学术研究的海洋中。

[1]孟光均.国外图书馆情报学最新理论与实践研究[M].研究.北京:科学出版社,2009.

[2]燕今伟,刘霞.信息素质教程[M].研究.武汉:武汉大学出版社,2008.

[3]柯平.信息素养与信息检索概论[M].天津:南开大学出版社,2005.

[4]于良芝.图书馆馆学导论[M].北京:科学出版社,2003.

[5]王细荣.图书情报工作手册[M].上海:上海交通大学出版社,2009.

猜你喜欢
位置
大阳K线交易系统买入法
小学班级管理的思考
互联网环境下传统媒体的场域变迁和“感应”
浅论现代汉语构式“毫无疑问”
试论日语方位词“横”、 “隣”、“そば”、 “わき”、“かたわら”的区别
中国喜剧类电影海报标题文字设计研究
基于大数据技术的游客分析系统
对弗兰科·克莱利自身声乐感受理性的思考
河中石兽究竟在何处?
巧妙切入,激活课堂