何素清 刘树春
〔摘要〕全文搜索引擎是目前比较有效的网络信息搜索工具。本文比较了谷歌、百度、必应、雅虎、搜狗、有道和搜搜等常用的7种搜索引擎的学术信息搜索情况、特色功能和搜索语法。在介绍功能特色的基础上,分析了这些功能在学术信息检索中的应用特点。
〔关键词〕搜索引擎;功能特色;信息搜索;比较分析
收稿日期:2011-01-07
作者简介:何素清(1961-),女,副研究员,研究方向:图书馆管理。
DOI:10.3969/j.issn.1008-0821.2011.06.032
〔中图分类号〕G254.9 〔文献标识码〕A 〔文章编号〕1008-0821(2011)06-0127-03
The Comparative Analysis of Searching Engines and its Characteristic Functions
He Suqing Liu Shuchun
(1.Library,China Medical University,Shenyang 110001,China;
2.Library,Liaoning University of Traditional Chinese Medicine,Shenyang 110847,China)
〔Abstract〕Search engines are considered to be the most effective information searching tools on the Internet.The characteristic functions and special searching syntax of frequently used search engines,including Google,Baidu,Bing,Yahoo,Sogou,Youdao,SoSo,were compared and the application in the academic information searching was analyzed.
〔Key words〕search engine;characteristic function;information searching;comparative analysis
常见的全文搜索引擎都具有信息容量大、检索界面简洁、检索功能齐全、检索速度快等特点。但是,不同的搜索引擎在信息的提供数量以及各类特色搜索功能和服务方面都存在差异。本文将对谷歌(Google)、百度(Baidu)、必应(Bing)、雅虎全能搜(Yahoo Search)及国内搜狐公司的“搜狗”、网易公司的“有道”、腾讯公司的“SOSO搜搜”等全文搜索引擎进行比较,以利在学术信息搜索中充分利用这些搜索引擎的特色功能与服务。
1 不同搜索引擎的搜索结果比较
现选取四组生物医学相关的关键词(中文关键词以词组形式搜索)分别通过7个搜索引擎进行中、英文对照搜索,并对搜索结果进行比较。见表1。
表1 不同搜索引擎的搜索结果比较(单位:万条)
搜索日期为2011年1月5日
虽然选取的搜索词较少,但也在某种程度上反映出同一个关键词利用不同的搜索引擎所获得的搜索结果条数差异很大,在文种上也有不同。其中,通过谷歌和百度获得了数倍于其他搜索引擎的搜索结果;必应的搜索结果虽然在总量上不如谷歌和百度,但数倍于雅虎全能搜及国内开发的几种搜索引擎。在外文关键词的搜索方面,谷歌、必应具有较明显的优势,而在中文关键词的搜索上,百度则具有明显的优势;雅虎全能搜、搜狗、搜搜和有道虽然在信息提供总量上不如谷歌、百度和必应,但体现出了以提供中文信息为主的特点。
需要说明的是,由于谷歌属于多语种搜索引擎,具有170余个国际域名,并且针对不同国家地区来源的用户提供有针对性的服务。因此,即便是利用同一关键词通过谷歌(Google)在不同国家的镜像站点搜索其结果也会有所差异。
2 常用搜索引擎的特色功能比较
在常规的信息搜索中,用户多利用这些搜索引擎的一般搜索功能,即直接输入一个或多个关键词进行快速搜索,或利用其高级检索功能进行关键词组配搜索,对获得信息的查全率和查准率通常关注不够。
由于信息的海量增加,单纯依赖搜索引擎的快速搜索功能已经不能满足用户的需要,尤其是在学术信息的搜索中,既要求方便、快捷,还需要及时、准确、全面。因此,搜索引擎逐步扩展其特色功能,以利于用户高效地搜索、筛选、获取所需要的信息。
常见的全文搜索引擎均具有快速搜索、多词组配搜索、搜索字词纠错、拼音输入提示汉语关键词、相关搜索词语推荐和网页快照(缓存页)等功能,但不同的搜索引擎在其他特色功能方面也略有区别(见表2)。
表2 常用搜索引擎的特色功能比较
从表2的比较可见,在特色功能方面,谷歌提供了较全面的功能与服务,而雅虎全能搜则提供的特色功能最少。此外,谷歌和必应在网页即时翻译和搜索语言限定方面是其主要特色。
除了谷歌以外,国内开发的搜狗、搜搜、有道在对搜索结果进行内容类型或发布时间的筛选功能方面比较完备,而百度、雅虎全能搜及有道提供了进阶二次搜索(在结果中搜索)的功能,有利于对所需要的搜索结果进行快速定位;此外,谷歌和有道在搜索结果显示列表中,还提供了“类似网页”或“类似结果”的链接,方便用户延伸和扩展搜索。
值得注意的是,百度在其搜索首页上,提供了搜索字词的辅助输入法,包括手写输入和拼音输入,对非常用字或不知读音字词的输入和搜索提供了辅助功能。
虽然除了雅虎全能搜以外,其他搜索引擎均具备对HTML网页以外的特定二进制文档内容进行限定搜索的功能,但可搜索的文献类型也略有差异。其中,谷歌可以支持对PDF、DOC、PPT、XLS、RTF、SWF、PS、DWF、KML、KMZ等10种二进制文档的内容进行限定搜索,而百度、搜狗、搜搜、有道等只可以对DOC、XLS、PPT、PDF、RTF等5种文献类型进行限定搜索。
上述搜索引擎均具备输入词下拉菜单提示功能,但谷歌、必应、百度针对中外文字词的下拉提示功能尤其强大,而另外4种则在中文关键词提示方面较为完善。而且,谷歌、必应、雅虎、有道还提供输入汉语拼音缩写提示中文关键词的功能。
3 搜索引擎特色功能及在学术信息搜索中的作用
3.1 搜索引擎的特色功能和作用
3.1.1 搜索引擎对检索结果的分类过滤筛选功能
虽然搜索引擎通常依据一定的算法将搜索结果按照与搜索词的相关性或时间顺序排列,但在一般信息搜索中,由于检索出的信息量大,反馈的结果往往伴随着无数的冗余信息[2],给用户浏览造成困难。据调查[3],搜索引擎用户只浏览第一页搜索结果的比例高达62%,而浏览3页以上搜索结果的用户仅有10%。因此,只通过搜索引擎的检索功能难以实现对获取信息的有效利用。所以,谷歌、搜狗、搜搜和有道等搜索引擎对搜索结果提供了分类过滤功能。从信息类型(图片、视频、新闻、音乐、博客、问答、论坛等)、发布或更新时间、基本格式或信息来源等角度对搜索结果进行分类、限定、筛选,过滤,以缩小检索范围,利于用户更加精确地获得有用的信息。此外,Google英文版在2010年2月新增了1个“Nearby”筛选功能,可以对检索结果进行地理位置(州、城市)分类过滤,使得获得的信息范围更具体。
3.1.2 搜索词的纠错和相关提示功能
常用的搜索引擎都具有搜索词的纠错和扩展提示功能。例如,在检索输入框中键入“格林巴利综合征”,系统在搜索的同时,还在最前方显示“您是不是要找:格林巴利综合症”,提示用户输入的检索词可能存在拼写错误,方便用户对检索词进行修正。同时,在检索结果列表的最后还列出“相关搜索”提示,包括检索词的相关概念扩展、检索词的不同拼写方式等,以帮助用户纠正、扩展检索词,准确、完全地获得所需要的信息。
常用的搜索引擎也提供关键词下拉菜单提示功能。当在搜索框中输入关键词或词的一部分时,搜索框会展开下拉提示菜单,向用户展示与所输入关键词最接近的热门搜索词。此项功能既有助于用户快速输入检索词,同时也可以帮助用户避免输入错误,扩展检索更多的相关词语,以免漏检。
3.1.3 搜索引擎的网页快照功能
目前常用的搜索引擎均提供网页快照(缓存页)功能,即搜索引擎将搜索到的网页都做了一番“预照”处理,索引后放在服务器上备查。当提供原始网页的服务器暂时出现故障时,用户仍可浏览该网页的内容。在找不到原始服务器的情况下,这些储存的网页快照也可救急。虽然网页快照中的信息可能不是最新的,但在网页快照中查找资料要比在实际网页中快得多,而且还可以获得网上已经删除的网页信息。在信息查询中,对有些需要授权才能阅览和利用的资源或信息,如期刊论文全文等,通过快照功能,往往可以满足部分或全部需求。
3.1.4 搜索引擎整合翻译功能
谷歌、必应等搜索引擎在搜索结果列表中整合了翻译功能。当搜索结果为非用户使用的文字时,通过点击“翻译此页”(Translate this page),即可将其翻译成用户所设定的文字。对国内用户来说,通过点击“翻译此页”,即可将其他文种的网页翻译成中文,也可以通过选择将网页翻译成日、韩、俄、法、德等其他数十种文字。通过此项功能,既有助于用户对其他语言信息的阅读,同时也可以方便用户搜索其他特定文字的相关信息。
必应搜索引擎还提供了“翻译通”,其网页翻译(双语浏览器)功能可以实现原始网页和翻译网页的对照浏览,也可以实现文本的在线翻译。
在“谷歌翻译”界面,可以利用Google的翻译功能,将已经输入的中文检索词直接翻译成其他语言,如:可以将“格林巴利综合症”翻译成日文(ギラン·バレ一症候群)、法文(Syndrome de Guillain-Barré)等并执行检索,获得相应文种的信息以及翻译成中文的对照信息。此项功能方便用户利用中文关键词对外文相关信息的直接搜索,避免外文关键词输入的错误及关键词翻译障碍,也有助于对外文网络信息的阅读。
3.2 搜索引擎的特殊搜索语法功能及其作用
3.2.1 对特定网站进行限定搜索
常用的搜索引擎不仅可以搜索整个互联网络,也可以通过其“site:”语法功能将搜索限定在某个具体网站或者网站频道,如“www.cnki.net”,或者是某个域名,如“net”、“edu.cn”等等。或利用该语法通过在其前面加“-”排除某网站或者域名范围内的页面。搜索引擎的此项搜索功能可以被用作搜索特定网站上发布的内容,如:可以查询特定图书馆的OPAC目录中的书刊收藏信息等。
3.2.2 对特殊文件类型的信息限定搜索
大多数搜索引擎提供了非常实用的一个搜索语法-“filetype:”。也就是说这些搜索引擎不仅能进行一般的网页文字搜索,还能对某些二进制文档(PDF、DOC、PPT等)中的字词进行全文搜索。用户可利用此项功能在网上快速搜索图书、期刊论文、学位论文、教学课件、教案、统计图表等特定格式的文件信息。网上提供的免费图书、期刊论文全文及机构内授权数据库中的文献全文等都可以利用此项功能直接搜索、在线阅读或下载,而不必再去翻阅期刊或选择数据库查询。
3.2.3 网页延伸搜索功能
在文献检索和文献分析中,经常利用Science Citation Index查询期刊之间、文献之间的引用关系,继而达到扩展检索相关文献和评价文献重要性的目的。而搜索引擎也可以获得特定网站被其他网站的链接情况。通过网站之间的相互链接,扩展获取其他关联的网站信息。搜索引擎的“link:”语法可以查询有哪些网站对当前所查询网站做了链接。此项功能可有助于用户了解哪些网站(网页)与当前查询网站具有相关性。
4 结 语
在常见的搜索引擎中,谷歌和百度在信息容量方面具有明显的优势,而且前者在提供外文信息,后者在提供中文信息方面特色显著。必应提供的信息以外文为主,而雅虎、搜狗、搜搜和有道主要提供中文信息,外文信息相对较少。
网络搜索引擎在提供网络信息的一般搜索的基础上,开放出越来越多的功能与服务。在此方面,谷歌是具有明显的优势,其他几个搜索引擎各有各的特点。只有在信息查询中充分利用这些特色功能,掌握搜索引擎的使用技巧,才能确保及时、有效、准确、全面地获取所需要的信息。
参考文献
[1]孙桂华.谈谈网络搜索引擎的发展及使用技巧[J].农业图书情报学刊,2009,21(6):49-51.
[2]许赛路,佘正平.百度与Google搜索语法比较分析[J].情报探索,2009,(10):70-71.
[3]易推科技.用户体验概念和搜索引擎用户的共性[EB].http://www.yitui.com.cn/sem/475.html,2011-01-07.