搜索引擎及其教学应用分析

2016-03-16 17:16王胜兰
广西政法管理干部学院学报 2016年3期
关键词:搜索引擎网页检索

王胜兰

(广西政法管理干部学院,广西南宁 530022)

搜索引擎及其教学应用分析

王胜兰

(广西政法管理干部学院,广西南宁 530022)

本文论述了搜索引擎的概念、构成、工作原理、类型及搜索引擎教学应用的理论基础,通过典型案例分析了几种常用搜索引擎在教学中的具体运用.在此基础上,总结搜索引擎教学应用存在的问题并提出相应的改进措施。

综合搜索引擎;垂直搜索引擎;教学应用

[Abstract]This paper discusses the concept,construction,working principle,type and teaching theories of search engine and several individual examples are given to show how to apply them into the instruction.Finally several problems are pointing out and countermeasures are given.

[Key words]comprehensive search engine,vertical search engine,teaching application

一、引言

随着网络技术的发展,各种各样的网络信息开始以爆炸式的方式增长,如何有效、准确地获取这些信息已成为人们当前探讨的热点话题。据中国互联网络信息中心在第30次《中国互联网络发展状况统计报告》中指出截止到2012年6月底,搜索引擎用户规模达到4.29亿,较2011年底增长2121万人,半年增长率为5.2%,在网民中的渗透率为79.7%。搜索引擎已经成为仅次于即时通信的第二大网络应用。同时,该中心还对“网民在电脑常用综合搜索引擎上的搜索内容”进行了调查,其中与工作学习有关的内容占据了75.9%。通过这些数据中我们可以清晰地看出,搜索引擎已成为当前人们工作学习的重要工具。在这种背景下,探讨如何将这些搜索引擎有效的整合到教学中去就显得尤为重要。

二、搜索引擎概述

(一)概念界定

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织处理后,为用户提供检索服务,将与用户检索相关的信息展现给用户的系统。搜索引擎的目的就是帮助用户迅速查找所需的网络资源,并及时呈现给用户。

(二)基本构成与工作原理

搜索引擎一般由三个模块组成:信息搜集模块、信息加工模块、检索模块。

信息搜集模块主要是通过网络蜘蛛的爬行来实现,在具体的搜集过程将整个网络当成是一个有向图,每个网页是有向图中的节点。在爬行初始,设置好初始种子URL集合,网络蜘蛛依次获取集合中的URL地址,按照深度优先或是广度优先原则抓取网页。同时解析网页中的相关链接地址,将其放入待爬行的行列中,并依据某种算对其进行优先级排序。如此循环下去直到待爬行队列为空,便停止爬行。

信息加工模块主要指从所有抓取的结构化和非结构化的数据中提取关键信息,并创建索引的过程。在信息采集结束后,必须首先对搜索到的网络资源进行加工处理,如去重、分类、解析网页标签、去标点符号,运用分词工具,提取网页关键词,形成网页的特征量。然后索引器对文本文档进行扫描纪录并创建索引文件,以便检索器能实现高速检索,快速返回用户需要的信息。

检索模块主要是指用户提出查询申请,搜索引擎根据用户提交的查询词组,搜索索引库中的索引信息,并按一定形式返回给用户的过程。为了快速准确的返回信息,在接到用户的查询申请后必须首先对查询内容进行处理,采用与索引文档相似的处理办法来处理用户请求。在数据库中查找到与用户请求相符的内容,并采用特定算法计算各个网页与查询请求的相符程度,根据相关性的高低排序返回给用户。

(三)主要类型

搜索引擎按不同的标准可以分为不同的类型,按搜索范围搜索引擎主要可分为综合搜索引擎和垂直搜索引擎两种类型。

综合搜索引擎。通用搜索引擎是对大量的信息整合导航,将所有网站上的信息整理在一个平台上供网民使用,方面人们的快速查询。其主要特点是信息量全,覆盖各个领域和各个行业。典型代表有:Google、百度。

垂直搜索引擎。垂直搜索引擎是针对某一个行业、某一特定人群或是某一特定需求的专业搜索引擎,是搜索引擎的细分和延伸。其主要特点就是信息针对性强、结构化特征明显。垂直搜索的应用范围包括各行各业,如生活搜索、行业搜索、学术搜索、网络资源搜索等。典型代表有:Scirus、Google Scholar、去哪儿。

三、搜索引擎教学运用的相关理论

(一)以“学习者为中心”教学理论

“以学习者为中心”教学理论的核心思想是:教学活动是学生自主学习的过程,教师是学习的指导者,学习者是学习过程的主体,一切教学活动的开展都应以学习者的自主学习和协作学习为前提。教学过程注重学生的价值和权利,以促进学生发展为目标。将搜索引擎运用于教育教学,学生可以根据自己的学习风格检索所需要的学习内容,自定步调的开展个性化学习。同时教师也可利用搜索引擎开展探究式教学。如,引导学生讨论确定研究主题后,教师可以帮助学生设计一系列任务和问题,组织学生利用搜索引擎自主查找相关材料,小组协作解决问题。这一过程体现了学生在教学活动中的高度自主性,帮助学生在探索新的学习资源与新的知识领域中提高学习力。

(二)资源性学习模式理论

资源型学习概念最早来自于美国萨奇曼提出的探究训练教学模式中,萨奇曼认为基于现代社会的海量信息资源,教学应注重教给学生科学探索未知领域的方法,通过任务驱动、充分利用信息资源来解决问题。资源型学习方式强调学生运用丰富的资源,进行自主探究解决问题。网络技术的发展改变了传统的资源承载形式,数字资源已成为教学资源的重要组成部分,在这种背景下,如何有效地获取网络资源成为资源型学习开展的重要影响因素。而网络资源往往缺乏有效的管理和组织,为了从纷繁复杂的信息海洋中找到所需的信息往往需要借助于搜索引擎进行信息检索。

四、搜索引擎教学运用案例

(一)综合搜索引擎教学应用

互联网的发展改变了传统的信息资源分布格局和资源获取方式,网络已成为重要的信息载体与传播媒介。这种变化使得课堂教学逐渐由传统的授受式转变为自主学习、任务学习,而自主学习与任务学习的关键在于学习资源的获取。(综合搜索引擎具有规模大、信息丰富、查询方便的特点,很好地满足了教育教学的要求,现在Google、百度已成为教师课堂教学与学生自主学习的重要工具。

1.典型案例

案例1:百度搜索在语文课堂《乞巧》中的运用(《乞巧》是人教版第六册的一篇精读课文,是唐代诗人林杰描写民间七夕乞巧盛况的古诗)

(1)导入

“百度视频”(播放《牛郎织女的传说》),激发学生兴趣。

“百度知道”介绍有关七夕的民间传说与作者简介,帮助学生了解全诗的写作背景。

(2)学诗

“百度视频”(全诗朗读),帮助学生有节奏地朗读古诗,在朗读中感受诗的意境。

“百度图片”(出示碧霄图),帮助学生形象地区分诗句“七夕今宵看碧霄”中“宵”与“霄”的区别。

“百度图片”(出示鹊桥会),让学生体会到“牵牛织女渡河桥”的神话意境。

“百度文库”、“百度图片”(出示织女的介绍、彩云、乞巧图片),帮助学生理解“家家乞巧望秋月,穿尽红丝几万条”表达了人们向织女乞巧的心愿,希望自己也能像织女那样拥有一双“巧手”,所以古时候的少女便在牛郎织女相聚的这一天,向织女乞巧,于是渐渐地形成了乞巧节。

“百度文库”、“百度MP3”(出示《乞巧歌》,播放《相思河畔》)让学生在古代传说与音乐中静静感受古时的民间生活。

(3)回味经典

课后组织学生分小组利用百度搜集更多有关七夕的民间传说与诗歌,让学生更深切的感受我国的传统文化。

案例2:Google辅助英语教学与研究

焦建利曾在《网络时代教师必备之八项信息技术》中指出Google并非只是一个技术先进、功能强大的搜索引擎,他还是一个资源检索工具、语言学习工具、词典、资源库、百问不厌的老师,无所不知的老师。Google提供了许多简单易用的服务,其中适用于英语教学服务的主要有Google图片搜索、图书搜索、学术搜索、趋势检索等服务。

(1)图片资源。在上海外语教育出版社《泛读教程》(第三册)第四单元中出现coyote(土狼)这个单词,由于土狼不是生活在中国,所以学生不能很好地理解单词的含义。将coyot定位关键词在Google图片中检索,可以得到几百万张有关的图片,更形象的帮助学生学习单词。

(2)背景知识。外语教学与研究出版社《剑桥国际英语教程》(第三版)中一篇以the Pyramid of Sun为主题的文章,由于太阳金字塔离学生生活较远,学生难以很好的接受理解。利用Google英文搜索检索关键词Pyramid of the Sun快速找到362000篇相关的文章,以及太阳金字塔的地理位置和图片,利用这些英文材料可以作为补充阅读材料,提高学生阅读能力也可以很好地帮助学生理解课文主题。

(3)拓展英语阅读。Google包含了各种题材的英文素材,这些资源可以成为学生宝贵的阅读财富。学生可以利用Google检索自己感兴趣的话题如 London Olympics,可以检索到相关的169000000个网页。其中包括伦敦奥运会的开幕式、结果、闭幕式以及相关新闻等等。同时Google趋势搜索引擎中几乎每天都会及时更新最热门的搜索内容,如2012年11月6日的美国热门搜索内容Tammy Baldwin、Daily Show、Todd Akin等,学生只要点击便可以阅读详细信息,在阅读这些资源的时候不仅提高了英文阅读水平,还能了解到世界各地的热点话题。

2.存在的问题及对策

综合搜索引擎因其信息丰富、检索方便的特点而受到教师、学生的青睐,但是在实际的使用过程中却常常由于综合搜索引擎的检索结果数量大且类型多样的特点,导致教师学生面对茫茫信息海洋无从下手或是“信息迷航”,在一个连接跳到另一个链接时,忘记最初的学习目标,浪费大量的学习时间而毫无收获。因此在使用综合搜索引擎进行教育教学时必须掌握一定的技巧。如确定检索目标、掌握关键词的运用规则、指定搜索的文件类型、分步细化多重查询、点击链接前分析网页的标题、网址、摘要等。

(二)垂直搜索引擎教学运用

垂直搜索引擎是针对综合搜索引擎信息量大、深度不够而产生的新的搜索引擎,垂直搜索能够为特定人群或行业提供专业服务,其检索结果相关性强,结构化特征明显,很好地满足了教育教学专业化的需求。目前垂直搜索已覆盖学术、旅游、租房、法律等各个领域,在教学中可以充分利用垂直搜索获取相关专业信息充实课堂教学。本文以学术搜索“Scirus”为例,分析其教学运用。

1.案例

案例1:Scirus

Scirus(www.Scirus.com)是目前internet上最全面的科学搜索引擎,连续三年被“搜索引擎观察”评为最佳专业搜索引擎。Scirus覆盖科学研究的多个领域,包括农业与生物学、环境科学、天文学、地球与行星科学、生物科学、生命科学、医学、神经系统科学、医药学、化学与化工、社会与行为科学等。搜索源主要包括诸多世界顶尖数据库以及科技网页。利用Scirus可以检索全文、文摘、技术报告、专利、作者主页、大学网址、期刊、新闻等类型的资源。对教师而言,可以将Scirus作为帮助自己专业化发展的工具。如在Scirus页面下端Latest Scientific News会更新一些来自New Scientist的最新科学新闻,教师可阅读自己感兴趣的信息,不断更新自己的专业知识;此外,教师在教育教学过程中遇到难题,可以通过检索期刊论文、图书等寻找答案;Scirus的资料来源于世界顶级期刊与专业网页,里面包含大量的热点话题与最新研究方法,教师可以利用这些内容进行教学反思与教学研究,不断提升自身专业能力和教学质量。对学生而言,诸如Scirus的垂直搜索过滤掉了大量的无关信息,学生能够在较短时间内检索到自己需要的信息,有效地减少了信息迷航现象的发生。此外,学生根据自己的动机和目标利用垂直搜索检索自己需要的学习资源,充分利用这些信息建构自己的学习活动,提高自主学习能力。

案例2:读秀

读秀学术搜索(http://www.duxiu.com)是由超星公司2006年在超星数字图书馆基础上开发的一项中文文献数据库产品,现已发展成为全球最大的中文文献资源服务平台。读秀学术搜索的主要资源为图书,收录了260万种中文图书资源,占据新中国成立以来出版图书的95%以上,在知识产权允许范围内能向用户直接提供原文阅读。此外,该系统还包括期刊、论文、考试辅导、新闻、视频、课程课件等检索功能,在使用任何一种方式进行检索时,与之相关的其他检索结果也会在网页右侧为用户呈现。其准确、全面的检索特点很好地满足研究型用户的知识查找需求,同时也可以成为教育教学的重要辅助工具。如利用读秀搜索检索历史课题“鸦片战争”,检索到与“鸦片战争”相关的图书7495种,期刊15045篇,报纸1068篇,文档3259篇,课程课件37篇,考试辅导594篇,视频467部,相关人物410位,相关网页等,用户点击相关链接便可以阅读下载详细信息,如点击“相关人物”便可以获得关于林则徐、魏源、关天培等人物的详细介绍,并且这些信息大多来自《中外历史人物词典》、《爱国主义教育词典》,具有很高的科学性。如此海量的信息,可以帮助教育教学彻底地从资源匮乏的困境中解放出来,教师、学生可以在任何时间找到自己需要的信息。同时,读秀搜索还提供了个人图书馆收藏、好友个人图书馆等服务,好友之间可通过管吧进行信息交流,方便用户的个性化学习与协作学习。

2.存在的问题及对策

垂直搜索引擎作为综合搜索引擎的细分和延伸,一定程度上满足了人们专业检索的需求。目前,垂直搜索引擎已包含众多领域,但大多垂直搜索引擎规模较小,收录的网页信息往往局限于专业领域几个特定的垂直网站,且垂直搜索引擎要求用户必须有明确的检索目的,对于不同的类型问题需要调用不同的垂直搜索,这对用户来说较为不便。因此,一方面垂直搜索引擎应该积极加强与综合搜索引擎的合作,适度扩大信息收录范围,为用户提供更全面的服务;其次,用户在利用垂直搜索引擎进行检索时应明确查询问题所属的类别,根据问题属性选择恰当的垂直搜索。

五、结语

随着网络技术的发展与普及,网络为各行各业的人们提供了海量的知识资源,利用搜索引擎检索网络信息已成为当前人们学习的重要方式。在“以学习者为中心”“资源型学习”的背景下,搜索引擎在教育教学中逐渐得到广泛应用。搜索引擎的应用变更了传统教学的资源获取方式与教学方式,有利于增强学生在教学过程中的主动性。同时,搜索引擎在教学应用中还存在一些问题,因此教师学生还需掌握相应的使用技巧,使搜索引擎能更好地服务与教育教学。

[1]徐金雷.基础教育资源搜索引擎的排序算法研究[J].电化教育研究,2007,(2).

[2]肖亮.垂直搜索引擎的研究与实现[D].北京交通大学,2007,(12).

[3]薛萍.基于教育领域的垂直搜索引擎的研究与实现[D].天津师范大学,2011,(4).

[4]程妮.科学搜索引擎Scirus研究[J].现代图书情报技术,2005,(03)

[5]蒋亚琳.对三种学术搜索引擎的析评[J].情报探索,2007,(01).

[6]于新国.“读秀”图书搜索引擎的图书资源及其利用[J].当代图书馆,2006,(04).

[责任编辑:蒋庆红]

G623.58

A

1008-8628(2016)03-0121-04

2016-03-13

王胜兰(1990—),湖南常德人,硕士研究生,助教,主要研究方向为数字化学习与高等教育理论。

猜你喜欢
搜索引擎网页检索
基于HTML5与CSS3的网页设计技术研究
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于URL和网页类型的网页信息采集研究
专利检索中“语义”的表现
网络搜索引擎亟待规范
基于Nutch的医疗搜索引擎的研究与开发
基于Lucene搜索引擎的研究
国际标准检索
国际标准检索