虚似图书馆的开发与利用

2005-07-09 19:55徐伟革
全国新书目 2005年19期
关键词:搜索引擎检索网页

徐伟革

“虚拟图书馆”又称“无墙图书馆”、“无纸图书馆”,它实际上是一种基本摒弃了纸质印刷信息体而通过各种网络获得信息的图书馆。Intemet的出现对图书馆的发展产生了深刻的影响,将使“虚拟图书馆”的理想成为现实。在印刷时代,信息是以有形物理的实体传播,如图书、杂志。一经印刷,信息就以不变的固定态留存于世。因此,无论保存还是利用,图书馆一直在矛盾中发展着,一方面鼓励读者利用馆藏,另一方面担心使用者损坏这一物理实体而加以保护和限制。电子媒介具有解决这种矛盾的潜力。它可以在广大的地区传播,同时保证信息存贮的不失真,图书馆不必一定要购买印刷本图书,可以购买电子书或相关数据库的使用许可,就能有效地向读者提供服务。读者可通过加入信息网络,掌握信息检索技术和方法,从电子网络和电子书架上获取信息。这就是所谓的“虚拟图书馆”,也就是我们平时不可缺少的身边图书馆——互联网。

一、互联网资源的充分利用

目前可通过互联网使用的参考资源非常丰富,除了传统参考工具书的电子化版本外,还有许多新增的参考资源,如网络资源指南与检索工具、电子参考工具资料等。因此馆员必须了解与掌握互联网中的参考资源,利用最适当的资源来解答读者的问题,并建立丰富的参考馆藏。兹将互联网参考资源的类型分述如下:

(一)网络检索工具——搜索引擎

随着网络技术和检索技术进一步发展,网上检索工具将日趋完善。无论是国际还是国内检索工具都在朝多元化方向发展,为用户提供全方位服务,参考咨询馆员若要有效地使用互联网资源回答用户的问题,就必须熟知网络上有哪些适用资源,并且能够确定所需资源的位置。最好的方法就是使用各种网络资源检索工具,即搜索引擎。例如:雅虎、新浪、搜狐等搜索引擎。搜索成功的前提是选择正确的搜索引擎。“工欲善其事,必先利其器”,参考馆员必须熟知各种搜索引擎的信息采集原则。只有熟悉这些搜索引擎各自的特点,收集信息的种类,才能有针对性地选择搜索引擎,尽快找到适用的信息。常用的搜索引擎有:

1.雅虎搜索引擎(http://www.yahoo.com.cn)——中文网站主题式分类搜索引擎。提供的分类目录有艺术与人文、商业与经济、电脑与因特网、教育等信息的查询。

2.新浪搜索引擎(http://search.sina.com.cn/)——综合搜索引擎。提供网站、网页、新闻、软件、游戏等查询服务。

3.hotbot(http://www.hotbot.com/)——它是第一个具有自动跟踪Web页面变化的搜索引擎。Hotbot除可检索Web网页、新闻组、讨论组等资源外,还可检索音乐、黄页、人名、E-mail、FTP等信息,数据每日更新。Hotbot提供分类检索和关键词检索,关键词检索又可分为简单检索和高级检索。

4.网易搜索引擎(http://search.163.com/)——多语言搜索引擎。采用开放式管理目录,有约5000名各行业目录管理员负责管理网站注册信息。提供教育学习、经济金融、政法军事、生活资讯、综合参考等18类目录的查询,搜索结果包括相关目录、相关网站、相关网页和相关新闻。

5.百度搜索引擎(hUp://WWW.baidu.com/)——提供全文搜索引擎检索服务。使用了高性能的“网络蜘蛛”程序自动地在互联网中搜索信息。其字词结合的信息处理方式,解决了中文信息的理解问题,搜索的准确性和查全率很高。

6.Google中文搜索(http://www.google.com/intl/zh-CN/)——提供类目检索和网站检索两种方式。Goodle是第3代搜索引擎的代表,它收录了50种语言的30亿个网页,采用全文标引的方式,提供26种语言的检索界面,数据每日更新。该引擎的图片搜索功能十分强大,可检索3.2亿幅图片。此外,该搜索引擎还有新闻组搜索、PDF格式文件搜索、美国电话号码查询、在线词典查询等,它还提供商品目录服务、20年Usenet全文库、网页翻译(在检索结果页面点击“Translate this page”链接)等。

7.天网中英文搜索引擎(http://e.pku.edu.cn/)——按关键字查询,五分类查询。如:图像、声音、视频、压缩、文档、程序、目录、源代码等。为方便用户的检索,天网还提供了快捷方式,常用的有:电影、MTV与动画、MP3音乐、gif动画、flash电影等。

8.Excite网上服务,它是互联网上著名的搜索引擎之一,Excite主要用子检索Web网页、网上的文本信息、新闻组、音频、视频、图片、地图等信息。它采用网络机器人搜索,数据每周更新。Excite提供分类检索和关键词检索

(二)数字图书

如今的图书,在其生产阶段,编辑、排版、印刷都离不开计算机。很多出版社要求作者在提供手稿的同时,提供稿件的电子文本。因此,现代图书的生产过程本身已经数字化了。数字化的图书和大量的网络数据库、电子期刊等形成了庞大的多学科多文种而又异常分散的一次网络文献。中国数字图书馆,超星数字图书馆,方正Apabi数字图书系统等等为我们开创了图书数字化的先河。

(三)公用目录及联合目录

目前已有许多图书馆将其馆藏目录或协作馆的书目、期刊目录、题录摘要、联合书目等公共目录开放在互联网上供广大用户使用。通过书刊目录、书名、刊名、著者、关键字、ISBN等检索途径,便可获得馆藏状况与馆藏地等相关信息。透过网络的连接,可直接查询远方图书馆的网上公共目录,甚至可查询全球任何一个图书馆的网上公共目录或联合目录。例如:全国书目中心(http://www.nlc.gov.cn/)、全国期刊联合目录(http://159.226.100.50/catalog/)等。

(四)论坛、报纸及媒体

互联网被一些人称之为天下大同的基石。传统论坛、报纸及媒体与互联网并不是“不共戴天”,事实上目前网上的大部分新闻,正是由传统主流论坛、报纸及媒体的网站提供的。从另一个方面看,互联网上信息资源浩如烟海,成千上万网站上的数据库蕴藏着取之不尽、用之不竭的报道线索和信息。互联网的出现为报纸的新闻发现和采写带来了一场革命,传统媒体完全可以借助新媒体舞台获得第二个春天。

二、虚拟图书馆开发

虚拟图书馆是伴随着因特网的产生而出现的概念,其完成的主要功能是将某一学科或领域的相关网络资源的线索汇集之后,以主题树或数据库方式结合超文本链接提供给网页浏览者。因而对于虚拟图书馆设计和开发者而言,要做的工作包括:网络信息搜集和网络信息组织以及网络信息的发布。

(1)网络信息搜集,即对某一学科或领域有关研究机构、实验室、相关电子书籍、电子期刊、会议论坛、专家学者等的URLs进行全面而完整的搜索。搜索工作可由人工完成,也可通过编制网络自动化搜索及索引软件由计算机去完成。利用前种方式,链接站点经人工筛选,排误率较高,但效率较低;利用后种方式,可以节约大量搜索时间,但对软件编写要求较高。

(2)网络信息组织,包括两种方式:主题树方式和数据库方式。所谓主题树组织方式,就是将所有获得的资源按照某种事先确定的概念体系结构,分门别类地加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需要的信息线索;所谓数据库组织方式,就是将所有获得的资源按照固定的记录格式存储,将数据方式和超媒体相结合,既避免了检索语言的复杂性,又在虚拟信息不稳定的情况下,对变化的数据记录加以注释或编制新的书目记录,用户通过关键词及其组配查询,就可以找到所需要的信息线索。利用前种方式,要求体系结构不能过于复杂,每一类目下的索引条目也不宜过多;后种方式,对于信息处理更加规范化,但对用户提出了一定的要求,要求用户掌握一定的检索技巧,包括关键词及其组配的选择等。虚拟图书馆建设常采用后者。

(3)网络信息的发布,一般采用www信息发布技术。一是当前最受欢迎、最为流行、最新的信息检索服务系统。它把因特网上现有资源连接起来,使用户能够在因特网上查找已经建立一服务器站点(site)所提供的信息资源。一把各种类型的信息(静止图像、文本、声音和影像)天衣无缝地集成起来,并提供图形界面下的快速查找,使用同样的图形用户界面可与因特网上其他服务器对接。一为世界提供了查找和共享知识的手段,形成了世界上各种组织机构、科研机关、大专院校、公司厂商甚至个人用于研究开发、共享的知识集合。一连接了世界各大图书馆,组成了20世纪最大的信息库。科技工作者通过环球网可以了解科技发展的最新动态,互相交流学术思想,进行广泛的国际合作。

虚拟图书馆还处于建设阶段,今后我们要随着信息技术的发展,把握时机,利用共享化的特点,让图书馆焕发出新的勃勃生机。

猜你喜欢
搜索引擎检索网页
Chrome 99 Canary恢复可移除预置搜索引擎选项
世界表情符号日
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
基于HTML5静态网页设计
英国知识产权局商标数据库信息检索
搜索引擎怎样对网页排序
基于Lucene搜索引擎的研究
搜索引擎,不止有百度与谷歌