图书馆Mashup研究进展

2012-02-15 16:51:09刘西义
图书馆学刊 2012年10期
关键词:检索系统数据源跨界

刘西义

(长沙市图书馆,湖南 长沙 410005)

刘西义 男,1972年生。本科学历,馆员。

如何提高图书馆馆藏资源利用率,是现阶段数字图书馆建设中必须要面对和解决的关键问题之一,通过何种手段、方式来提高图书馆资源利用率,是图书馆员值得探究的课题之一。

近年来Mashup的发展以其独有的理念和创新的模式将很多不同领域的资源、应用、服务融为一体,并为用户提供个性化的服务,为数字图书馆的信息服务提供全新思路,引起了国内外图书馆界的广泛关注。

1 图书馆Mashup研究现状

笔者在中国期刊网、维普中文科技期刊数据库中进行检索,经筛选得到国内相关研究论文34篇,2006~2011年间,发表文献数量呈现增长趋势;在搜索引擎中按该主题进行检索时,同样得到不少探讨这一主题的资料,说明近几年,越来越多的业内人士开始关注Mashup与图书馆相关问题研究。

而外文资料获取方面,笔者在多个外文数据库中进行检索、筛选。发现虽然国外图书馆界对Mashup应用实践开展的比较早,但是研究Mashup与图书馆的相关期刊文献却较少,同时笔者在互联网上搜索该主题的研究资料,筛选后得到相当数量的该主题研究资料。

通过对所得资料进行分析可知,国内外图书馆界学者主要从两大方面对图书馆Mashup研究现状进行了探讨,即Mashup基础理论研究与Mashup在图书馆应用研究。

1.1 基础理论研究

1.1.1 Mashup定义方面

国内最早对其进行定义的是毛军(2006),他指出“跨界合作(Mashup)是从现有的应用系统(如谷歌地图服务),而不是程序代码和Web服务,通过应用程序接口组合搭建新的应用系统”;[1]而朱咫渝、李春旺、党兴华等人则认同维基定义,即“Mashup:网络聚合应用,把来自两个或多个外部资源的数据或功能整合起来创建一项新服务的网页或Web应用程序”[2];随着图书馆Mashup应用的发展,学者(2009)指出“Mashup并不专指某一独立的技术,而是一种思路和理念——通过调用不同数据源来封装独具特色的服务,给网络环境下的用户提供在多种数字资源之间无缝漫游的全新体验”,[3]丰富了Mashup定义;李峰针对Mashup在可用性、灵活性、兼容性、表现性以及支持机器自动融汇方面存在的局限性,提出了语义Mashup的概念:“将语义网技术与Mashup技术相结合,通过对集成融汇资源对象、服务对象进行语义描述,并建立对象间的语义关系,支持不同来源、不同类型资源间的语义映射、推理,实现复杂语义层面信息对象的融合、汇集。”[4]

国外方面,Fichter[5](2007)在会议论文中指出“Mashup是一个网站或网络应用程序,该网站或应用程序的内容有一个或多个来源渠道,以创造一个全新的服务”;Biancu[6]则定义Mashup为“混合内容或元素相结合的一个网站,该网站内容和/或脚本有多种来源”,并指出图书馆应把数据或服务分成一些小的模块,使之嵌入在用户的浏览器或电子邮件程序中;而Hirst[7]指出“Mashup整合来自两个或两个以上独立数据源的数据并以使之已预想不到的方式呈现”,并指出用户以“胶连逻辑(glue logic)”方式创造出的聚合应用才是Mashup应用,以“固体胶(gluestick)”方式黏合而成的应用则不是,此种辨别方法简单易懂,将Mashup与其他的整合应用区别开来。

图书馆界学者对Mashup定义的丰富、发展,加深了图书馆界对Mashup的认识、理解,对Mashup在图书馆应用具有极大促进作用。

1.1.2 Mashup架构及技术研究方面

Mashup架构模式并不复杂,较易理解,图书馆界学者对其研究较少,大都认同Mashup经典三层架构模式,即API/内容提供者、Mashup站点和客户机的Web浏览器。[8]Biancu[6]对Mashup的三层架构模式进行了较详细介绍,并指出Mashup在资源获取方面的技术主要有API、RSS及屏幕抓取,网络协议技术主要有SOAP、REST、CQL等,客户端显示技术主要有XML、DOM、RSS、ATOM、Javascript、PHP 等。平台工具方面,介绍了当前流行的Mashup平台工具,如Yahoo!Pipes、Open Kapow、Proto等。[9]

2009年至今,学者刘芳、纪姗姗、李峰、李春旺等人在中国科学院2009年新增能力项目“知识服务集成融汇关键技术研究”支持下发表了一系列论文,对Mashup组件技术[10]、平台工具[11]、语义Mashup[11]等进行了深入探讨,Mashup理论研究进一步成熟。

1.2 应用研究

学者探讨的图书馆Mashup应用研究主要集中于Mashup在OPAC系统、资源推荐系统、跨界信息检索系统及实现图书馆服务嵌入用户环境中的应用。

1.2.1 Mashup在图书馆OPAC系统中的应用

肖铮、党兴华、周虹等人都对Mashup在图书馆OPAC系统中的应用进行了探索,研究如何利用Mashup技术整合外部资源,丰富OPAC检索页面。

肖铮在其硕士论文中通过分析发现OPAC系统可以通过调用其他网站API接口的形式,调用来自Google Books的图书封面、预览链接,豆瓣网的图书封面、内容介绍以及豆瓣网的常用标签,丰富原有的OPAC页面,增强OPAC系统的可用性,提高读者使用OPAC的效率。并对其进行实践探索,取得了预期效果,[12]同时在Lib2.09年会中介绍了厦门大学馆是如何实现图书馆OPAC系统与豆瓣网的Mashup应用,将豆瓣的图书简介、书评信息Mashup到图书馆。[13]党兴华、王洪燕[14]探讨Mashup技术在图书馆OPAC中的应用,即Mashup的书目信息应用。

周虹等学者在清华大学图书馆建设实践基础上,介绍了该馆应用Mashup的模式,并基于现有的OPAC设计开发图书封面服务,使用户查询OPAC时能在检索结果中无缝集成显示书封,为读者提供更为直观的应用体验。介绍该图书封面数据源服务器的设计和实施方案,重点描述外部图书封面数据源的设计思路,如何利用servlet技术建立该数据源的方法以及该服务器与图书馆管理系统的连接方式等内容。[15]

而在OPAC检索系统方面,李峰、李春旺分析了早期跨界检索系统的特点,并针对传统跨界检索系统存在的缺点,结合Mashup理念,探讨基于Mashup的跨界检索系统架构及开发流程。他们认为,数字图书馆信息检索系统的发展趋势是基于Mashup的跨界检索系统,同时指出这方面的研究刚刚起步,主要问题是缺少一个好的数据融汇模型支持系统。这一问题已经引起了数据Mashup领域技术人员的关注,但对于数字图书馆来说,也应该积极探索跨界数据融汇模型研究,以推动跨界检索服务的发展。[16]

与国内这方面研究成果较丰富不同的是,在丰富OPAC页面方面,收集的资料中仅有Fichter[17]在论文中介绍了安阿伯市公共图书馆利用Mashup技术在OPAC页面中聚合了图书类网站的图书封面;在检索系统方面,Johnston、Jensen[18]则探讨了利用谷歌地图来作为用户查找图书馆资源的显示界面,使检索界面变得更加形象、生动,尤其是在地图类图书馆中的应用。而Bech-Petersen[19]提出在图书馆目录检索系统中应整合与之相关的视频、博客、维基等,构建基于Mashup技术的一站式检索平台,但丹麦商业化图书馆系统都没能实现这一功能,文中介绍了奥尔胡斯公共图书馆开发的名为“Summa”的图书馆搜索引擎,该搜索工具能一次性检索多格式多来源的资源。

1.2.2 Mashup在图书馆资源推荐系统中的应用

李凌、马蕾针对现有Mashup应用并非数字图书馆特色技术,以服务增值为原则,通过调用网上书店(亚马逊、当当等)及图书馆的书目借阅排行API,整合多个数据源,为图书馆开发出一种推荐书目与书评信息的专业应用方案,使图书馆的推荐书目排行信息更为合理、客观,为图书馆推荐书目服务系统的设计提供了参考。[20]

基于Mashup应用双增值的原则,李凌还设计了一种基于资源推荐与价格比较的图书馆Mashup应用,针对图书馆丰富的图书资源及用户对各种图书选择或购买的需求,开发一个应用,该应用提供各门类图书借阅排行,同时对图书和众多网上书店(如亚马逊、china-pub、当当等)进行相应链接,当鼠标指向该图书时,会显示出该图书在不同网店中的价格。为读者浏览图书馆图书时想购买该书提供了方便,实现了Mashup图书馆应用的增值。[21]

1.2.3 Mashup在实现图书馆服务嵌入用户环境中的应用

肖铮[12]探讨了将图书馆融入了豆瓣环境,读者在浏览豆瓣时,可看到该书在厦门大学图书馆的馆藏信息;姚飞、窦天芳[3]则探索了将清华大学图书馆服务嵌入电子资源出版平台及搜索引擎中,促进了图书馆主动服务理念的发展。

学者探讨了如何通过工具条方式实现图书馆资源和服务向用户环境嵌入,Blyberg详细介绍了美国安阿伯市地区图书馆开发的Mashup工具条PatREST的功能及实现过程;Webster[22]介绍了工具条发展现状,及应用时应注意的安全与隐私问题,并介绍了两个与图书馆相关的浏览器插件应用程序Book Burro和LibX。

此外,学者们还探讨了图书馆Mashup理念应用,即在Mashup理念指导下开展图书馆工作与服务。Storey[23]与Barbara[24]的研究均体现了这一思想。

2009年,美、英、意大利、挪威等国学者,在由Engard主编的著作 《Library Mashups:Exploring New Ways to Deliver Library Data》中对图书馆Mashup进行了全面、深入、系统的研究。包括Mashup理论、如何构建图书馆Mashup网站、Mashup在OPAC中的应用、如何利用Mashup来提高图书馆服务质量等,并列举了相关Mashup实例进行分析。[25]至今为止,此书是最全、最系统介绍图书馆Mashup的著作,多位学者在文中对此书进行过推荐。

2 图书馆Mashup研究特点

对所获资料进行分析可知图书馆Mashup研究存在以下特点:

①关注Mashup理论研究,Mashup基础理论不断完善。

②对于Mashup的理解,图书馆界学者普遍认为Mashup不仅是一种技术,同时也是一种理念,Mashup理念应用是图书馆Mashup应用的重要组成部分。

③深入探讨了Mashup在图书馆OPAC中的应用及利用该技术实现图书馆服务嵌入用户环境,其他方面的应用则探讨相对较少。

④倡导开放图书馆数据,供用户Mashup,使图书馆更好地融入用户环境。

⑤研究资料显示,图书馆Mashup应用实践取得一定成果。厦门大学图书馆、清华大学图书馆、丹伯里公共图书馆、纽约公共图书馆等图书馆应用Mashup为读者提供相关服务取得一定成效。

3 图书馆Mashup研究存在的问题

近年来,随着Mashup在图书馆的迅速发展及广泛应用,一些技术问题、社会问题、跨组织边界应用问题得到了多位学者的关注,在论文中对其进行了探讨,总结出图书馆在应用Mashup时应注意的问题,主要有以下几个方面:①知识产权保护问题。Mashup主要技术之一——屏幕抓取技术存在着很大的侵权风险;图书馆Mashup开发人可能以未获得API内容提供者批准的方式使用其内容造成侵权。②数据质量问题。Mashup数据源来自不同机构、组织、个人,数据的准确性及稳定性无法保障。③安全性问题。图书馆开放其内部数据,暂无技术条件保障其开放的数据不被非法机构调用。

[1]毛军.图书馆信息服务和搜索引擎的跨界合作[J].现代图书情报技术,2006(9):2.

[2]李春旺,肖伟.集成融汇:概念、模式与应用[J].现代图书情报技术,2008(12):26.

[3]姚飞,窦天芳.基于Mashup理念开展主动服务的探索与实践[J].图书馆建设,2009(9):57.

[4]李峰.语义 Mashup 技术研究[J].现代情报技术,2010(1):41.

[5]FICHTER D.What’s a Mashup and Why Would I Want One?[2010-12-23].http:∥library2.usask.ca/~fichter/talks 06/il/2006il-Mashups.pdf.

[6]BIANCU B.Sticking between:Mashup in libraries.[2010-12-23].http: ∥www.slideshare.net/bonaria/sticking-between-Mashup-in-libraries.

[7]HIRTS T.Mashed Libraries:What is a Mashup?[2010-12-23].http:∥www.slideshare.net/psychemedia/mashed-libraries-what-is-a-Mashup-demo-presentation.

[8]朱咫渝,陈琳.Mashup在图书馆的应用[J].现代情报,2008(6):142-144.

[9]MAHARANA B,SAHU N K,DEB A,et al.Library Mashups Web 2.0 Tool for Integrating Contents and Services of Libraries.[2010-12-23].http://www.slideshare.net/sibam/library-Mashups-web-20-tool-for-integrating-contentsand-services-of-libraries.

[10]刘芳,李春旺,王昉.Mashup组件技术研究[J].现代图书情报技术,2009(12):7-11.

[11]纪姗姗,李宇,周强.Mashup工具的分析与研究[J].现代图书情报技术,2010(1):41-45.

[12]肖铮.新环境下图书馆数字资源的整合与实践[D].厦门大学,2008:45-62.

[13]Lib2.09 年会.[2010-12-01].http:∥lib2009.cqu.edu.cn/.

[14]党兴华,王洪燕.WEB页面分析技术和Mashup技术在图书馆 OPAC 中的应用[J].光盘技术,2008(12):11.

[15]周虹,等.清华大学图书馆OPAC书封服务的设计与实现[J].现代图书情报技术,2008(8):84-87.

[16]李峰,李春旺.面向数字图书馆的跨界检索系统研究[J].图书馆学研究:理论版,2010(3):51.

[17]FICHTER D.Doing the Monster Mashup[J].Information Today,2006(4):48.

[18]JOHNSTON R L,JENSEN L K.Map Happy:A User-Centered Interface to Library Map Collections Via a Google Maps“Mashup”[J].Journal of Map&Geography Libraries,2009(5):114.

[19]BECH-PETERSEN S.The Mashup Library.[2010-12-23].http: ∥www.slideshare.net/bridging worlds2008/the -Mashup-library-presentation.

[20]李凌,马蕾.基于Mashup的推荐书目服务的实现[J].现代图书情报技术,2009(2):68

[21]李凌.基于图书馆信息服务的Mashup Application[J].图书馆学研究,2009(4):68-70.

[22]WEBSTE P.The Library In Your Toolbar.[2010-12-25].http:∥www.libraryjournal.com/article/CA6457218.html.

[23]STOREY T.Libraries Mash up Content,Services and Ideas.[2010-12-25].http:∥www.iatul.org/news/default.asp?post=101.

[24]BARBARAB.WestchesterLibrarySystemRollsout Medicare Mashup[J].Information Today,2008(4):19.

[25]TableofContents.[2010-06-10].http:∥Mashups.web2learning.net/toc.

猜你喜欢
检索系统数据源跨界
跨界
诗歌月刊(2023年2期)2023-03-11 09:19:48
跨界
诗歌月刊(2023年1期)2023-02-11 13:08:28
收录《信号处理》的检索系统及数据库
信号处理(2018年1期)2018-09-03 07:53:04
收录《信号处理》的检索系统及数据库
信号处理(2018年5期)2018-06-28 02:16:02
本刊被以下检索系统及数据库收录
信号处理(2018年4期)2018-06-27 03:34:16
本刊被以下检索系统及数据库收录
信号处理(2018年3期)2018-06-27 03:30:18
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
B&O继续跨界 B&O BeoVision Eclipse TV
基于真值发现的冲突数据源质量评价算法