陈嘉懿 周锋 郭晶
[摘要][目的]在协同创新的工作宗旨下,目前的学科信息系统逐步向协同工作性、信息资源的高度集成化、服务的主动性方面发展,图书馆在选择上遇到了困难,需要有一种合理的分析方法对其进行比较分析。[方法]从协同工作下的信息资源集成化趋势分析,剖析云环境服务体系架构,以协同性、主动性、集成性、云环境、资源获取等多角度比对分析现有平台的特点。[结论]总结出建设面向学科协同创新的信息资源集成与服务系统的特征与趋势.为未来系统构建提供建设框架与参考。
[关键词]协同创新;云计算;信息资源;学科平台
DOI:10.3969/j.issn.1008—0821.2017.06.017
[中图分类号]G250.72 [文献标识码]A [文章编号]1008—0821(2017)06—0107—06
2015年,党的十八届五中全会通过的“十三五”规划建议明确提出“提高高校教学水平和创新能力,使若干高校和一批学科达到或接近世界一流水平”,充分体现了党中央对建设世界一流大学和一流学科的高度重视和坚定决心。高校要充分认识建设世界一流大学和一流学科、加速实现教育现代化的重要性和紧迫性,把全面建成小康社会新的目标要求以及“创新、协调、绿色、开放、共享”的发展理念,落实到建设当中,贯穿到改革当中。图书馆作为重要的文化教育机构和信息资源汇集地,为高校院系部门服务,在学科协同创新与信息资源的管理上也有独到之处,致力于将原有的被动的知识传播方式转化为主动式的与学科融合的资源集成与推送方式。
另一方面,随着云计算技术与大数据技术的日益进步与发展,对信息资源的集成与揭示也提升到了一个前所未有的高度。由于读者行为分析判断、以及海量数据资源的集中式存储和智能化揭示的需求,信息资源的集成融汇逐渐成为了大势所趋,由此而涌现出了不少跨学科信息集成融汇的系统平台,这些平台各有特点,也存在着不足之处,本文希望从不同平台的比较中总结出一些应用模式与规律,从而为今后建设面向学科协同创新的信息资源集成与服务的通用框架与规范奠定基础。
1协同工作下的信息资源集成化趋势
从信息资源发现系统到学科导航系统,从信息资源管理系统到学科服务系统等这几年的变迁过程中不难发现,这些系统正在逐步向信息资源的多元化、集成化方向发展,并且呈现出了更加丰富的资源展现方式,不同学科、不同知识领域的信息呈现多元化的交互,并且信息的建设方也开始逐步摆脱传统单一建设者的模式,有不少平台像学科服务系统、荐购系统等已经尽可能地将协同建设的工作方式引入进来,大家一起协同工作,使得学科信息自由的来源更加多元化。
在当今知识创新的时代,传统被动式的信息获取方式现在日趋被智能化、主动化的信息推送方式所替代,融合涉及各學科领域的多个机构的主动式、个性化和多元化的服务模式已初见端倪。国内外有关机构纷纷开展了以社区服务、推拉式服务、一站式服务为特色的信息资源共享服务理论与方法研究,一些国外著名高校也相继建立了所谓“自助式”的信息资源共享建设项目,例如美国康奈尔大学图书馆的Mylibrary@comell、北卡罗莱纳州立大学图书馆的Mylibrary@NCState以及中国科学院国家科学数字图书馆所推出的“我的数字图书馆”等。同时在这些系统平台中我们可以看到多种学科信息的资源被集成融汇到了一起,尽可能地一站式的将所有资源都揭示并推送给用户,使得用户查找信息资源变得更为方便,无需再通过多个途径进行查找。
因此,面向协同学习、协同研究的交互式信息资源集成模式无疑已经是当前的应用趋势,这些系统平台都普遍呈现出以下一些特征:
1.1协同性
协同性所展现出的一个最大特点就是拥有比较强的交互性。传统的信息资源门户网站所呈现的特征是“你给什么我看什么”,用户往往没有选择的权力,只能被动接受网站所提供的内容,即使不满足口味也无法可施。而新模式下给了用户交互的权力,用户可以进行主动式的推荐甚至参与到资源的建设过程中来,这种协同创新的工作模式大大提升了信息资源的丰富程度与针对性。
1.2集成性
在信息大爆炸时代,海量信息资源如何获取成为了一个新的难题,因此新平台都呈现了一种“海纳百川”的气概,尽可能多的将相关的学科信息资源都进行集成融汇,通过不同的途径进行信息资源数据的抽取、分析与集成,最终展现给用户的就是一个应有尽有的聚宝盆,从资源获取的方便角度来看这也是一种主流趋势。
1.3主动性
主动性体现的是信息资源的主动推送,能够通过数据分析获取用户的行为习惯,从而为其推荐其可能感兴趣的信息资源。目前一些大型购物网站如亚马逊、淘宝网等都做了顾客行为分析的研究,根据顾客的购物兴趣主动推荐相关产品;而对于学科信息资源网站来说,采用主动性服务的还不多,不过相信也是未来的应用趋势。
2云环境体系架构
这几年云计算技术得到了长足的发展,得益于计算机技术与存储技术的突飞猛进,全球的信息资源数量呈现几何级数的增长,知识大爆炸的时代已经来临,各种大数据、海量数据的概念被摆上了桌面,传统“单机”版模式的系统平台架构已经无法满足海量资源的存储与展示需求,不少系统平台已经开始架设在云端。
云计算是一种利用互联网实现随时随地、按需、便捷地访问共享资源池(如计算设施、存储设备、应用程序等)的计算模式。简单来说就是利用大量的集群服务器与存储资源来为某个应用进行服务,因此相比传统的软件部署应用具备显著的应用优势:
1)服务方式更加弹性化:由于云端资源的划分相对较容易,因此服务的规模可快速伸缩,以自动适应业务负载的动态变化。这样用户使用的资源同业务的需求相一致,避免了因为服务器性能过载或冗余而导致的服务质量下降或资源浪费。
2)计算性能与存储性能更强:一些大型的系统平台之后往往有着成千上万台服务器与存储资源的支撑,这种规模不是单机服务模式的运算资源所能匹敌的,因此计算性能与存储性能呈几何级数增长,更适用于海量信息资源的集成融汇。
3)集中式管理,用户部署简化:云环境是以服务的形式为用户提供应用程序、数据存储、基础设施等资源,并可以根据用户需求,自动分配资源,而不需要系统管理员干预;而对用户来说只接触前端界面,只要考虑应用即可,无需再去进行繁琐的软硬件配置,部署应用变得非常方便。
4)泛在化接入:由于信息架设在云端,用户可以使用各种终端设备(如PC电脑、智能手机、平板等)随时随地通过互联网访问云环境,获取想要的数据信息资源。
正是因为云环境拥有如此巨大的应用优势,因此利用云环境来搭建基于云的信息资源集成系统无疑是最合适的,一方面海量的信息资源能利用云环境的计算能力与存储能力进行快速汇聚与查询;另一方面部署应用与协同工作也会变得非常简单,只需要制定好应用模式,环境的部署与前端应用的协同操作将会变得前所未有的容易。
如图1(原创)所示,本文勾画出在云环境下,信息资源集成系统的架构图。
1)服务器、存储层。这一层是底层硬件,包含网络/计算机集群与大规模存储设备,通过虚拟化技术,实现对底层硬件资源的一体化管理与操作。
2)数据资源层。在信息资源集成平台上,存储着海量的信息元与数据,在这一层会对这些信息资源进行聚合化处理,可用于后续的分类、查询与检索操作;同时通过从前端扶取到的日志文件、信息文件中获得的用户信息进行分析处理,获知用户的偏好信息、情景信息等,对这些数据进行挖掘,预测用户行为;然后这一层会设定并实现资源的揭示方式。
3)信息调度层。这一层将数据资源层里整理好的相关资源,按照前端应用层的要求进行调度与分配,是整个架构中的控制中枢,对系统的稳定性与算法的精准性有较高要求
4)应用服务层。之前三层体系都由云环境的提供商直接管理,这一层主要用于服务与应用的部署,大部分工作可由应用提供商米完成,用户也可介入到部分应用配置过程中去。这一层实现了应用的管理与服务模式的没定。系统可基于服务效率和服务满意度等指标评价服务质量,对应用与服务过程进行优化进而模式化、模块化,建立服务模式库。
5)接人没备层。这一层是最终面向个人用户的层面,用户可通过各种设备实现云端系统的接入,包括计算机、平板电脑、手机或其它电子设备。
3支撑学科协同创新的云系统平台
虽然协同创新的理念在最近几年才逐渐开始流行,但是之前许多学科系统平台在建设之初已经整合了协同工作的理念,希望把与学科相关的各个部门的人士都拉入到系统平台的建设工作中来。目前业界所知的学科建设类资源平台大部分都由图书馆所主导引进或建设,少部分由高校其它部门承担建设。笔者通过调研,大致列举一下目前广泛使用的学科资源平台。
CALLS重点学科网络资源导航库,由CALLS在2003年创建,实现了多馆参加共建的学科信息资源共建共享模式;学科博客与学科微博,利用开源软件或者云服务商,实现学科信息资源的汇聚与推送;SubjectPlus和Libguides,两个比较专业的学科资源服务平台,国外很多图书馆正在使用;CNKI机构学科子馆,依托CNKI的海量文献资源建设的学科资源平台;MediaWiki,最著名的开源维基百科软件,不少高校利用其知识存储与社区协作的特点来搭建学科资源平台;Myhbrary、Libdata、Research Guide、Li-brary Course Builder,这几个是针对图书馆学科信息资源服务的开源系统,国外有不少图书馆利用其搭建平台;Drupal,新兴的开源系统,是一套歼源内容管理框架,使用者可在其上任意搭建想要的系统,目前也已经推出了针对信息资源集成相关的模块;YADDA,2008年由华沙大学开始使用,系统包含灵活的数据仓库聚集机制,多层次的支持和全文索引功能,适合数据资源的存储与展示;英国的Intute、美国的Infomine、澳大利亚的AARLIN、德国的SSG-FI,分别是各个国家的若干高校联合所成立的学科信息资源门户网站,整合了多个知名的学科信息资源门户,提供个性化服务。
雖然国内外提供学科信息资源服务的平台非常多,但是基于云环境的系统平台目前其实并不是很多,主要原因有两个:一是因为云计算技术还属于新生事物,从传统的单机平台转变到云环境需要时间过渡;二是因为信息资源的存储是一个敏感话题,很多信息资源拥有机构不太愿意接受资源不为自己掌控的情况。本文仅对基于云的系统平台做一些比对研究,希望能从中总结出一定的应用模式,为今后建设面向学科协同创新的信息资源集成与服务的通用框架与规范奠定基础。
3.1 AARLIN
Intute、Infomine、AARLIN等系统平台性质类似,都是学科资源门户类的站点,而且均以“中央馆-成员馆”的模式实现了信息资源的云端汇聚,支持云环境下的资源检索与共享,在此仅以澳大利亚的AARLIN系统作为范例进行解析。
AARLIN平台利用汇聚的资源,向前端用户提供一个统一的检索界面,支持对内部集成的多种电子数据库、Web站点、在线图书馆目录及其它电子信息资源的分布式检索,并能使用同一格式进行检索。平台借助OpenURL的协议框架和相关软件技术,向最终用户提供内容敏感的参考链接服务或扩展服务,如全文文献的深度链接服务等。更人性化的是,系统能够根据认证过的用户资料,向每个用户推送相关的信息,并且每个用户都可以个性化定制并精炼“搜索环境”,只访问和自己的兴趣爱好相关的信息资源,还能支持用户缩小或扩展门户推送的“信息图景”,并予以设定。系统还会提供最新的文献报道服务或定题服务,向用户定期通告与他们预先设定的搜索特征相匹配的最新的可利用信息资源。
从之前提到的协同创新资源集成平台的3个特征来分析:在协同性方面,AARLIN系统由19所大学图书馆与澳大利亚国家图书馆共同合作建设,具备一定的协同工作性质,但是缺乏用户的直接参与建设,在协同创新性上稍有欠缺,资源来源的多元化程度不够。在集成性方面,系统在云端环境下集成了多种途径的信息资源,并且按照学科进行分类,支持应用Z39.50、HTIP、SQL等协议对各种类型的数据库、信息资源及网站进行统一形式的检索,集成度相对较高,体现了云计算架构的优势。在主动性方面,平台做得比较好,能够根据不同用户的资料分析其特点与特征,例如身份标识,为其定制个性化的检索方式,推送其感兴趣或对口的信息资源,体现个性化定制与信息主动推送的特点。该系统在云架构方面略有不足,本地如要使用还需架设本地服务器与资源,无法完全依赖中心的云环境。
3.2学科博客/微博
学科博客/微博有两种类型,一种是利用开源软件搭建的本地学科博客资源,不在本文的探讨范围内;另一种是利用第三方云服务商提供的博客/微博平台来实现信息资源的汇聚与推送。本文要分析的是第二种类型,以学科微博为例。
平台主要可用于学科信息资源的集中汇聚,进行发布与推送,但缺乏信息资源的存储功能。可以向用户主动推送各类的学科服务类信息,在微博上关注了平台账号的用户只要登录就可以看到,相比于其他众多的学科信息资源类平台,用户登录微博的频次与偏好显然更有优势,这样无疑可以大大提高学科信息资源的推广效率,同时这些信息通过转发可以迅速遍布有相同兴趣爱好的小组与群,甚至用户之间也发生互动,因为他们也可能把信息转发给其他好友。平台在资源荐购的协同参与上也具备优势,可将资源列表直接发送到平台上,只要读者关注了资源荐购相关的微博,就能第一时间了解到资源采购情况,通过微博的转发大量用户都可以看到并根据需求提出自己的建议,对于学科信息资源的准确购买显然有很大的帮助。另外平台通过与手机的无缝结合,使服务的时间和地点几乎不受任何限制,用户可随时随地访问平台所提供的信息资源。
在协同性上,博客/微博平台具备一定的先天优势,由于架设在云端,因此只需提供账号密码即可由任何人进行管理,这样与学科相关的各种机构、甚至用户都可以参与到平台的建设中来,另外用户还可以通过信息资源的推荐方式直接参与进来。在集成性上,由于博客/微博平台的特点是信息的推送与发布,而非信息存储,因此该平台无法用于仓储大量的资源信息,只能起到资源整理与汇集的作用,往往需要通过超链接的方式访问其它平台获取数据。在主动性上,平台可以通过订阅方式将信息主动推送给用户,但是目前尚没有用户行为分析与个性化服务的功能。该平台属于完全的云架构应用,资源获取非常方便快捷。
3.3 Libguides
Libguides是由美国Springshare公司推出的基于云环境的学科服务平台,提供的交互界面是Web方式,用户对系统的所有操作都是通过浏览器来进行,而无需关心后台的硬件配置。由于Libguides的应用对象比较专业,因此全球已有数千家图书馆使用该平台来进行学科信息资源的汇聚与推送。
Libguides的设计理念非常超前,可以建设子站点,采用了框架与模块化的设计,页面上的布局与样式都可以由使用者任意调整,用户甚至可以用鼠标自由拖动每个模块进行自由排列。平台中内置了多种类型的模块,称为“box”,包括文本型box、RSS型box、多媒体型box、投票反馈类box等等,其中对于文本型box,用户还可以进行二次编程,将html、Javascript代码直接嵌入box中,可以实现对其它信息资源平台的嵌入式引用,实现一站式检索与信息集成的目标。另外,平台还支持对模块与页面的引用与复制,Srpingshare公司建设了分享社区供用户交流使用经验,在征得同意的情况下,甚至可以直接复制与引用其它高校站点的页面与模块,大大提高工作效率。与博客/微博系统类似,Libguides也不擅长于信息资源的仓储,而更多地被用于信息资源的发布与推送。每个学科点都可以建设独立的子站点,进行个性化服务。
在协同性方面,Libguides平台做得非常出色,每个学科指南都有单独的账户权限控制,并且可以开设临时账号给其它机构的人员,使其参与到指南的制作中来;页面上的评论功能与反馈模块可以供用户提供参考建议,帮助资源的进一步完善。从不少高校的使用情况来看,很多院系已经参与到Libguides学科子站点的建设中来,丰富了信息的多元化来源。在集成性方面,平台可通过资源嵌入的方式实现一站式的资源推荐与检索,但同样需要利用第三方的系统界面来实现,不过无需跳转到其它页面,在站内即可完成检索与资源查看。在主动性方面,平台稍显欠缺,平台可通过不同学科子站点的资源建设,向各个不同学科的用户提供个性化的服务,但没有用户行为分析与主动推送的服务。该平台完全架设在云端,用户管理与建设非常方便。
3.4 Summon
Summon、Primo、EDS等系统同属于信息资源发现系统,将海量的信息资源汇聚于一体,提供一体化的检索与资源获取,可包括实体书资源与电子资源。这一类系统通常采用本地+云服务相结合的方式,本地有实体书的信息资源,云服务提供电子资源的信息。本文以Summon为例进行分析。
Summon拥有39个Open Access数据库及平台,来自73个机构的257个特藏数据库可以通过Summon公开检索并访问,HathiTrust中超过200万册公开版权的图书可以在Sum.mon中做全文检索并免费获取,全部800万册图书可以做全文检索。信息资源来源非常多样化,全文主要来自Else-vier、Sage、Wiley,主题词和摘要来自于Gale、PorQuest,DOI来自CrossRef,同行评审状态来自Ulrichs,文章被引用次数、主题词来自WebofScience。系统还提供专门为查询馆藏OPAC资料的特设功能,用户可以将检索结果限定为来自馆藏目录中的结果,还有浏览和查询OPAC书目数据的分面导航。基于用户输入的检索内容还可以推荐相关的数据库,这样读者可以直接去相关的数据库中检索,提高数据库的曝光率和使用率。Summon与Web of Science整合之后,可以显示检索结果的被引用次数,而引用次数会影响到这篇文章的相关性排序,且引用这篇文章的其他文献也会显示出来。
在协同性上,Summon平台主要由供应商进行资源的维护与建设,少量个性化工作可由本地用户完成,其它机构用户基本无法参与到资源的建设当中去,在協同创新方面比较欠缺。在集成性上,这是资源发现系统的最大优势,能够汇聚各个来源的海量信息资源,实现一站式的查询检索,并且资源内容相当丰富,包含了各类学科相关的信息。在主动性上,平台能够做一些用户数据分析,基于用户的检索内容与记录给用户推荐关联度较大的数据库资源,实现了一定程度上的主动推送服务。平台采用本地与云环境结合的方式,假如不需要检索本地资源也可以采用独立云环境的部署方式。
4多种系统平台的比较
这些形形色色的学科信息资源系统各有特色,有些在资源的集成性方面具备优势,有些主要致力于信息资源的揭示与推送,表1是对这些系统做出的对比分析。
通过对多种系统平台的比对,我们可以总结出一些建设面向学科协同创新的信息资源集成与服务系统的特征与趋势?首先系统在协同创新上应该给予足够的自由度,能够允许多方机构的人员共同参与到资源的共建共享中来,用户也应当有一定的资源推荐或建设权力;其次应在资源集成性与一站式资源获取方面做到极致,最大程度方便用户对信息资源的获取,包括移动端的建设,也是未来的应用趋势;再次系统必须具备一定的前瞻性,在大数据分析与用户行为分析方面做出深入研究,利用云环境的强大计算功能,给用户智能化、主动化的体验感受;最后系统需按照云平台的架构进行建设,体现泛在服务、资源集成融汇的特色。
5结束语
本文对当前主流的一些云学科资源平台进行了分析比对,总结出了一些建设面向学科协同创新的信息资源集成与服务系统的通用模式与特征;现在的系统在各方面还存在着或多或少的问题或缺陷,并不能完全满足要求,希望通过这种特征与模式的提炼,给未来的系统建没提供建设性的框架与参考依据,从而设计出更好用、更智能化的学科信息资源系统。