以学术机构为轴心整合高校信息资源的研究

2013-09-06 10:17王玉梅
关键词:知识库馆藏学术

王玉梅

(石家庄铁道大学图书馆,河北 石家庄 050043)

如今是信息爆炸的社会,各种搜索引擎、论坛、博客以及其他信息网站星罗密布,越来越凸显出关于信息的三个问题:一全、二精、三共享。全的问题是指如何将众多的各类信息块汇集成云,避免由于信息孤岛导致的检索不便、使用率不高。精的问题则是指如何在浩如烟海的信息量中快速准确地提炼出真金白银般的有效信息。信息共享则是信息服务领域的另一个新的研究方向,并且随着开放存取(Open Access)的蓬勃发展,信息共享有了难得的机遇和更加广阔的发展空间。高校图书馆是高校内信息资源的主要汇集地和进行收集加工整理的权威机构。因此,针对这三个问题,对高校的信息资源进行有效整合是高校图书馆责无旁贷的责任,也是需要长期研究的课题。

一、高校信息资源分布

(一)高校信息资源分类

根据高校对信息资源的占有和组织形式,可将高校内的信息资源划分为实体资源和虚拟资源[1]。这种分类方法起源于实体馆藏和虚拟馆藏的划分。实体资源是指高校具有所有权的信息资源,不仅包括购买的以实物为载体的资源,还包括高校各个单位自己采集收藏整理的信息资源[2]。虚拟资源则指所有权不在本校,但是又可以通过各种合法手段使用的信息资源。实体资源和虚拟资源的区别不在于是否为数字资源,也不在于是否在网上获取,两者的根本区别是所有权的归属。实体资源受经费的制约,总是有限的,不够用的,而虚拟资源,随着开放存取运深入,信息资源共享技术的发展,其数量是不可估计的。

(二)高校信息资源分布状况

高校内信息资源的分布形式是以图书馆为主,其他机构零散分布。图书馆的馆藏实体资源占高校实体资源的很大一部分,包括纸质图书期刊和电子图书、电子期刊、视频资料数据库以及图书馆自己收集整理的特色数据库和自建数据库[3]。图书馆外的其他一些职能部门,因为其工作需要,也收集整理了一部分高校自产的智力成果,例如科技处有高校大部分的科研项目、学术论文的信息,教务处拥有教改课题和精品课程的信息资源。同时各个分院或研究机构其本身就能产生大量的有价值的信息资源,比如教材、论文、课题等等,同时为了提高自身的教学科研水平,这些机构也会根据自己需求,购买各种教学资源和系统平台[4]。 这些实体资源分散存储在各个机构,相对较独立,对高校内的其他机构而言使用不便,甚至是不知晓,导致使用率和曝光度都不高。还有小部分实体资源,例如教师的教案,学生提交的作业,只是存储在个人的邮箱、u盘中,缺乏共享,易丢失,且不利于管理和查询使用。

除高校实体资源外的其他信息资源都有可能成为高校的虚拟资源,由此可知,虚拟资源的分布更加分散。大部分高校图书馆都以链接的形式提供了一些免费的、以开放存取的形式发布的信息网站,读者使用时,须分别注册、登陆、查找,使用不便捷,因此使用度和关注度都不高。

二、高校信息资源整合现状

高校图书馆由于其工作职能所在,已经认识到资源共享的重要性,资源整合和馆际合作的研究很多。但同时因为图书馆自身的局限性,大部分高校信息资源的整合仅限于馆藏资源的整合。根据整合平台开发者的不同,高校馆藏资源的整合分为三种:

(一)追随CALIS,使用CALIS领头开发的带有公益性的平台进行整合

CALIS(中国高等教育文献保障系统)的整合平台又分为了e读和CCC。e读即中国高等教育数字图书馆,整合了全国高校图书馆的几百万种图书、几千万篇外文期刊论文、百万篇中外文学位论文等资源。CCC即CALIS外文期刊网,为读者提供4.5万种外文期刊的约6 000万篇期刊论文[3]。CALIS整合平台及其技术支持都是免费的,可以通过原文传递或馆际互借来使用其他馆资源。

(二)购买数据商或软件商制作的整合平台进行整合

以商业模式存在的资源搜索和文献传递综合服务平台“百链云”等都有整合平台。有些数据商的整合平台购买数据库时赠送,有些则专门开发,且价格不菲。

(三)自行开发整合平台

有些高校图书馆的数据库资源丰富,技术力量和硬件配备都不错,为了方便使用本馆的多个数据库资源,自己开发整合平台。有些省份的大学图书馆联合起来,建立地方性的资源共建共享的项目。

这些整合形式,只是实现了对高校馆藏资源的一站式检索,提高了使用的便捷性。同时,整合平台跨馆进行或加入图书馆联盟,通过馆际互借或原文传递等措施,可以付费或免费使用其它图书馆的资源,极大地丰富了馆藏虚拟资源。但是,从全的角度来看,高校除图书馆外的各个学术机构购买的教学资源和系统平台上的信息资源,还未被整合进来。此外,高校研究团体或师生所收集整理的与研究课题或课堂教学相关的有价值的虚拟资源也未被收集整理,而这些,却是与本校师生的教学科研及其工作最为密切相关的东西。

从精的角度看,图书馆馆藏资源的整合过程忽视了根据本学校的学科优势或发展前景的整合,缺少个体特色。要想体现高校的学科优势和发展前景,整合的过程要以学术机构为核心。

从共享的角度来看,整合过程大都是图书馆唱独角戏,高校其它学术机构的共享意识并不强,开放存取的积极性并不高。高校内的其它学术机构还存在严重的自我意识和封闭性,各学术机构间缺乏有效的合作机制。并且,因为机构不同,自然分工不同,造成重复开发、重复建设、重复投资。

因此,高校需要以学术机构为核心来建立一个统一的信息资源的整合平台。该平台一方面增加信息资源使用的便利性,同时增强高校各机构间的信息互通,加强各机构的合作,减少信息资源的重复建设;另一方面是根据各机构的需求来构建,能体现本校的专业特色和发展前景。

三、高校以学术机构为核心整合信息资源

信息资源整合工作可以在三个层面上进行,即针对信息源的表现层的整合、针对信息内容的应用层的整合和针对底层的元数据的整合。高校整合信息资源,需要高校图书馆雄厚的馆藏资源为基础,以学术机构为核心,遵循元数据标准,尽量满足读者教学科研学习的需求,考虑职能部门工作的要求,以应用层模式为主导,多层面并进的整合高校的信息资源。

以学术机构为核心对高校信息资源的整合主要有三方面的内容:首先,整合图书馆及其各学术机构存放实体资源的异构数据库;其次,收集整理本校的智力成果,建立机构知识库;最后,根据本校的专业特色及其需求收集整理相关的虚拟资源。

(一)整合图书馆及其各学术机构的实体资源

高校内各学术机构及其功能单位所具有的异构信息资源数据库,在整合时不改变原始数据的存贮方式、存储地点及其管理方式,实现统一身份认证登陆,建立统一的检索平台,在检索过程中,按照各异构数据库的要求,自动转换为各数据库接受的检索格式和检索指令,整合平台获取各异构库检索结果后,按照自己的要求,对数据进行处理转换,最后以统一的格式展示在读者面前。

1.统一身份认证

统一身份认证是高校信息资源整合的前提和基础。统一身份认证包括认证整合、统一的用户授权和单点登陆。以石家庄铁道大学为例,校内实现了一卡通,各学术机构和功能单位均以统一的卡号进行登录查询,为实现统一身份认证打下了很好的基础。需要做的是建立统一身份认证的门户网站,遵循规范化的标准,实现校园内信息资源同一入口登录,登录后根据各自的权限,方便快捷地访问权限内的各种信息资源,解决了因为机构的不同,重复登录的问题,很大程度上提升了工作和学习的效率。

2.进行数据转换

数据转换是异构数据库整合的主要部分,数据转换的流程如图1所示。

图1 数据转换

用户输入查询请求时,首先根据各个异构数据库的要求,对请求的格式进行转换,前往各异构库进行查询,并提取查询结果,然后再对各个查询结果进行显示格式转换、查重,最后查询结果按照统一的格式显示在统一页面。

(二)建立机构知识库

机构知识库 (Institutional Repositories,简称IR),又称机构典藏、机构仓储等。目前国内对IR比较全面的定义是在开放存取的环境下,利用网络及相关技术的支持,将本机构及其成员所产生的各种数字化产品,进行收集、整理,以数字化的方式保存,并提供统一的网络检索平台,按照开放的协议和标准,允许机构内外的成员免费使用[5]。

建立机构知识库,是整合平台的一个重要内容。现在大多数高校的机构知识库都是使用开源软件DSpace,CALIS已经联合北大清华等五所高校的示范馆联合对DSpace进行二次开发,完成三套机构知识库系统,其中CALIS机构知识库本地系统供CALIS成员免费使用,并提供技术支持服务。因此,机构知识库建设在技术上没有问题。国内高校的机构知识库建设难点是可持续性发展的问题[6]。很多高校的机构知识库由于缺乏资金、高校内学术机构的支持度和关注度不够、没有制度保障等问题,机构知识库的数据往往不能常年更新。以学术机构为核心建立机构知识库,不仅内容以高校学术机构的智力成果为核心,在建设流程上,也以机构的需求为核心,将高校内的各机构拉入进来,共同建设,并把机构知识库的内容作为职称评审、业绩考核等职能部门的权威数据,可拉动机构知识库建设的可持续性。以机构为核心的机构知识库的建设流程如图2所示。

(三)收集整理与教学科研相关的虚拟资源

一个严谨的课题研究或丰富的课堂内容,都需要做大量的信息资料的收集。机构知识库的内容只是收集整理本校的智力性成果,同时很多高校由于购买力不够,实体资源远远满足不了本校内师生的需求[7-10]。这就需要以学术机构为轴心整合虚拟资源,整合的流程如图3所示。

图2 机构知识库建设流程

图3 虚拟资源整合流程

首先是针对高校内研究团体和课堂的需求,建立信息交互的平台,了解需求。虚拟信息资源的收集有两种方式,一种是人工提交,一种是爬行器收集。教师、学生或研究团体因为教学或研究的需要,手工收集整理了大量的虚拟资源,这种保存在个人或团体手里的虚拟资源,需要人工提交。对于一些知名的学术交流论坛、名校的公开课视频、以开放存取的方式发行的学术论文甚至国内外知名专家学者学术性的博客等,可以通过爬行器,一种专门用于检索信息的“机器人”程序,来进行信息资源的采集。采集来的信息资源需要进行专业化的信息过滤,这是高校内虚拟的信息资源整合和搜索引擎的最主要的差别。信息过滤可以通过人工筛选完成,也可以通过信息过滤技术综合运用人工智能、模式识别、神经网络等领域的技术进行信息挖掘,获取用户的个性化需求的信息。过滤后的信息,经过规范化处理、分类加工、组织整序后,供查询使用。将高校的信息资源整合平台发展为课堂教授或课题研究的延伸是整合平台的一个主要目标。

四、整合过程中存在的问题

以机构为轴心整合信息资源的过程中,会遇到很多问题。首先是必要的政策支持。必要的政策支持是整合工作顺利进行的保证。其次是高校内各机构的合作。这种合作关系贯穿整合的整个过程,包括需求的提出、技术的合作、信息的共建等。最后是信息保密以及版权的问题。有些课题和公司或企业合作,涉及到行业机密,或有些成果未公开发表以前,涉及到成果保密。因此在整合的时候,在开放存取的基础上,需要设置保密权限及其保密年限。

五、结语

高校通过开放存取的形式,改变图书馆传统的“等读者走进来”的服务模式,自己走出去和高校内的其他机构合作,以学术机构为轴心,对本校内的实体资源、智力成果以及虚拟资源进行整合。然后再和其他高校进行更高一层的资源整合,形成更大的高校信息资源云,这在一定程度上可以很好地解决信息的全、精、共享的问题。

[1]田凯琳.浅析图书馆虚拟馆藏与现实馆藏的整合[J].情报探索,2009(10):59-61.

[2]王卓尔.高校馆藏实体资源和虚拟资源的整合策略[J].经济研究导刊,2012(27):308-309.

[3]孔庆杰,王博.机构知识库与图书馆信息资源整合问题探讨[J].图书馆学研究,2007(1):19-21.

[4]刘淑杰.高校科研信息资源整合与开发利用[J].情报科学,2009(7):1050-1052.

[5]柯平,王颖杰.机构知识库的发展研究[J].图书馆论坛,2009(10):243-246.

[6]李国俊,王瑜,王李梅,等.基于元数据的高校机构知识库建设研究——以北京科技大学机构知识库为例[J].大学图书馆学报,2012(4):55-60.

[7]乔杨.基于ESB的异构数据整合策略[J].图书馆学刊,2011(7):125-128.

[8]张新鹤,肖希明.我国图书馆信息资源共享机制现状调查与分析[J].中国图书馆学报,2011(5):66-78.

[9]白新勤.高校信息资源共建共享的新态势[J].情报科学,2013(3):62-67.

[10]高广尚.基于REST的数据整合在图书馆中的应用[J].科技情报开发与经济,2011(21):40-42.

猜你喜欢
知识库馆藏学术
馆藏
学术是公器,不是公地
博物馆的生存之道:馆藏能否变卖?
如何理解“Curator”:一个由翻译引发的学术思考
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
对学术造假重拳出击
知还印馆藏印选——古印篇
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
介绍两件馆藏青铜器