〔摘要〕针对高校图书馆建设机构知识库的问题,以北京工业大学图书馆机构知识库的建设为实例,描述构建机构知识库的实施过程,分别从构建模式的制定、软件平台的选择、资源内容的收集以及推广使用等方面进行阐述,着重介绍了机构知识库系统平台、资源内容的收集。通过分享、交流和讨论在建设机构知识库过程中的经验、体会和遇到的问题,以期共同推动高校机构知识库的建设发展。
〔关键词〕机构知识库;开放存取;内容收集;资源获取
DOI:10.3969/j.issn.1008-0821.2013.07.018
〔中图分类号〕G250.76〔文献标识码〕B〔文章编号〕1008-0821(2013)07-0080-04
Practice and Exploration of Building Institutional Repository in University
——Taking the Library of Beijing Technology University as an ExampleDeng Hong
(Library,Beijing University of Technology,Beijing 100124,China)
〔Abstract〕Focused on building institutional repository in university library,taking the library of Beijing Technology University as an example,this paper elaborated the implementation process of building institutional repository,respectively,from building a model of development,the choice of software platform,the collection of resources content and popularity,highlighting the institutional repository platform,the collection of resources content.Through sharing,exchange and discussing experience and problems encountered in the process of building institutional repository,were expected to jointly promote the development of building institutional repository in university.
〔Key words〕institutional repository;open access;content collection;resources obtainment
长期以来高校各类学术科研成果斐然,除了正式发表和出版的论著外,还有大量的科技报告、工作报告、科学数据、多媒体资料、科研项目申报材料、博士后出站报告、学生毕业论文等各种极具学术科研价值的灰色文献,但这些科研成果大多分散在科研人员个人手中,没有得到广泛的利用和共享[1]。正是在这样的背景下,机构知识库应运而生以实现学术资源的建设、共享和利用。
机构知识库又称机构典藏、机构仓储、机构库。Clifford Lynch最早对大学的机构知识库下了定义:一个大学的机构知识库是学校为师生员工提供的一套服务系统,用于管理和发布由其产生的数字化资料。简单地说,机构知识库是大学或研究机构通过网络来收集、保存、管理、检索和利用其学术资源的数据库[2]。
国外对于机构知识库的研究和建设始于20世纪末,国内有关机构知识库的研究始于2004年[3]。近年来一直处于快速增长趋势。根据OpenDOAR(Directory of Open Access Repositories)[4]的统计结果(截止2013年4月8日),全球范围内在此网站上注册的机构知识库数量已达2 270个。世界知名大学,如哈佛大学、麻省理工大学、普林斯顿大学、加州大学以及剑桥大学等都已经建立了自己的机构知识库。在我国,香港大学、香港科技大学、台湾大学、清华大学、厦门大学、中国农业大学、中国人民大学和中国科学院部分机构等也已经建立了机构知识库,以实现本机构知识资产的有效管理和长期保存,供分享、交流、参考利用,促进跨院系、跨机构、跨学科的合作。同时这种运作模式也越来越受到科研人员的认可。
1机构知识库的建设实施
北京工业大学(以下简称北工大)顺应开放获取的发展潮流,以机构知识库的建设为契机,积极投身到学术资源共建共享中。北工大机构知识库的建设首先从组建图书馆机构知识库建设小组开始,选派专职馆员负责机构知识库的研究和建设。由图书馆负责搭建机构知识库平台,对本校教职工已公开发表的学术资源进行统一收集,同时鼓励教职工将自己的灰色教学科研产出上传到机构知识库中,不断丰富机构知识库中的资源,最终将知识库中的资源对外开放,实现学术资源在全球范围的交流使用。
高校机构知识库建设实践与探索1.1机构知识库系统平台的搭建
机构知识库的建立首先要选择软件平台。根据学校和下属学术单位的实际需求,分析比较现有的商业和开源软件平台,综合考虑图书馆的财力、人力,选择开源软件DSpace作为基础系统平台。在搭建、试用系统平台的过程中,结合定点学术团队的调研,提出需要改进和增加的功能。通过与第三方合作的方式,深度开发新增功能和本地化的定制,建立适合本校的机构知识库系统平台。运用此机构知识库系统平台,分别建立学校级的总机构知识库和一个研究所的分机构知识库。然后,对总机构知识库和分机构知识库进行数据资源的收集,再以这两个机构知识库为样本,向全校宣传推广和使用。
北工大机构知识库小组在采用Dspace开源软件构建机构知识库试用平台后,在不改变Dspace内核的基础上,通过增加功能模块实现新增功能和改进优化已有功能,以及完善界面显示等二次开发和定制,来满足学校及下属学术单位的实际需求。二次开发定制后的系统名称命名为IRP。该系统集成文献管理软件NoteExpress[5]的数据整理和批量导入功能,将个人文献管理与机构知识库结合起来,提高收集、整理、上传资源的效率,为机构知识库的可持续发展提供技术保障。
1.1.1IRP系统技术架构
IRP系统基本保留了Dspace的技术架构,另外增加了一些功能模块。整个技术架构属于典型的三层结构:存储层、业务逻辑层和应用层,每一层分别由不同的组件组成,层与层间,通过接口相连,交互运作[6]。在实际应用中,应用层程序调用业务逻辑层和存储层程序来实现用户所需要的各种功能。IRP系统架构如图1所示。
最底层是存储层,负责元数据和附件文件的物理存储管理、附件全文索引和数据库操作支持。整个IRP的核心功能就是保存文件、检索文件、保存元数据,而这些保存操作,必须依赖于底层的API支持。IRP的存储层是在DSpace系统的基础上,做了部分的改进,主要用来支持附件的全文检索。
第二层为业务逻辑层,该层建立在存储层之上。所有的业务层进行操作之后,都需要将业务数据和状态经过存储层的API调用,保存到数据库或者文件中。在这个层中,IRP的业务包含两部分,核心部分是DSpace自身带有的功能,如内容管理、句柄管理、工作流管理、权限管理等等。同时,在该层中也加入了IRP扩展的业务,如快速提交、OAI在线收割、笔记、收藏、全文检索、新闻发布等,IRP所有的扩展服务几乎都来自这里的支持。
第三层为应用层,负责系统与外界的交流。该层由两部分组成:一是用户UI展示部分,通过JSPUI网站,对外提供服务,如Web用户界面、批量数据导入导出工具、OAI元数据提供、统计工具等、管理员后台管理界面、Web2.0展现等;二是扩展的管理工具,如NoteExpress(NE)提交插件、异构数据转换工具以及TPI提交插件等,用于发布数据。该层各个组件的功能是通过JAVA编写的Servlet和JSP来调用实现。
1.1.2IRP系统开发、应用环境
整个IRP系统基于J2EE的B/S架构,在Windows7平台下进行开发,测试环境包括Windows7/Debian6/Ubuntu10 3种操作系统。开发中涉及的技术主要有Java(J2EE)、JavaScript、Python、Delphi等。使用的数据库是开源数据库Postgresql,具有大型网络型数据库所具备的几乎所有品质。IRP系统也支持商业数据库Oracle。目前IRP系统的应用环境有:Windows2003、Ubuntu10、Debian6、Centos5.5等。
1.1.3IRP系统功能
Dspace系统已经具备用户注册、资源上传、下载、检索、浏览、审核、统计、订阅、用户权限管理等功能[7],但实际使用起来,还有诸多不方便之处。IRP系统对该系统功能进行了扩展和改进。集中体现在增加了Web2.0的网络用户交互功能、全文检索功能和集成文献管理软件NoteExpress的批量导入功能,具体包括:实现附件的全文检索、快速提交、新闻发布、笔记、收藏、评论的功能,优化权限授予,增加NoteExpress批量导入工具,OAI在线收割,显示全文图标,用户自动注册,组织结构树状显示、简化附件下载的IP限制功能、机构知识库中的题录和全文批量导入到NoteExpress中等功能。
1.2机构知识库的建设模式
为了促进机构知识库的可持续发展,充分调动教职工将自己的教学科研产出提交到知识库中的积极性,北工大机构知识库决定采用集中、分布相结合的建设模式,即建设一个学校级的总机构知识库,对学校下属有需求、有条件的二级、三级学术单位,分别再建立分机构知识库,即建立学院级、系级、研究所级或实验室级的分机构知识库。图书馆承担总机构知识库的建设任务,总机构知识库中存放的数字资源代表学校的整体科研教学成果产出,根据出版社著作授权的要求,逐步对外开放。总机构知识库最终要参与到北京市高校、全国高校乃至全球高校的机构知识(注:深色为Dspace系统原有模块,浅色为IRP新增的功能模块)图1IRP系统架构图
库联盟中,实现学术资源在世界范围内的共享共用,推动科技的进步。分机构知识库作为二级、三级学术单位日常保存、管理、交流教学科研知识产出的平台,由各学术单位自行负责建设,图书馆派学科馆员协助搭建平台和收集、整理学术资源内容,并对数字资源进行合理的分类管理。分机构知识库中的数字学术资源根据教学科研的进展情况,分层次公开。
学校极总机构知识库的资源组织方式按照学院的不同,根据资源的类型分类。即总机构知识库下划分各个学院,学院下面再根据期刊会议论文、学位论文、著作、专利等资源类型划分。学术团队级的分机构知识库本着自愿的原则,由学院、系、学科部或者研究所利用机构知识库系统平台,结合本学术单位的特点,组织资源内容。以科研为主的学术单位,可按项目课题的不同,根据资源的类型分类;以教学为主的学术单位,可按课程的不同来组织资源。
1.3机构知识库资源内容的建设
机构知识库中存储的数据资源包括公开发表和未公开的知识产出,这些知识成果类型多种多样,包括期刊论文、会议论文、专著教材、专利、学位论文、研究报告、演讲稿、课件、实验数据、软件程序等,几乎包括所有格式的文本、图像、音频、视频资料。然而,数据资源的收集一直是机构知识库建设中的一项艰巨任务,甚至成为高校机构知识库可持续发展的瓶颈。在没有强制政策的情况下,仅仅依靠校内教职工自助提交资源的方式是不可行的。
北工大机构知识库建设小组在综合考虑校内教职工原生学术资源的分布情况和图书馆现有的资源建设能力后,采用分两条线开展资源建设的方式:一是公开出版的学术资源和学校现有管理系统中存在的数据资源由图书馆负责统一收集、整理和存档;二是未公开出版的灰色资源由教职工自助提交到学术团队级的分机构知识中,对所在学术团队未建立分机构知识库的教职工,提供入口直接提交到学校级总机构知识库相应的专题中。
通过对学校学术资源分布的调查发现,全校师生已公开出版的学术资源、学位论文和个人信息分布于学校现有的数据管理系统、外购的数据库中。其中学校现有的数据管理系统包括:师生信息系统公共库、科研管理系统、学位论文库,分别存储着全校师生的个人信息和公开发表的学术成果,如期刊论文、会议论文、专著教材、专利,以及学生的学位论文。对于学校现有数据管理系统中的数据,需要机构知识库系统与这些系统对接,进行数据的移植;对于外购数据库中的数据资源,通过NoteExpress文献管理软件收集元数据信息和全文信息后再通过导入工具批量装载到机构知识库中。对于个人手中的灰色资源,通过机构知识库系统的自助存档方式提交到分机构知识库或总机构知识库中。北工大机构知识库学术资源建设与使用整体框架如图2所示。图2北京工业大学机构知识库学术资源建设与使用整体框架
1.3.1机构知识库系统与校内现有系统的对接
机构知识库与学校信息系统公共库的对接。学校信息系统公共库中存储着全校师生的信息,如姓名、工号/学号、单位代码等。为了解决校内用户登录机构知识库系统的身份认证问题,并实现通过学校信息门户网站单点登录到机构知识库系统的功能,需要机构知识库系统与学校信息库进行集成。集成后的机构知识库系统解决了用户身份认证问题,校内用户无需在机构知识库系统中注册即可登录到机构知识库中,方便教职工的使用。集成后,校内用户登录机构知识库系统有两种方式:一是通过学校信息门户中提供的机构知识库链接进行登录,教职工和学生在单点登录到学校信息门户后,点击机构知识库链接,直接跳转到机构知识库系统中,无需通过机构知识库系统登录界面进行登录操作;二是通过机构知识库系统网站上的登录界面,使用学校信息门户登录信息,在信息系统中经身份验证后登录到机构知识库系统中。
机构知识库与科研管理系统的对接。科研管理系统中存储着教职工和学生公开发表的期刊会议论文、专利等的题录信息,但没有提供全文。通过开发的转换工具,将科研管理系统中导出的EXCEL格式的数据转换成NoteExpress格式的数据,然后再导入到NoteExpress中。通过NoteExpress的在线更新功能,补全题录信息,同时下载全文。最后将整理好的NoteExpress中的题录和全文一起通过基于NoteExpress开发的资源提交工具[8]批量导入到机构知识库中。
机构知识库与学位论文库的对接。学位论文库包括学校的博士、硕士论文和优秀本科生论文,包含题录和全文信息。学位论文库采用的是TPI即清华同方专业数据库制作管理系统。对接方法是,从TPI中通过OAI收割出xml格式的数据,再通过机构知识库系统中的TPI接口直接导入到机构知识库中。
1.3.2外购数据库中数据资源及灰色资源的收集
对于学校科研管理系统中没有收集,存在于外购数据库中的师生学术知识产出,图书馆员可通过NoteExpress文献管理软件收集元数据信息和全文信息后,再通过导入工具直接批量装载到机构知识库中。(下转第129页)基于学科服务视角的高校图书馆就业服务研究对于未公开发表的学术成果以及教学科研过程中产生的中间产品等灰色资源,通过教学科研人员自助存档的方式上传到机构知识库中。然而,从机构知识库运行的实际情况来看,极少有教学科研人员主动向机构知识库中提交资源。为了促进机构内人员自主提交资源,建议高校制定相关政策将机构知识库中的内容作为考核评价的依据之一,确保资源的可持续增加。另外,建议图书馆分派学科馆员帮助机构内人员掌握提交流程,对要提交的资源进行分类整理,解答提交中出现的问题,保持提交途径畅通。
2结语
高校机构知识库的建设,不仅长期收集、管理、保存和展示学校教学科研活动中产生的各种学术成果,而且为教师、科研工作者提供了学术交流的平台,促进了学校各学院、研究所、实验室内外部的学术交流,推动了教学科研工作的发展,为学校教学和科研的评估提供依据。同时,基于开放存取理念的机构知识库对提升学校的知名度和影响力、拓展图书馆的服务范围、革新传统学术交流体系、促进知识在全球共享共用都有着重要意义。机构知识库未来的发展不但要求运用最新的信息技术加强系统平台功能,提高使用率,而且还要制定相关政策充分调动机构内成员的积极性,主动参与到机构知识库资源建设中,实现学术资源全面收集和呈现。
参考文献
[1]李海蓉.网络学术资源的开放获取[J].情报探索,2006,(8):30-32.
[2]赵继海.机构知识库:数字图书馆发展的新领域[J].中国图书馆学报,2006,(2):33-36.
[3]杨宏.国内机构知识库研究综述[J].上海高校图书情报工作研究,2007,(3):1-6.
[4]OpenDOAR[EB/OL].http:∥www.opendoar.org/index.html,2013-04-08.
[5]NoteExpress简介[EB/OL].http:∥www.reflib.org/indexchs.htm#feature,2013-02-19.
[6]DSpace System Documentation:Architecture[EB/OL].http:∥www.dspace.org/161Documentation/ch11.html#N16F84,2013-03-02.
[7]DSpace System Documentation:Functional Overview[EB/OL].http:∥www.dspace.org/161Documentation/ch02.html,2013-03-02.
[8]邓红,丁君涛,涂飞平.利用NoteExpress设计与开发DSpace机构知识库资源提交工具[J].现代图书情报技术,2012,(1):80-84.
(本文责任编辑:孙国雷)企业信息化过程中知识整合机制与知识吸收能力关系研究
收稿日期:2013-04-17
基金项目:云南省教育厅科学研究基金项目(2010Y120);云南财经大学引进人才科研启动费项目(YC10D020);云南省应用基础研究基金项目(09Z0058)。
作者简介:宁东玲(1975-),女,副教授,博士,研究方向:知识管理、信息系统。
收稿日期:2013-04-16
基金项目:本文系广西人文社会科学发展中心“科学研究工程”专项项目“基于本科生就业教育的图书馆个性化服务研究”(项目批准号:ZX2011055)研究成果之一。
作者简介:何小贞(1962-),女,党总支书记,讲师,研究方向:就业教育,发表论文10余篇。
通讯作者:朱会华(1986-),女,馆员,研究方向:图情理论和实践研究,发表论文5篇。