安 源,李雪山
(中国铁道科学研究院 科学技术信息研究所,北京 100081)
机构知识库(IR),也称机构仓储,是科研教育机构对本单位的知识产出进行统一收集、集中管理、长期保存和检索利用的知识资产管理系统,是促进知识共享、交流及人才培养的重要手段。
中国铁道科学研究院(以下简称铁科院)是我国铁路行业唯一的多学科、多专业的综合性研究机构,在高速铁路建设、既有线提速、重载运输、信息化、运输安全保障、装备现代化及城市轨道交通等领域积淀了深厚的专业知识,对这些知识集中管理和共享,不仅可以避免知识产出的个人分散存储和流失,还有利于展现铁科院的整体科研实力和水平,有利于增进知识交流,增强学术气氛,有利于人才的发现和培养。
铁路机构知识库(RAIL-IR)正是为解决这一问题而构建的。它以网络为手段,将分散的知识进行统一收集,统一存储,提供检索页面,供查询和交流。
近年来,国内外出现了较多的机构知识库软件,如Hol l yKM知识管理系统, EOS企业资源管理系统,Magnol ia Web内容管理系统, Al f resco企业文档管理系统及DSpace等。
通过调研,铁路知识库系统最终选择DSpace,原因如下:
(1)DSpace 具有知识资源存储管理、 基于事件触发的工作流机制和多级权限控制体系等功能。
(2)DSpace是目前用户数最多、应用最广泛的IR软件,全球有近1 500个用户在使用,其中国内用户有厦门大学、中国科学院及其所属各所等。自2002年正式发布以来,经历了从DSpace1.0.1到DSpace1.6.2,10多个版本。由于其用户众多,已形成了论坛和良好的Bug报告机制,系统的健壮性及通用性完全可以信赖。
(3)DSpace是一个较成熟的模块化系统,其开发过程使用了高度耦合的模块化功能设计方法,其界面和功能都可以根据需要进行定制。
(4)DSpace是一款免费开源的软件,任何个人和团体均可获取其源码,并可根据需求进一步定制和完善。
DSpace 是一个专门的数字资产(Digital assets)管理系统, 它管理和发布由电子文件或“位”(Bi tst reams)组成的记录,且允许创建、索引和搜索其元数据以便定位和存取该记录。
图1 DSpace数据组织模型[5]
图1 为DSpace 的数据模型。在该模型中, 每个DSpace 站点分成若干个Community (社群),对应各个研究所。每个Communi t y 下还可划分子Community(社群),对应研究所下属的各个部门。每个子Community(部门)下可划分若干个Col lect ion(集合),对应于各部门的专业或研究方向。DSpace就是利用Community 和Col lection 来管理数据记录,同时完成对整个机构知识的组织和管理。
建设铁路机构知识库需要解决的问题主要有两个。
系统建设的目的主要是将铁科院科研工作者的科研论文、科研报告、专著及演示文稿等进行统一收集和存储,同时提供检索及共享交流服务。
实际调查发现,铁科院在国内外刊物、会议上发表的科技论文比较分散,在SCI、EI、中国知网、维普中文科技期刊、万方数据资源系统等中均可检索到,这些数据库中任何一个均不能涵盖所有数据,且这些数据库因其存储字段不同、输出格式各异,而不能直接用来构建铁路机构知识库;而铁科院的科研报告,以纸质形式进行存档并提供借阅,不仅时间上有延迟,且不便共享交流;对于演示文稿、技术培训等资料因没有相关要求,大多是个人分散存储。
因此,数据采集应当以用户个人提交为主,自动回填为辅。DSpace系统应便于全院职工主动提交自己的科技资料。
目前,铁科院下属10多个专业研究所,各研究所下属多个业务部门。从实际出发,建设具有符合实际管理需要的系统,使近百个业务部门的资料得到全面、细致的集中管理、统计和展示,可以充分调动全院职工的积极性,增强全院科研能力。
铁路机构知识库系统建设应当采取“统一领导、分工负责、逐级落实、共建共享”的原则,其组织机构如图2。
图2 铁路机构知识库系统组织
系统管理员首先建立相应的Communit ies,分别对应铁科院各个研究所(包括处级处室),并为每个Communi t ies指定一名所管理员;所级管理员负责本所各部门(即子Communi t ies)的建立,并为各部门指定管理员;各部门管理员根据本部门的实际情况设置专题(Col lect ions),如期刊论文、科研报告等,同时指定每个专题的发布流程,如能否可直接发布、是否需要审核、审核过程中是否可以修改元数据等,并指定相应的部门成员负责。
基于DSpace的铁路机构知识库系统在此方面具有很大的优势,仅需对DSpace做相应的配置和有限改动就可满足要求。
硬件设置:IBM X3650,4核 2.66 G*2颗,内存4 G,硬盘 146 G *3。
操作系统:Windows Server 2003。
数据库:Postgre SQL 8.3。
应用软件:Dspace1.6。
Web应用服务器:Tomcat 5.5。
因基于DSpace的二次开发和应用较多,并形成了相关论坛和大量文档,所以基于DSpace的铁路机构知识库系统建设相对容易。主要包括如下步骤:
(1)基于Windows操作系统安装。
(2)系统基本参数配置。
主要包括数据库配置、管理员邮件配置、用户注册登录方式配置、检索字段配置、lucene中文分词器配置,索引方式配置、访问IP限制配置、OAI元数据收割配置等。
(3)本地化。
DSpace系统是外国机构开发的开源软件,原系统为英文界面,需进行汉化,即本地化。本地化主要包括统一编码环境、Messages. proper t ies文件、Input - forms. xml文件、邮件模板化及帮助文档汉化等几方面[1]。
(4) 界面调整和优化。
(5)特定Col lect ion元数据描述模板及数据提交流程定制。
DSpace系统默认使用都柏林(即DC)元数据对系统资源进行描述,可满足一般图书文献机构的需要。若有特殊需要,开发者可根据实际情况对特定的专题(Col lect ion)元数据及提交流程进行定制。
上述第(1)、(2)部分在DSpace附带的用户手册中已有详细说明,第(3)、(4)部分在中科院、厦门大学等相关文章中有详细描述,在此不再赘述,只对第(5)部分进行叙述。
基于特定专题的Col lect ion元数据描述模板及数据提交流程定制过程主要包括配置i npu tform.xml文件、注册元数据、配置提交流程等,在此以科技发文为例对其进行描述。科技发文相比科技期刊等来说比较简单,用发文名称、发文编号、发文机关、发文日期等字段描述即可。
(1)X:Dspaceconf iginput-forms.xml文件(X:为系统配置文件所在盘符)。
(2)在
(3)在
若引用系统已存在的dc元数据,则不需此步骤,若input-forms.xml中涉及的
以管理员身份进入系统,进入管理点击ht tp://localhost/railir/Dspace-admin/metadata-schemaregist ry,输入Namespace和Name的值,并添加对应的元数据。
系统默认一个提交操作需要7步完成,而对于科技发文这样具有简单描述的信息专题,简化为2步提交是完全可以的:(1)描述;(2)文件提交。方法如下:
(1)打开文件 X:Dspaceconf igitem-submission.xml;
(2)在
(3)在
(4)在对应的
如图3,系统主界面主要由3部分构成,左侧第一栏主要为信息检索、浏览方式及登录用户工作区;中间为信息展示区,可进行简单的查询和对相应的部分知识进行点击查看;右侧为信息公告区,信息反馈,同时提供了RSS(Real ly Simp le Syndication)信息获取功能。
图3 铁路机构知识库系统主界面
在铁路机构知识库系统中,用户属于不同的部门,各部门根据本部门情况设置可提交的专题。授权用户在登陆系统后,选择要提交的知识资源对应的专题,填写必要的元数据信息,并上传相应文件就可完成信息的提交,提交界面如图4。
图4 用户提交页面
提交后的知识资源将被放入审核人员的工作池中,审核人员可由部门负责人担任,也可指定专人担任,审核人员在审核过程中可对所提交的知识资源进行检查,以确定接受或拒绝此知识资源的提交,若不能确定,可指派给其他人员审核,若设定了元数据编辑权限,还可对提交的知识资源进行元数据编辑等操作。
可灵活设置检索条件,对整个机构库或指定部门进行检索。
铁路知识库系统建成后,将成为全院科技信息、成果交流学习的重要渠道之一。该系统主要功能表现在以下几方面:
(1) 用户可直接查看全院各所和部门发表的科研论文、报告等技术资料,有助于信息及时发现、实时统计和了解各业务部门的科研动态。
(2) 用户可实现以关键字为主题的自动分类浏览,可获取用户所关心领域的科技资源。
(3) 系统具有订阅功能,用户可定制所关心的专题,一旦此专题添加了新文章或其他资源,系统将以Emai l的形式向用户自动推送。
(4) 系统可以对作者的知识资源进行索引,方便作者的科技成果展示,有利于科技人才的发现和培养。
DSpace作为一开源数字资产管理系统,已在国内外大学和研究机构中得到了广泛应用。本文以DSpace为基础,对建立铁科院机构知识库管理系统进行了尝试。基于DSpace 铁路机构知识库系统具有良好的模块化结构,它在用户管理、资源管理、信息服务等方面提供了丰富的功能。希望通过对该系统的进一步研究、建设及完善,切实为科研单位的科研交流和人才培养提供服务。
[1] 陈 和,萧德洪,林丽敏. 基于Dspace构建机构仓储的本地化实践[J]. 现代图书情报技术,2007(3).
[2] 唐兆琦,郑巧英. 基于开源软件Dspace构建学位论文提交与发布系统[J]. 现代图书情报技术,2007(12).
[3] 孙 萍. 基于Dspace 的高校图书馆开放课件系统的实现[J]. 现代情报,2008(2).
[4] 祝忠明,马建霞,常 宁,米 波. 基于Dspace构建学科知识库系统的研究与实践[J]. 现代图书情报技术,2006(7).