基于DSpace的大学个性化知识资产管理系统研究与设计*——以浙江大学机构知识库系统为例

2012-10-09 09:42赵亚萍周东升程艳旗
中国教育信息化 2012年15期
关键词:原创性知识库个性化

赵亚萍,周东升,程艳旗

(浙江大学 信息中心,浙江 杭州 310028)

一、前言

高校图书馆承担着大学知识管理的主要职能,是师生最信赖的知识资源提供者。然而,大学自身的原创性成果保存由于受到成本、机制、技术等因素影响,并未得到应有重视,大量的师生原创性成果散布在学校各个角落,严重影响资产价值发挥。随着数字化技术、互联网技术的深入发展,大学核心知识资产的收集、保存、管理和利用变得可行。

机构知识库(Institutional Repositories,IR)作为机构知识管理的重要部分,十几年来一直是研究型图书馆的重要职责和热门研究对象。尽管机构知识库产生的本意是对开放存取运动的响应,但是在实际实施中很多学者和大学则将目标定位在机构知识管理,学者赵继海认为机构知识库是大学或研究机构通过网络来收集、保存、管理、检索和利用其学术资源的数据库。[1]学者张晓林根据定位不同,将机构知识库建设目标定义在机构知识资产管理、机构知识传播和机构知识能力管理三方面。[2]本文通过剖析大学知识资产管理的需求持续性,采纳张晓林提出的三个层面的目标,结合DSpace系统特征,与大学URP数字化校园建设集成,提出大学个性化知识资产管理系统的设计和实现。[3]

二、大学个性化知识资产管理

自上世纪90年代校园网在大学普及,除了传统的纸质资产,大学知识更以数字化、多媒体化、网络化、移动化的资产形态出现。资产总量更是高速增长,据2009年中国高等教育学会教育信息化分会组织的“教育信息化建设与应用研究”课题报告:53.4%的高校建立了全校统一的教学资源管理平台,校均数字教学资源达618GB;18.7%的学校建立有科研知识共享平台,由学校或院系统一建设的学科资源库数目平均为7个,资源库容量平均为2.69TB。如此丰富的资源因缺少梳理、整合,资源所蕴含的知识得不到有效利用,不仅造成浪费,更阻碍了机构知识能力的提升。

1.知识传承对大学知识资产管理的需求

数字资产相比纸质资产,其知识利用更为方便,但是也带来了永久利用的问题。数字技术遵循摩尔定律飞速发展,数字资产容易受存储介质、存储格式、展现等技术发展影响,技术上造成资产不可利用,从而削弱大学知识的持久传递。另外由于高昂的管理与维护费用,经济上影响大学知识的长久保存。当前,大学知识主要保留在教师个人工作用机和团队服务器上,知识资产原始的、分散的、无规范的保管方式,容易造成资产失效。所以,大学知识传承需要每所学校从保护自身资产的视角,提供一套可靠、稳定、可信的管理系统,为广大师生提供永久存放、随时随地取用的知识资产管理服务。

2.教师学术传播对个性化知识资产管理的需求

学术出版是教师学术传播的主要途径,学术出版通过版权保护法则确保了出版商和教师的利益不受侵犯。由于纸质出版在学术传播时效性、学术传播速度、影响广度等方面的劣势,数字优先出版正逐渐成为主流。学术出版解决了教师知识的正式出版,然而就学术传播而言,更多的教师知识是以灰色文献的状态存在,也就是说这些知识缺少版权保护。正是这些灰色文献得不到保护,极大地影响了教师学术传播效率。因此,教师学术传播比以往更需要将数字化知识作为资产进行管理,同时由于互联网技术,使个人和个人、个人和团体之间的知识传播更为便利,教师学术传播需要更为灵活、方便的授权操作,以实现个性化数字版权保护服务。

3.师生知识交流对个性化知识资源管理的需求

1996年,经济合作与发展组织从知识使用形态角度把知识分为四种类型:知事(how-what)、知因(know-why)、技能(know-how)、知人(know-who),其中前三种知识形态主要表现为显性知识,第四种知识形态则主要表现为隐性知识。由于隐性知识内容远比显性知识内容丰富、生动、鲜活,理应成为知识资源的重要内容。隐性知识又可等价于人力知识,它涉及谁知道什么和谁知道如何做某些事的信息,沟通交流是最好地获取隐性知识的手段,也是师生知识共享的主要途径。所以,师生知识交流需要突破传统的显性知识资源管理模式,促进和支持隐性知识显性化,方便师生之间的沟通交流,提供个性化独特的知识资源管理。

因此,基于知识管理服务的需求可持续发展,我们将大学个性化知识资产管理的总体目标定位在构建一个个性化的服务于大学知识创新的原创性成果长期保存、传播与利用的管理系统。即系统需要实现:(1)师生原创性知识资源的长期有效保存;(2)多维度展现学术形象,为师生提供全面展示的传播窗口,服务于教师招收新生、科研合作、社会服务;(3)构建新的学术交流模式,促进学术团队内部和外部之间的知识交流与共享。由此,大学个性化知识资产管理系统不仅需要完成大学原创性知识资源的管理,更是大学学术信息环境建设的重要组成。[4]

三、系统设计思路与总体结构

OpenDOAR是全球权威的开放获取知识库登记系统,截至2011年5月18日,我国大学机构知识库注册数为8个,仅占全球的0.7%,远低于世界领先的国家。另外,从资源保有量、自存储更新率、系统易用性、友好性等方面,国内外机构知识库系统服务水平也存在较大差距,这与各个国家的知识产权保护机制、知识共享理念有一定关系,但是也和信息系统建设的定位、系统性能和功能是否符合大学发展需要,是否满足师生需求不无关系。当前,国内机构知识库系统建设存在的问题主要表现在:(1)大学机构知识库资源自存储率低,师生认同度不高。对机构知识库存储率的比较研究结果显示:由于各种原因,一到两年内如果没有强制性要求,机构知识库自愿进行自存储的论文数量只有15%。[5]在浙江大学实际推行中,也验证了该研究结果,在走访中,当我们说到机构知识库这个名称时,很多教师表示陌生。(2)大学机构知识库系统独立于大学数字化校园,对师生而言是又一个信息孤岛。大学数字化校园建设,强化了大学职能部门的信息系统建设,然而,系统之间的数据流动一直没有得到较好解决,教师为了应对职能部门的管理,其数据填报工作量非常巨大。在缺乏顶层设计下建立的机构知识库必将成为又一个信息孤岛,从而得不到师生青睐。

因此,有必要从需求层面入手,从大学数字化校园建设的顶层视角,运用信息整合技术,提升机构知识库建设质量。

1.设计思路

大学个性化知识资产管理系统设计的关键是将多种成熟技术与大学URP数字化校园环境集成,通过集成数字化校园环境的数据资源,整合师生原创性数字资源,提供集存储、保存、浏览、检索、下载、保护、开发和利用为一体的系统架构,为师生、团队、机构提供个性化知识资产管理服务。

个性化知识资产管理系统是大学用于整合原创性知识资源的新服务。整个系统将基于大学URP平台建设,大学URP的三大标志性服务将为个性化知识资产服务提供服务,其中统一身份认证为系统提供机构信息、师生身份信息和身份认证,数据交换中心为系统提供教学科研成果基本元数据信息和实时数据交换,校园门户为系统提供资产展示与应用服务。

个性化知识资产管理系统采用分层设计思想,数据、业务和服务分层设计并实现。SAN存储阵列满足大容量数据存储需要,确保数据可靠保存和按需扩容。开放接口满足对数字资源的版权保护、数据关联等知识利用服务建设。

个性化知识资产管理系统还需要建设完善的后台管理服务,建立原创性知识资源管理制度和资源建设的工作体系与管理机制,保证系统的可持续发展。

2.总体架构

DSpace系统是由MIT和HP实验室于2002年合作开发的一个专门的数字资产管理(Digital Assets Management,DAM)系统,它以数字资源为目标对象,提供数字文件的提交、保存、浏览、检索和下载等服务。DSpace系统以其良好的开放性,丰富的标准接口,以及工作流控制和权限控制,在促进大学和商业机构进行原生性数字资产(born digital resources)保存与利用方面发挥了显著作用。因此,基于DSpace进行定制开发成为个性化知识资产管理实现的最佳选择。

在DSpace系统里数字资源通过知识库、合集、条目、资源集和资源实体等对象得到持久保存,实现资源的属主管理和呈现管理。

个性化知识资产管理系统自上而下,分为数据层、业务层和服务层,如图1所示。

图1 个性化知识资产管理系统开发框架

(1)数据层

数据层实现原创性知识资源元数据和资源实体的持久存储。RDBMS wrapper起到桥接的作用,屏蔽了具体的数据库产品和文件存储管理系统。

由于个性化知识资产管理还需要关注师生个体、团队和机构组织,以及它们与资源之间的关联关系,因此必须与URP系统的身份管理、组织管理进行集成,我们建议增加专家实体和机构/团队实体用于存放机构及其专家,这样就可以确定资源与机构、专家之间的归属关系,资源通过知识库归入机构,机构拥有专家,专家通过条目关联到资源,资源在机构页面呈现在专家名下。个性化知识资产管理系统数据结构模型如图2所示。

(2)业务层

业务层提供系统的核心管理模块,实现知识资源的增、删、改、查、授权功能,通过API和Web Service接口封装,实现开放接口,提供资源调用和二次利用接口开放,供服务层调用。业务层模块包括内容管理、库管理、检索管理、授权管理、数据同步和工作流管理等,开放接口提供plugin、handle、OAI、Web Service 等。 在业务层主要需要处理好资源的版权和权益,解决师生提交资源的后顾之忧。

图2 内容管理数据模型

数字版权管理(Digital Rights Management,简称DRM)以解决网络环境下版权人利益和公众用户利益的双赢为目标,为知识传承过程的知识生产和知识消费提供社会化环境。数字版权技术由用户、授权和内容三要素组成。[6]用户管理利用URP数字化校园的统一身份认证系统实现。在内容保护方面,主要技术包括数据加密、数字水印技术,数据加密先将电子文件加密成密文后发布,使得其在传递过程中出现的非法攻击者无法从密文获取机要信息,从而达到版权保护和信息安全的目的。数字水印技术是一种可以在开放网络环境下保护版权和认证来源及完整性的新型技术,创作者的创作信息和个人标志通过数字水印系统以人所不可感知的形式嵌入在作品中,从而对作品起到保护作用。

在授权方面,根据用途可以区分为商业和非商业,非商业性用途的许可协议主要为“知识共享”(Creative Commons,简称CC),目前典型应用包括麻省理工学院的开放式课程计划(MIT Opencourseware),中国开放式教育资源共享协会 (China Open Resources for Education,简称CORE)网站等。CC协议机制提供了由4个最常见的授权选择的组合方式,四种基本授权为:“署名”、“非商业用途”、“非派生作品”和“保持一致”。任何作者都可以通过选择不同组合声明自己的作品授权,实际上可以有11种常见的组合方式。在教学和研究领域,由于获取金钱并不是其建立智力资产的唯一目标,智力资产的归属感相对来说更为重要,因此纯商业性的版权保护对大学而言并不合理,CC不啻为一种有效地解决师生灰色文献知识权益的非商业版权许可协议。[7]

基于DSpace软件的Creative Commons Support,可以较好地解决个性化知识资产管理平台的版权保护问题。

(3)应用层

应用层是师生体验系统的最外层服务,应用层为师生提供基本的原创性知识资产管理、学术传播和知识共享服务,功能包括数字资源存/取、资源检索、资源浏览、信息推荐、用户评论、数字版权保护、知识关联等。

应用层通过数据交换中心,实现与大学职能部门信息系统集成,可以实现教师在自存储科研成果的时候,同时向多个系统分发数据。

四、结束语

与其他知识资产管理系统相比,该平台特点如下:(1)与大学数字化校园URP系统紧密融合,一方面充分利用了高校已有的信息化建设成果,降低平台实施的成本,另一方面深化了数字化校园内涵;(2)注重知识资产的合理利用,强调师生个性化利益的保障,DRM版权管理功能解决了师生共享知识的后顾之忧;(3)DSpace软件的开放性、扩展性,为知识服务提供了广阔的空间,后期可以考虑将大学自身知识成果与学科发展进行关联,提供更高层次的知识关联服务。

依据本文所述模型构建的浙江大学机构知识库从2009年正式上线以来,实现了近30万师生原生性资源的保存、展示、查阅等功能,高校可以根据自身定位和IT技术支持能力情况,选择合适的解决方案,共同致力于为师生提供优质的学术信息环境。[7][8]

[1]赵继海.机构知识库:数字图书馆发展的新领域[J].中国图书馆学报,2006(2).

[2]张晓林.机构知识库的政策、功能和支撑机制分析[J].图书情报工作,2008(1).

[3]蒋东兴,陈怀楚,郭大勇,刘贵,佟秋利.大学资源计划理论探讨与实践[J].教育信息化,2005(11).

[4]张智雄,林颖,郭少友,江淇.新型机构信息环境的建设思路及框架[J].现代图书情报技术,2006(3).

[5]都平平.机构仓储的自存储和强制存储策略研究[J].图书馆杂志,2008(9).

[6]范科峰,莫玮,曹山,赵新华,裴庆祺.数字版权管理技术及应用研究进展[J].电子学报,2007(6).

[7]尹方屏,王思敏,刘群艳.构建高校机构成果库的实践探索——以西安工程大学为例[J].情报探索,2011(5):79-81.

[8]李新,孙利芳.机构知识库构建实践谈——以内蒙古农业大学为例[J].农业图书情报学刊,2011(3):50-53.

猜你喜欢
原创性知识库个性化
沈阳师范大学原创性学术著作评介
——开阔的价值理论与经济实践的视野
汉语近义词辨析知识库构建研究
藏族音乐研究中的原创性学术观点及其价值——以西藏音乐史的分期问题为例
坚持个性化的写作
原创性的艺术史研究如何可能?
——《专注性与剧场性:狄德罗时代的绘画与观众》评介
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
作品的原创性
上汽大通:C2B个性化定制未来
卫星状态智能诊断知识库设计方法
同桌宝贝