机构联盟知识库建设模式

2012-09-14 07:41朱志伯吴海霞
图书馆学刊 2012年1期
关键词:集中式联合体知识库

朱志伯 吴海霞

(1.南通纺织职业技术学院图书馆,江苏 南通 226007;2.南通大学图书馆,江苏 南通 226019)

多个机构联合组成联盟建设联盟知识库,是机构知识库发展的趋势。正确选择知识库建设模式,可以起到节约成本、有效制定政策、提高管理效率的重要作用。在分析联盟知识库建设4种模式(分布式模式、集中式模式、收割式模式和混合式模式)优缺点的基础上,阐述了南通高校教学联合体建设机构联盟知识库的模式。

机构联盟 机构知识库 建设模式

1 机构联盟知识库

机构联盟知识库,是指多个机构联合构建知识库,通过合作的方式,将各自的资源整合起来,从而实现机构间资源共享,统一提供数字化服务[1]。机构知识库建设涉及技术、经济、管理、法律等多方面的问题,受人力、物力、财力等因素的制约,并非所有的学术机构都愿意或有能力建立独立的机构知识库,然而加强合作,建设联盟机构知识库是机构知识库发展的必然选择。多个组织的时间、精力投入是一个机构知识库项目成功不可或缺的因素,一个机构知识库的构建及维护很大程度上也依赖于共同思考、共同决策[2]。

2 机构联盟知识库构建模式

在机构知识库建设面临的诸多问题中,建设模式是需要认真考虑的基本问题之一。正确选择机构知识库建设模式可以起到节约成本、有效制定政策、提高管理效率的重要作用。笔者认为机构联盟知识库建设模式可分为4种:分布式模式、集中式模式、收割式模式和混合式模式。

2.1 分布式模式

分布式模式是指在多个机构之间组成一个联合体时,所有联盟机构成员都拥有各自的机构知识库,所有机构知识库的元数据和内容都存储在各机构本体知识库中,如图1所示。用户通过Z39.50或SRW/SRU协议来检索所有分布的知识库的元数据,从而获取自己所需要的信息。

图1 分布式模式结构

2.2 集中式模式

集中式模式是指多个机构组成一个联合体,只建立一个服务器,各个机构内部成员都直接将元数据与内容提交到该服务器上,然后通过统一的服务界面提供服务或作为数据提供方提供对外服务。从数据提交一直到开放利用,所有管理与维护功能都实行集中化管理,如图2所示。英国利兹大学、设菲尔德大学与约克角大学共同合作建立的白玫瑰机构知识库就是集中式模式的机构知识库。

图2 集中式模式结构

2.3 收割式模式

收割式模式是指机构联合体成员分别遵循相关协议,建立属于自己的知识库,在实现独立搜索的基础上,构建统一检索平台,系统定期自动采集元数据并存储到一个收割数据库中,用户只要访问收割数据库就能获得搜索结果,如图3所示。英国JISC所资助的ePrints UK项目就是属于从国家层面来进行的收割式模式的机构知识库[3]。

图3 收割式模式结构

2.4 混合式模式

混合式模式是指机构联合体成员在建设机构知识库时既有分布式模式又有集中式模式和收割式模式。如图4所示,联盟机构1、2、…n以集中式模式共建一个机构知识库i,机构知识库 i、j、k 采用的是收割式模式,机构知识库 m、n、p采用的是分布式模式。

图4 混合式模式结构

3 机构联盟知识库构建模式比较

目前机构联盟的4种模式都有自己的发展空间,各具有一定优势,但也存在着弊端,适用于不同的情况。基于此,笔者对其适用的情况及优缺点进行详细的分析,如表1所示。

表1 机构联盟知识库构建模式适用情况及优缺点比较

3.1 分布式模式机构知识库利弊

分布式模式机构联盟知识库适用于多个机构在组织联盟时,各个体机构都建有自己的机构知识库,为实现资源共享,各机构将自己的知识库对联盟成员开放。分布式有两种:一种是物理上分布的,但逻辑上却是集中的。可开发统一跨库检索软件对分布在各成员的机构知识库进行统一检索,提供统一的检索界面。另一种分布式在物理上和逻辑上都是分布的,也就是所谓联邦式分布式,由于组成联邦的各个子库系统是相对“自治”的,联盟成员只能通过Z39.50或SRW/SRU协议对各成员的机构知识库逐一进行检索,不同的机构库检索界面不一样,用户检索到的信息,需要筛去重复才能得到所需的信息[4]。

3.1.1 优势。在这种模式下,机构结成联盟后各机构仍能完全独立规划本地知识库的发展,体现本机构特色。由于成员归属感强,对机构知识库快速高效运行无疑带来推动力,可以完全由知识库管理者根据本机构发展现状来制定实施政策。而联盟的紧密度低,一但成员要退出联盟,只要关闭对外开放,就能退出,不存在如何剥离的问题。分布式模式可以保障对元数据的实时检索,局部应用的响应速度快,可扩展性好。

3.1.2 弊端。首先,投入成本高,机构知识库所有投入,尤其是资金投入与维护都集于机构本体,成本比较昂贵,有重复投入、重复建设的浪费现象。其次,由于联盟机构成员具有高度自治性,致使联盟机构成员在机构知识库建设中存在着不一致性。一方面,由于每个联盟机构都对本地知识库实行自治管理,不能统一制定联盟成员政策与管理模式,比如内容提交政策方面,有的机构可能将行政管理文件、档案纳入到内容提交范围,而有的机构则可能将这些内容拒之库外,这就导致联盟机构知识库内容性质存在差异,同时,每个机构制定的质量审核标准不同,也会使联盟机构知识库内容质量受到影响。另一方面,该模式不强制其成员采用同一软件,导致各联盟成员机构知识库应用的元数据标准存在着不一致性,统一跨库检索实现难度大。再次,随着数据量的增大,检索速度会明显下降,检索记录重复率增高,而且对于来自于各处的检索结果,难以按照相关度来进行排序。

3.2 集中式模式联盟机构知识库的利弊

集中式联盟机构知识库适合于具有良好合作历史或者具有共同隶属关系的机构中,如地理位置相近的区域机构知识库。对于机构联盟中一些小型机构来说,加入已有的集中存储式联盟机构知识库不失为一个节约成本的最佳选择。

3.2.1 优势。多个机构共同建立同一个机构知识库使每个机构参与建设的成本大大降低,避免了重复性劳动,收到“规模性”的经济效益[5];同时,内容数量也具有丰富的发展潜力,能提高文献资源建设的质量,为地方城市的科研人员在数字化环境下的科研活动提供了一个新的交流平台,有利于地方历史资料、科研文献的永久性保存,进一步促进地方的产业发展。此外,由于实行集中管理,可以在技术标准应用方面具有统一性,便于内容元数据的管理与开放。此模式用户检索数据速度快,重复率低。

3.2.2 弊端。该模式虽然实行集中管理,但在政策制定上缺乏高效性,因为在制定政策时必须考虑到联盟机构各自的发展历史与现状,也必须考虑到联盟机构不同文化学术传统与管理传统的差异性,机构知识库管理发展政策制定过程需要联盟机构相互协调,统筹规划;联盟成员归属感低,集中存储式联盟知识库由于只建立一个服务器,或以某一机构品牌为标志,或者以联盟品牌为标志,不能体现每个独立机构的品牌,所以使其成员无法感受到归属感,甚至可能成为制约机构成员提交内容的一个因素;再次,该模式还存在着其他可能引发联盟管理矛盾的因素,例如当联盟机构成员对机构知识库贡献率或利用率存在不均衡时,是否会引发行政管理层面的问题;如果某个联盟机构成员被其他机构合并,而合并者并不属于该联盟成员或想建立标有自己品牌的知识库时,是否允许这一原始联盟机构成员将属于自己机构的那部分数据剥离出去,由此,对于建立跨地区或更大范围内联盟机构知识库,只用一个服务器显然不合适。

3.3 收割式模式联盟机构知识库利弊

收割式模式联盟机构知识库是在分布式的基础上发展而来的,为了解决分布式检索速度慢,数据重复率高的不足,对联盟体内分布在各地的知识库进行元数据定期的收割(采集),收割来的元数据存放在一个数据库中,刚收割的元数据与先前收割的数据进行比较,使得数据库中存放的数据为最新的元数据,联盟用户检索时,首先访问收割元数据库,快速获得检索目录,然后根据需要条目,再访问分布在各地的知识库,获得内容,从而提高了检索的速度。收割式模式适用于大范围联盟机构知识库的建设[6]。

3.3.1 优势。联盟机构成员在采用同一软件基础之上可以共享技术与管理经验,如果建设过程中遇到技术问题,可以向其他联盟成员寻求解决方案;联盟机构成员成本资助来源扩大,如果加入到统一的联盟,就会通过联盟团体获得更多的资助与支持,既使不同机构建立有效的长期“共享利用机制,实现资源共享”[7],又减缓了机构有限经费投入的压力。与分布式相比,其提供了统一检索界面,提高了检索的速度,元数据一旦存入数据库中,就可以被加工、加强并重新呈现给最初的数据提供者和其他服务提供者,相对于中央集中式模式,其实施成本相对较低。

3.3.2 弊端。与分布式、集中式相比,收割式模式不具备实时性,联盟用户访问到的是最近一次收割的内容。由于OAIPMH要求所收割的元数据只需满足其要求的最低标准,所以收割到的元数据的质量参差不齐,而且有时收割到的元数据并非最新版本,需要再次收割时才会反映出其最新版本。

3.4 混合式模式机构联盟知识库利弊

建立全国范围或全球范围内多个机构联盟知识库时,由于组成机构联盟成员的复杂性和特殊性,为保留原有机构知识库,又要尽快实现联盟内成员资源共享,可选择混合式模式。从混合式模式结构图4中可以看出,在混合式模式内,局部有集中式、收割式、分布式,因而,混合式模式机构联盟知识库的利弊集分布式、集中式、收割式模式的优点缺点于一身。就整体而言,混合式模式最大的优点是尽快实现联盟内成员资源共享,不足是技术实现难度大。

4 南通高校联合体机构联盟知识库的建设模式

2006年12月20日,南通高校教学联合体成立,南通大学、南通职业大学、南通纺织职业技术学院、南通航运职业技术学院、南通农业职业技术学院、紫琅职业技术学院等6所高校共同签署了共建协议[8]。南通高校教学联合体是苏中地区建立的第一个教学联合体,其中,既有综合性大学,也有高职高专;既有省属普通高校,也有市属地方院校;既有公办学校,也有民办学校。在办学方向、专业设置、人才培养等方面各有偏重,办学特色各异,优质资源丰富。

4.1 南通高校联合体机构联盟知识库建设的可行性

2009年5月,南通高校教学联合体6所高校图书馆在江苏省教育厅高教处、省高校图工委的领导和协调下,由南通大学图书馆牵头,签订了“南通高校教学联合体图书馆文献资源共享协议”[9],确定了南通高校教学联合体图书馆文献资源共享的宗旨:以科学发展观为指导,本着“优势互补、合作共享、互利互惠、共同发展”的基本原则,积极推进南通高校教学联合体文献信息资源共享服务,为南通教育均衡全面、可持续发展和社会协调稳定发展服务。南通高校教学联合体文献资源共享协议的签订,为联盟机构知识库的建立打下了坚实的基础。

先进的网络设备和高素质的人才为联盟机构知识库的建立提供了先决的条件。近年来,随着网络技术的飞速发展以及地方政府的重视,各高校图书馆培养了一大批优秀的计算机人才队伍,不断有新的数字图书馆产生以及地方资源共享系统的建立,各校都建有自己的特色教学资源库、精品课程库。为充分发挥南通地区高校图书馆的综合优势,积极探索切实可行的共建、共享模式,推进教育文献信息资源的开放和共享,提升各成员馆服务教学科研的能力,迫切需要建设联盟机构知识库。

4.2 南通高校联合体联盟机构知识库的构建模式

在南通高校教学联合体中,南通大学是唯一一所本科综合性大学,人力和物力都具有绝对优势,技术开发力量雄厚。南通高校联合体机构联盟知识库采用的是集中模式,中央集中存储器放于南通大学,由南通大学牵头,组织其他5所学校共建。选择集中式模式的主要原因是,首先南通高校联合体目前还没有一个成员建有机构知识库,因此可以从顶层设计,选择统一软件,制定统一政策,有利于集中管理。其次,南通高校教学联合体都传承张謇教育思想,有相同的历史渊源,有地方特色的地方文献资源,有合作的历史。再次,地理位置相对集中,组织交流方便,有利于资源的开发和利用。

5 结语

建设机构知识库,利益与挑战并存。笔者认为,在相当长一段时期内,联盟模式能够为知识库的发展做出积极贡献。而这种模式对于资金、人员、技术、资源都相对匮乏的国内知识库来说,无疑具有很大的借鉴意义。如何借鉴国外机构联盟知识库成功的经验来指导正在兴起的国内知识库的建设,将成为我们需要进一步探索的问题[10]。

[1] 渠芳.高校教学联合体机构知识库联盟建设研究[J].情报理论与实践,2010(11):83-85.

[2] 万文娟,吴高.高校教学联合体机构知识库联盟建设研究[J].国家图书馆学刊,2010(4):31-35.

[3] 邓君.机构知识库建设模式研究[J].图书情报工作,2010(6):112-116.

[4] 曾苏,等.机构知识库联盟发展现状及关键问题分析[J].图书情报工作,2009(24):106-110.

[5] 王颖洁.国外机构知识库运行模式分析[J].当代图书馆,2008(4):58-61.

[6] 陈淑珍,等.我国大学机构知识库建设的模式选择与实施策略[J].图书馆杂志,2009(8):52-54.

[7] 张东华.高校机构知识库的内容构建与管理模式研究[J].情报科学,2009(6):836-838.

[8]http://gxlh.ntu.edu.cn/.

[9] http://222.192.60.12/html/jalis/20090618153902.htm.

[10] 常唯.机构知识库:数字时代一种新的学术交流与共享方式[J].图书馆杂志,2005(3):16-19.

猜你喜欢
集中式联合体知识库
对于联合体EPC总承包模式下成本控制的得与失
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
光伏:分布式新增装机规模首次超越集中式
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
创新思维——打造智库联合体
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
浅谈集中式光伏电站设计与设备选型
浅析组串式和集中式逆变器安全可靠性
归脾汤加减联合体针治疗心脾两虚型失眠48例