机构知识库建设机制探析

2010-04-05 22:46□陈
大学图书馆学报 2010年4期
关键词:典藏知识库论文

□陈 琳

1 引言

机构知识库(Institutional Repository,简称IR)是在开放获取环境下产生的一种以学术机构为轴心的数字资源集合[1]。它集中了一个大学或研究机构创造的所有智力成果,包括了期刊论文、论文预印本、技术报告、科研进展报告、硕博士论文、图书或其章节、科研数据库、会议录、教学资料或课件、计算机软件和其他灰色文献等等[2],并通过网络平台达到全文检索和利用的目的。

自2002年11月麻省理工学院图书馆和惠普实验室共同开发的DSpace软件正式面世以来,机构知识库在世界范围内发展迅速,并朝着全球知识共享的目标迈进。截至2009年11月18日,被开放存取知识库名录(The Direct of Open Access Repositories,简称DOAR)收录的知识库已超过1500个[3],其中超过80%的机构知识库将所有资源向网络用户开放。

从国内外机构知识库建设的实践来看,技术已不再是关键问题,相关的政策和相应的支撑机制乃是机构知识库得以持续、健康发展的根本。本文拟结合相关案例,探讨机构知识库建设的相关机制,以期对我国机构知识库建设有所裨益。

2 机构知识库建设机制

2.1 战略机制

构建机构知识库涉及权益交错、经费长期投入等诸多问题,需要从战略的高度来认识它。对于一个机构来说,实现对机构知识资产的管理只是机构库建设发展的基本目标,建立长期的知识管理、传播和服务利用机制,支持和服务于机构知识创新过程和目标的实现,乃是机构知识库长期的责任和建设的意义所在。因此,应将机构知识库建设提升到保存知识资产、发展知识能力、构建知识环境的战略任务的高度,并将其纳入机构的整体建设、管理和发展战略之中,以机构知识库白皮书或管理应用指南等方式明确确认[4]。

机构知识库的发展若能获得政府或高层次组织的支持,可以使机构库的发展更有效率且发挥最大效益。以台湾地区为例,其机构知识库的建设就得益于当局的战略决策。在2005年,台湾“教育部”委托台湾大学图书馆制订“建置《台湾学术研究资源中心》运作架构、机制与执行策略计划”。该计划经“教育部”评估后,认为建置“台湾机构典藏(Taiw an A cademic Institutional Repository,简称 TAIR)”为当局刻不容缓之重要工作。于是在政府的牵头下,2006年6月开始,台湾大学图书馆开始执行《建置机构学术成果典藏计划》,并以其为机构典藏的营运范例,开发机构典藏软件和完备的相关行政工作流程文件与标准规范,作为全台湾各高等院校建置机构库的参考[5]。政府的战略决策极大地促进了台湾地区机构知识库的发展,且分散建置、集中呈现的发展模式不仅保持了各自的主体性,发挥出机构自身的研究特色与研究能力,又在使用上集中统一呈现台湾的学术研究成果,方便利用。TAIR计划已经吸引了 94所高等院校的参与,总记录条目达到439918笔[6]。

2.2 组织机制

机构库建设涉及图书馆、各学院系所、科研处、教务处、网络中心等诸多部门,需要一个很好的合作团队。从国内外机构知识库创建的主体来看,大多数机构知识库都是由图书馆负责建立的,图书馆在机构知识库创建的各个阶段都充当着宣传、规划及协调管理的角色。

图书馆应主动宣传机构知识库的意义与作用,号召更多的科研人员响应、加入机构知识库的建设,促进知识资源的共建共享。可以利用学科馆员与各院系之间建立的经常性联系,把握各种机会及途径加以宣传,使研究人员对机构知识库取得认同并积极提交知识内容;在系统的选择和维护管理上,图书馆要与网络中心合作,讨论编写资料库的框架规划及系统功能需求书、实施和维护机构知识库的成本、经费、硬件等诸多细节问题;图书馆还应该和教务处、科技处等部门密切配合,掌握着教师各类课题项目申请、完成状况以及研究成果的信息。

2.3 政策机制

机构知识库政策是机构基于扩大对研究资源存取能力及改革学术传播体系的需要,对研究成果进行收集、保存、维护以及提供使用所制定的原则和标准规范[7]。政策的制定是一件复杂且需要持续进行的工作,它决定了机构库建设的质量、发展方向和可持续发展。每个机构的独特性使得知识库政策也是个性化的,是为每个机构量身定做、满足每个机构需求的。通常情况下,政策框架应涵盖内容存缴政策和知识产权保护政策。

2.3.1 内容存缴政策

机构库中收录哪些文献类型,图书、期刊论文、会议论文、学位论文、研究报告、手稿等各类型资料的收集原则、提交方式,是否收录多媒体资料等都应在存缴政策中加以规定 。若在内容的存缴上缺乏相关政策,基于无任何约束力的作者的自愿和自觉方式进行,不仅内容的提交率和科研人员认同率不高,建设的效率和效果往往不佳,进而会影响到知识库的推广和应用。

一般来说,机构库知识的内容以学术性及研究性作品为主,一般需要存档的是论文预印本、已发表论文、技术报告、科研进展报告、硕博士论文、图书或其章节、科研数据库、会议录、教学资料或课件、计算机软件、其他灰色文献等,而行政记录、与机构的历史和活动有关的一些资料等则可以存储在机构的档案馆[8]。

各个机构的内容存缴政策不一。比如,香港科技大学机构典藏政策确定其收集范围为全校教职员工、博士生和研究助理的许可研究成果,包括期刊论文、数据集、图书章节、会议论文、学位论文、研究和技术报告、专利、预印本、会议讲演稿和工作论文等,不包括通俗读物和报纸文章;香港理工大学包玉刚图书馆的机构知识库的收藏范围包括全校研究人员、攻读学位学生的许可研究成果,除期刊论文、技术报告、工作论文、会议论文、演示稿、预印本、图书、图书章节、专利、学位论文以外,还包括图、素描图、视频和数据集等。

在机构库建设发展的初期,为了吸引科研人员向知识库提交内容,在决策层和管理层的支持下,制定出强制性自存缴政策,是内容存缴政策的重中之重,将为内容采集和持续建设提供强有力的政策保障[9]。比如,丹麦要求大学将其科学出版物都提交到“国家科研数据库”中,英国Well Trust基金会要求凡是自2006年10月1日起接受基金会资助的研究者,必须将资助的研究成果存储在PubMed Central或 UK PubMed Central中[10]。从美国、英国等已经建成的机构库的内容来看,机构知识库中博士论文、博士研究的原始数据文件以及硕士论文的收藏量都比较大,正是得益于大学对这些内容强制提交的要求。我国的大多数高校也要求学生在毕业离校时必须提交学位论文电子版加以保存,这些强制性的存缴政策实践证明是一种快速收集资源的好方法。

2.3.2 知识产权保护政策

机构知识库收集机构成员投稿于商业性或非营利机构出版的文献,进行典藏时,除需取得作者授权外,还必须获得出版社同意,故要实现全文开放存取,首先面临的是著作权问题。从香港和台湾地区高校机构知识库的内容看,全文的比例总体还不高。

已发表的学术论文涉及自我典藏权利(self-archiving right)、全文索引权利(full-text indexing right)和全文取用权利(access right)。学术论文发表后,虽然作者将文章的多数权利出让给了出版社,但作者和作者所在单位仍拥有自我典藏的权利,可对文章做全文索引;如果文章的权利已由作者让渡给出版社,则出版社拥有论文的取用权利,机构知识库可以主动链接到拥有该篇文章取用权利的出版社资料库网页上,让使用者付费购买,下载全文[11]。

据调查,愈来愈多的期刊或出版社认可作者以开放存取的方式做自我典藏,其中期刊允许自我典藏的比例从2003年的55%、2004年的83%提高到最近的94.88%;出版社允许自我典藏的比例也从2003年的42%、2004年的58%提高到最近的62.9%[12,13]。尽管如此,目前仍有5.12%的期刊和37.1%的出版社不允许自我典藏。因此,为了妥善保护机构和作者的合法利益,应建立明确的知识产权保护政策,出台鼓励出版商在著作权方面允许作者拥有更多权利的政策。

在版权制度的合法框架下,“开放内容许可证”(open content licenses)应运而生,这种新方法简而言之就是作者为自己的作品选择一种许可证一起发布,这些许可证本身都是开放式协议,即它只明文禁止使用者不能做的事,除此以外,可以随意使用这些作品。美国C reative Commons基金会,在2002年12月16日提出的创作共享许可证(Creative Comm ons licenses,简称CC)就是这样一种许可证。

CC许可保留作者的著作权,同时在满足一定许可条件的情况下,允许第三方因为研究与学习目的而复制、散发、公开展示或表演作品、将作品完全一致地转化成另一种格式。第三方在超出“一定许可条件”下使用作品,仍需专门申请著作权人的许可。虽然使用者免费拥有了这些权利,但是必须遵守一些许可证设置的前提条件,诸如没有得到许可,不得实施许可证中禁止的行为;所有的复制件上,都必须保留原始的版权说明和许可证的链接;不得更改许可证的内容;不得用技术手段限制其他人合法使用作品[14]。创作共享版权许可(CC许可)在保障机构成员著作权权益的同时促进了知识的广泛传播,故应积极推行它。

在开放存取和知识产权保护政策上,不少国家的做法值得借鉴。在美国,美国国会通过了“公共获取科学法案”(FRPAA)的立法提案,支持对公共资金资助的科学研究成果的开放存取;美国国家卫生研究院(NIH)的开放存取政策要求研究人员在论文公开发表6个月后,将论文提交给N IH的PubMed-Central,然后免费提供公众使用。美国国家自然科学基金会的开放存取政策提倡“期待并鼓励研究成果的发表,共享数据和各种在工作中形成的材料。研究人员拥有其作品的知识产权,并容许他们拥有版权或专利。”[15]在荷兰的“科学奶酪”项目中,关于平衡作者和出版商的版权问题就有很好的规定:一方面,出版商对涉及文献商业行为的版权具有唯一许可权;另一方面,作者拥有涉及文献学术用途的许可权。无论是预印本,还是已出版发行的文献,都要保证作者最后出版的版本在6个月后存档于知识库[16]。从个体层面看,一些大学的特殊政策也颇具特色,如美国马里兰大学“允许教授提交到校工作前完成的著作,但须加注,并由已有现成设备的单位,负责提供数字化扫描服务”;荷兰开放大学鼓励在文献引用时,引注链接到原出版社;美国杨百翰大学与英国牛津大学“因后来正式出版而删除的预印本,会在资料保存永久记录中标注,并链接至新的书目资料”等[17]。

2.4 管理服务机制

机构知识库要持久、健康地运作,还应建立支持机构成员方便进行存缴和传播的管理服务机制。

向知识库系统中提交资源通常需要按照规定的程序,了解和操作这些程序往往需要花费一定的精力和时间,繁琐的提交过程会使研究人员不愿意来做这些事情。所以,提交程序的设计应简便、易操作。在机构知识库建设的初期,还可以采取集中式的资源收集方式,即建立协助提交机制,由图书馆指定专人帮助研究人员完成资料的提交,包括资料的整理、格式的转换、提交程序的完成等。这样不仅可以减轻研究人员的负担,还可以由图书馆统一管理机构知识库,对作者提交到机构知识库的作品是否符合该机构服务对象的需求,是否属于所要存档的文献类型,是否有版权许可,是否符合一定的格式,作品的元数据是否符合一定标准等内容进行审核,保证机构知识库建设的质量。

机构知识库应具有基本服务功能和扩展服务功能。基本服务功能是基于元数据加工和内容提交、内容组织、信息浏览、检索等数字化学术信息的收集、集中管理、长期保存和提供使用的一般性功能;扩展服务功能则是基于订阅、推荐、评注、标记、关联浏览与检索等一些满足个性化服务需求的衍生功能。不同的机构知识库可以根据其建设和服务目标定位的不同,提供和支持不同的服务功能组合。对于提交到知识库的研究成果,应尽量赋予其更多的扩展服务功能,如可以自动维护个人著作目录、能够自动将成果散播到全国的机构知识库系统中,将机构知识库的内容提供给google等搜索引擎,以增加能见度等[18]。

机构知识库的优势已经越来越得到学术界的认可,以自我典藏方式存放在机构知识库中的论文,用户容易获得,故被引用的机会较大。调查表明,Astrophysica l Journa l上72%可免费获取的论文(主要存放在A rXiv中),其篇均被引用次数为剩余28%的论文的2倍[19]。所以,为了让研究人员切实感受到机构知识库带来的利益,可以提供利用率、被引率的推送服务,可以将研究人员所提交的科研成果的浏览量、下载量、被引率等信息,及时通过电子邮件或其他途径传递给他们。像日本北海道大学等大学定期把文献的下载数量通知给文献提供者,让著者了解自己提供的文献在什么时候、多大程度上被利用,同时将读者对论文的评价、感想等反馈到著者,促进著者与读者之间的学术交流,活跃学术氛围[20]。

2.5 激励机制

研究人员向机构知识库提交研究成果的意愿,关系到机构知识库的成败和可持续发展。由于人们对机构知识库的认识程度不高,缺乏主动提交的意愿,加之提交到机构知识库中的未发表的论著,目前在学术认可和科研待遇上尚未得到应有的支持,更没有被纳入职称评审可报送材料体系中,致使资源提交率仍然徘徊在较低的水平,为此,制定一些与学术评价相结合的激励机制十分必要。如可以通过争取组织内部甚至国家政策的支持,制定出与学术评价机制相结合的激励政策,将机构知识库中的资源纳入科研考核评价体系和职称评价体系。国外的一些做法值得我们借鉴:例如,比利时采取的一项激励措施,是为作者提供建立和维护个人出版物目录的服务;在荷兰,则为作者所存入的成果提供一个到皇家图书馆E-Depot的链接,在“科学奶酪”项目中建立的国家级的机构知识库,里面尽可能多地收录了数百位国家学术带头人公开发表的成果,为机构知识库带来了声望和地位,从而激励作者提交他们的作品[21];美国加州大学机构知识库网站建立的栏目“下载最多的记录”(Top dow n loads);加拿大多伦多大学机构知识库网站上发布的“浏览量列表”(Item s viewed)[22]等,可以让作者了解自己成果的社会反响,切实感受到机构知识库为其带来的直接利益,这些举措无疑对研究人员有激励作用。

2.6 技术机制

采用开源软件已成为机构知识库应用平台建设的主流,应通过对 DSpace、EPrints、Fedora等开源软件的功能特点及适用范围的比较分析,选择适合本机构建设目标的软件系统并进行必要的定制和扩展开发。以台湾地区为例,台湾高校机构知识库统一采用DSpace,并由台湾大学对其进行二次开发,完成了对DSpace的汉化和定制,向全台湾院校提供全套的技术支持,包括系统软件的下载、补丁程序、安装手册(W indow s版和 Linux版)、定制化手册(文字与图片的修改)、备份说明等,使得软件界面可在英文、正体中文(即繁体中文)和简体中文之间切换,用户使用起来十分方便[23]。与此同时,技术平台不仅应建立开放的元数据收割接口,还应建立与开放资源集成揭示系统(例如OpenDOAR)的开放统计与检索接口,与学术出版、教育信息、科研数据、科学普及等系统的开放输入输出接口,与文献信息服务系统的开放服务接口。

1 徐速.机构知识库.图书馆理论与实践,2008(1):39-41

2 赵继海.机构知识库:数字图书馆发展的新领域.中国图书馆学报,2006(2):33-50

3 Abou t OpenDOAR[2009-11-18].h ttp://www.opendoar.org/about.htm l

4 张晓林.机构知识库的政策、功能和支撑机制分析.图书情报工作,2009(1):23-19

5 关于 NTUR.[2009-11-18].h ttp://ntu r.lib.n tu.edu.tw/about/index.jsp.

6 台湾学术机构典藏.[2009-11-18].http://tair.org.tw/

7 王学勤.机构知识库建设相关政策研究.中国图书馆学报,2007(3):44-47

8 洪梅,马建霞.机构知识库建设机制初探.情报杂志,2007(8):37-39

9 陈淑珍,韩珂,祝忠明.我国大学机构知识库建设的模式选择与实施策略.图书馆杂志,2009(8):52-77

10 赖辉荣.破解机构知识库建设中资源收集难题之策略.国家图书馆学刊,2009(3):59-61

11 项洁,洪筱盈.台湾机构典藏发展刍议.教育资料与图书馆馆学(台湾),2005(12):173-189[2009-11-18].http://joem ls.dils.tku.edu.tw/fulltext/43/43-2/173-190.pdf

12 Stevan Harnad,Tim B rody.Com paring the Impact of Open Access(OA)vs.Non-OA A rtic les in the Same Journals.D-Lib Magazine,2004,10(6).[2009-4-11].h ttp://www.dlib.org/dlib/june04/harnad/06harnad.htm l.

13 Jou rnal Policies-Summary Statistics So Far.[2009-04-11].h ttp://romeo.ep rin ts.org/stats.php.

14 阮一峰.谈谈创作公用许可证.[2009-11-18].http://www.kuqin.com/law/20080425/7658.htm l

15 何林.美国机构知识库发展现状对我国发展机构知识库的启示.图书馆论坛,2008(3):101-148

16 同8

17 同7

18 同11

19 David C.Prosser.The Next Information Revolu tion:H ow Open Access w ill Transform Scholarly Communications.[2009-11-18].http://ep rints.rclis.org/archive/00003917/02/IYLIM_chapter.pdf

20 朱莲花,刘春燕.日本机构知识库的构建现状研究.情报理论与实践,2009(8):125-128

21 同8

22 宛玲,苏娜,厉志红.大学机构知识库组织管理问题研究.图书情报工作,2008(4):97-99

23 机构典藏计划网站.[2009-11-18].http://ir.org.tw/

猜你喜欢
典藏知识库论文
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
典藏
往来·典藏
典藏
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
典藏阁