王 晴
机构知识库(Institutional Repository,IR)又称为机构典藏或简称为机构库,至今没有统一的定义,SPARC高级顾问Raym Crow(2002)认为IR是获取并保存大学社区智力产出的数字化集合,是学术机构面临的战略问题的具体回应,即通过分类出版结构的激励创新提供学术交流改革的核心组成部分,并充当有形机构的质量指标以提高其知名度、信誉和公共价值,机构知识库的内容由制度界定(Institutionally defined)、学术性(Scholarly)、永久累积(Cumulative and perpetual)以及开放和互操作性(Open and Interoperable)等要素构成,IR的出现为学术界提供了三大发展契机:(1)草根教职员(Grassroots Faculty)和学术图书馆(Academic Libraries)的态度转变;(2)学术期刊(Scholarly journal)的经济适用;(3)互用协议(Interoperability Protocols)和元数据标准的技术方案[1]。
IR是一个面向特定群体的开放存取政策规范和应用系统,目的是为了促成更大范围的学术交流和知识共享。从OpenDOAR①OpenDOAR是由诺丁汉(Nottingham)大学和伦德(Lund)大学图书馆于2005年2月共建的开放存取存储系统,用户可以通过多种途径检索全球范围内的高质量学术信息资源并使用相应的知识库。网站统计数据可知,截至2013年9月初,全球已有106个国家或地区的2 419个机构加入,其中美国以304个(占总量15%)位居第一,英日德分列第二至四位,台湾排名第十一。从建立之初发展至今一直呈现线性增长规律,从2005年12月初至2011年9月初中国大陆加入Open-DOAR的机构库数量一直处于缓慢的增长期,由2个增至10个,但2011年10月初迅速扩充至32个,发展至2013年9月初达到35个,台湾从2011年初的56个已增长至58个。为了响应开放获取运动并向机构库提供通俗易懂的语言,同时为了方便机构库管理员制定或提交机构库政策,OpenDOAR的政策涵盖了“元数据、数据、内容、提交和保存”等五类关键政策选项,其中,内容(Content)和提交(Submission)政策从低到高共分为未知的(Unknown)、未申明的(Unstated)、不明确的(Undefined)、含糊不清的(Unclear)和明确的(Defined)等五级,元数据再利用(Metadata Re-use)政策则分为未知的、未申明的、不明确的、非营利的(Non-Profit)、盈利的(Commercial)和其它(Other)等六级,全文数据再利用(Full Text Data Re-use)政策则有七个等级,内容保存(Preservation)政策有五级,通过对每个等级所占总量比例的比较可知,所有政策项目中等级为“不明确的”比例均超过60%,明确了利用政策的机构库比例均低于20%,说明政策机制并没有引起所有入选机构库的足够重视[2]。
DSpace@MIT是麻省理工大学图书馆(MIT Libraries)向教师和研究者提供的一项知识存储服务,以支持社区稳定,长期保存数字化研究和教学输出成果,最大限度地向世界范围内的用户开放信息资源。内容包括会议论文(Conference Papers)、图像(Images)、同行评审的学术文章(Peer-Reviewed Scholarly Articles)、预印本 (Preprints)、技术报告(Technical Reports)、毕业论文(Theses)、工作底稿(Working Papers)、研究数据集(Research Datasets)等等,DSpace@MIT经由社区(Community)专门管理并指派协调员,已被公认为跻身世界一流的学术机构库,共收录了60 000份高质量的作品,并接受平均每月100万次的下载申请。为了更广泛地传播科学研究成果,2009年3月18日MIT教职员全票通过开放获取政策(MIT Faculty Open Access Policy),教职员在保持承诺的基础上采取以下政策:(1)在法律条款方面,MIT可以非独占的不可撤销的许可使用各成员的学术文章,并依法行使著作权以达到公开传播或开放分享的目的。(2)在内容传播方面,任何媒介不得以盈利为目的发布或出售内容并授权他人作出同样的行为。(3)该政策的例外条款有三项,一是采用政策之前完成的学术文章可以不受约束;二是成员已签订不相容的许可和转让协议,可以事先约定制度的规则,确定作品的存储和利用方式,豁免政策要由作者提出书面申请并经过首席副校长或教务长的批准。为了协助MIT发布、利用和管理学术文章,各成员要将最终定稿的电子版(如PDF格式)提交教务办公室,由教务办统一送存开放存取机构库。在学部委员会与图书馆系统协商一致后,将负责解释这项政策,解决学术文章的诠释和应用等纠纷,并送达作者本人。在政策立即生效的五年后由学部政策委员会进行审查和发布报告,并对图书馆系统的服务和机制进行监督以贯彻IR政策的有效执行[3]。
UIR(Ulster Institutional Repository)是阿尔斯特大学研究人员创建的旨在展示所有学科和科目学术产出的数字化机构知识库,首要目的是扩大学术影响,共享知识和提供开放存取并将信息反馈给研究人员、大学以及其他利益相关者。UIR制定了包括内容(Content)和提交(Submission)等两大版块的开放存取政策,内容政策涵盖四个方面:(1)UIR人员负责制定易于接受的有效元数据;(2)鼓励全文典藏或全文链接;(3)尽可能包含英文摘要;(4)支持文本格式转换或软件开源以确保持续的可读性和可用性。
提交政策则是一个相对复杂的制度体系。(1)创作者 /存储者 /出版商 /资助者(Creators/Depositors/Publisher/Funder)。鼓励经过UIR认可的创作者及时地提交自己的项目,确保遵守与出版商和资助者签订的包括自存储(Self-Archiving)在内的各项既定协议。(2)版本/质量控制(Versioning and Quality Control),最终版本应包含足够的有效元数据,创造者应承担项目内容的有效性和真实性责任,并在开放存取之前需要经过严格的审查和批准。(3)版权/许可(Copyright and Licence)。项目副本可在未经事先约定或收费的情况下允许复制、展示、执行或授予第三方机构进行个人研究、学习、教育以及其它非盈利性目的活动。(4)保留/保存(Retention and Preservation)。UIR将无限期保留在职人员的项目,即使提交者撤回项目,该项目也仅从公众视野中消除而不会从机构库中彻底删除,UIR将根据当前的最佳实践定期备份并尽最大努力以避免灾难性事件的发生。(5)通知 /下架(Notice and Takedown)。UIR督导组(UIR Steering Group)将根据有效的投诉审查下架或撤回项目的请求,包括违反出版政策或法规、国家安全、大学守则以及病毒或技术问题等,同时UIR还公布了UIR督导委员会(UIR Steering Committee)的组织结构、成员、职权范围和处理流程等管理制度[4]。
SHERPA Plus项目是支持英国高等教育机构知识库发展的一大重要举措,并通过收集、分析人口使用战略来提供宣传支援。在SHERPA提供的《E-prints存储许可报告》(Report on a Deposit Licence for E-prints)中,E-prints被定义为研究论文的电子印刷版本以提高研究成果的开放共享,为了建立创作者和机构库之间的权利义务关系,SHERPA对存储许可协议设定了较为完备的政策规定,包括以下几点。(1)寄存人(Depositor)的权利和声明(Rights and Declaration)。E-prints的寄存人无需放弃自己的版权以支持作者自愿提交作品,并以此作为一项重要的激励措施来促进档案开放。利益相关者的声明主要有三个作用:一是为了保障各方的权利和明确法律责任;二是授予机构库复制、改造和转换电子印刷数据的权限;三是提示机构库未来应主动联系的服务对象。(2)机构库的权利与责任(Repository Rights&Responsibilities)。为了保护机构库的法律行为并建立长期的保存要求和持续存取,需要对存储许可明确以下内容:一是存储许可应明确机构库在电子印刷过程中的错误、遗漏和侵权等法律责任(Legal Responsibility),同时对寄存人提供产品的信息准确度和时效性作出制度规范;二是为确保持续性的开放存取,存储许可应对机构库改变电子印刷的数据格式或采取其它必要措施作出授权。(3)退出战略(Exit Strategy)。机构库可对寄存的材料进行适时保存并允许寄存人在合理诉求的情况下撤回材料,但须保证关联元数据记录的可用性。其中涉及两个重要处理方式:一是由于机构库早期草案或合同文本的制度约束而产生的保留期限(Retention Period)问题;二是具体情况具体对待(Specific Circumstances),例如材料有伪造、中伤和破坏法律规定的情形,应保留关联元数据以应对法律纠纷等不时之需。对于机构库而言,许可协议提供了“什么能做,什么不能做”的正式框架;对于作者而言,其提供了作品权利属于创作者的再保证(Reassurance),同时提高了作者对机构库所提供服务类型的认知度[5]。
由850余所大学组成的欧洲大学协会(European University Association,EUA)一直重视大学社区的开放存取问题,2007年初即成立开放存取工作组(Working Group on Open Access)并集中召开三次研讨会,就开放存取出版模式、版权法律归属、国家数字化机构库及资助机构权益等关键性问题展开政策辩论,大学部门被正式确认为开放存取政策中的主要利益相关者,经过一年多的过渡期,EUA在2008年3月26日专门召开会议讨论成立EUA工作组并向所有成员发布政策建议以促进机构知识库的发展及其网络化建设。政策立场的主要内容包括以下几点:(1)大学的核心责任是守护研究知识这样一种公共产品(Public Good);(2)受到公益资助的研究成果应及时公开;(3)学术出版的前提条件是要经过同行评审,以保证质量并作为数字出版模式的关键要素,但不包括科学研究数据和技术材料等;(4)大学应制定政策和战略来保证学术文章或其他产出以最大化其可用性和可获取性;(5)应在遵守OAIPMH协议①OAIPMH协议(The Open Archives Initiative Protocol for Metadata Harvesting)提供了一个基于元数据收集的独立应用互操作框架,对机构库(Repository)的来源、项目和记录作出了详细的解释说明,并对协议(Protocol)的特性(Features)、请求和响应(Requests and Responses)等内容作出了制度安排。的基础上依据当前的最佳实践来建立和管理机构知识库;(6)大学机构政策应要求研究者必要的自存储且授权公开的时间应以开放存取规定为准而非存储日期;(7)大学政策应将开放存取的版权纳入知识产权(IPR)管理范畴,以确保数字化研究内容更广泛的共享和再利用,并清晰界定所有权和管理权以确保机构有权进行研究成果的教育教学活动;(8)大学机构政策应开发各类资助和保障措施,以支持类如“作者支付模式”(Author Pays Model)等新兴的开放存取模式;(9)所有EUA成员应贯彻执行上级资助部门发布的约束条款,以保证自存储的运行效果和OA授权的执行力度。倡导不同区域和行业间的部门协作以促进科学信息的存取、传播和保存。同时,建议书附录了EUA开放存取团队的成员名单[6]。
通过对 Dspace、UIR、SHERPA和 EUA等典型IR有关建设和运行中的政策规定和制度安排分析可知,IR的运行实质上是一个涉及创作者、机构库、出版者和利用者等诸多信息主体的、复杂的博弈过程,政策制定的背后掩藏着利益争夺和风险分摊,也暗含着资源分配和信息战略等多项经济机制,从信息资源的流动和利用方向出发,将IR运行过程中涉及的所有主体纳入一个整体性的政策框架内,如图1所示。
图1 IR运行中的政策框架
从图1可以看出,创作者是整个作品开放利用体系的第一主体,若在提交作品前已经和出版者达成共识或签订某项版权协议,则可直接将作品送交出版,同时在不违背合约并尊重出版者利益的前提下,可以将作品以预印本的形式提交机构库保存,待正式出版后可以向用户开放,机构库在专门的管理团队的运行之下,依据当前的最佳实践调整政策制度以适应不断变化的社会环境,最大限度地保护作品不受非法侵害。创作者与作品的利用者一般不产生直接的利益关系,利用者只对IR制定的相关许可使用协议负责,且出版者不能对IR中的作品以任何盈利性商业行为作出决策,即IR排除了非公益性使用目的。在作品提交IR一定期限后,由不同知识结构组成的监督小组将对IR运行的现状进行检查和评估,以确保开放存取政策的有效施行,IR的管理者也定期向督导组反馈信息,并将形成的汇报制度送达作品的利益相关者,共同维护这样一个为了良好的学术交流和知识共享愿景。
从国外典型机构知识库建设的政策规定可以总结出以下几个要点。(1)IR的建立和运行需要一系列具有针对性和现实性的政策制度来保障。通过对相关网站检索可知,全部的IR网站均设置了相关的FAQ(常见问题)窗口,较为详细地介绍了使用的基本要求和原则,并对用户注册和隐私作出明确规定。(2)IR收录作品的版权仍归创作者所有,这一点是大多数协议内容的真实体现,但同时也做出了对IR本身有利的制度约束。如寄存人不得随意取下已经正式提交的作品,如果出于某些特殊原因,需要提交正式的书面申请并在获得批准后提供相应的关联元数据以供备案查询,寄存人应对自己作品的真实性和时效性负责,不得以侵犯他人权利或违反法律规定的行为博取名声,这实质上对创作者提出了更高的要求。首先是更加严格的产品质量控制,同行评审制度在一定程度上提高了入库的门槛,其次是作品格式标准化,大部分的IR都要求寄存人提供一份PDF格式的文本并附有使用说明,同时,作品在提交IR之后,在不与现有协议冲突的情况下,该作品仍可以被用于教育教学和科研协作等公益性活动。(3)协作和监督是必要的治理措施。为了监督和管理IR的有效运行,各大机构库都成立了不同形式的专家团或协作小组,来帮助IR解决实际运行中出现的各类现实难题。由于国家信息政策和出版传播制度的更变,建立一个政策应对小组是IR通常采取的做法,这里的成员来自于各个不同的联盟机构,学科背景多元化和知识结构多样化的团队是IR政策执行的监督主体。为了科学研究成果价值利用的最大化,IR在政策规章方面作出了许多努力,基本上已经构筑了一个基于“创作者+出版者+机构库”三方协作的制度框架,为促进知识共享和学术传播提供了良好的运行环境。
[1]Raym Crow.The Case for Institutional Repositories:A SPARC Position Paper[EB/OL].[2013-09-17].http://scholarship.utm.edu/20/1/SPARC_102.pdf.
[2]Directory of Open Access Repositories.Search or Browse for Repositories[EB/OL].[2013-09-13].http://www.opendoar.org/find.php?format=charts.
[3]Scholarly Publishing@MIT Libraries.MIT Faculty Open Access Policy[EB/OL].[2013-09-13].http://libraries.mit.edu/scholarly/mit-open-access/open-access-at-mit/mit-open-access-policy/.
[4]University of Ulster.Ulster Institutional Repository(UIR)Open Access Institutional Repository Policy[EB/OL].[2013-09-16].http://eprints.ulster.ac.uk/policy.htm l.
[5]Gareth Knight,Arts&Humanities Data Service.SHE RPA Project Document-Report on a Deposit Licence for E-prints[EB/OL].[2013-09-16].http://www.sherpa.ac.uk/documents/D4-2_Report_on_a_deposit_licence_for_E-prints.pdf.
[6]EUA Declarations&Policy Positions.Recommen-da tions from the EUA Working Group on Open Access adopted by the EUA Council on 26 March 2008[EB/OL].[2013-09-16].http://www.eua.be/eua-workand-policy-area/eua-policy-position-and-declarations.aspx.