●乔 欢,姜 颖(北京师范大学 管理学院,北京 100875)
InstitutionalRepository(IR),中文译作:机构知识库、机构仓储库、机构存储库等多种名称,自2000初兴起,迄今为止发展已有10余年了。笔者根据ROAR(RegistryofOpenAccessRepositories,开放存取机构知识库注册机构)上的统计得知,目前全球的IR总数已达1600多个。[1]机构知识库作为全面反映机构综合科研和教学成果,其强大的收集和共享功能已越来越多地被国内外众多科研院所所关注,尤其以发达国家美国、英国为代表,基本每个大学都拥有了自己的机构知识库。我国自2005年初开始也陆续有大学加入到机构知识库建设的大潮之中,目前在ROAR注册的机构知识库数量已经达到了12家。在机构知识库数量急速增长的同时,如何获取更多的资源到库中,怎样保证资源的质量等问题渐渐浮出了水面,成为制约机构知识库建设的主要问题。本文通过对国内外机构知识库的跟踪调研,从国内、国外两方面对近年来国内外有关机构知识库内容建设的文章进行综述,总结比较国内、国外机构知识库内容建设的研究成果。
笔者通过对国外众多机构知识库网站进行在线访问和收集近10年的国外机构知识库内容建设方面的研究,对其主要发展和研究现状概括为以下4个方面。
通过网络跟踪和调研,笔者发现,国外一些建设较早的机构知识库收录资料数量大,并且全文可获取的比率也很高,比如eScholarship Repository的全文获取率近100%,[2]DSpace at MIT全文可获取的比率约75%。[3]但是,学者WareMB从世界各地挑选了45个比较有代表性的机构知识库网站进行研究,发现每个机构知识库的平均资源数目仅仅为1256个,并且大部分是论文和灰色文献(技术报告和工作底稿)。[4]MarkT和ShearerK通过调研加拿大图书馆联盟的7家机构知识库发现,其中有5家IR的数据量少于200项。[5]学者DalyR与Organ M通过对美国研究型图书馆联盟认可的数家机构知识库收集的5140项资源的学科领域进行分析,发现有约67%的资源内容属于自然科学,约27%的资源内容属于社会科学,而用户利用最多的人文科学资源内容只有约5%。[6]可见,国外机构知识库虽然发展较快,起步较早,但是各机构知识库存储的资源数量存在很大的学科偏差,人文科学方面的资源严重短缺。
Kierkegaard S指出机构知识库建设发展中亟需解决的一个问题是其内容收集。相关调查结果显示,40%的机构认为内容收集是比较困难的,23%的机构认为非常困难,14%的机构认为不确定,其余的认为相对容易。[7]换句话说,几乎2/3被调查机构都面临着机构知识库内容收集方面的问题。Kierkegaard S认为这主要是由于研究者对机构知识库认识不够,不同学科领域学术交流传统不同以及机构知识库本身存在问题等诸多原因引致的。[7]NacyFF和SusanG根据Rochester大学DSpace机构知识库建设经验,分析机构成员需求及其对机构知识库的理解,提出IR内容收集的两大策略:一是加强与机构成员的沟通交流,二是简化成员提交内容的程序,并及时向其展示提交的研究成果。[8]MoragM指出,Glasgow大学从学者或院系网站上采集内容不失为机构知识库建立初始阶段内容收集的一个有效方法。[9]
机构知识库内容的收集是机构知识库建设的核心部分,对机构知识库中应存储哪些内容,不同国家对于机构知识库内容收集范围界定不一,学者和机构知识库的管理人员对此也持有个人不同的理解。笔者通过网络调研发现,英国格拉斯哥大学(Glasgow)的泰达罗斯(Daedalus)计划只接受格拉斯哥大学研究人员的印前印后论文、技术报告、会议论文、计划报告、灰色文献和学位论文;e-PrintsSoton则收录期刊论文、会议论文、图书章节和多媒体资料,包括未出版的原稿和已出版的文章。相比之下,美国的机构知识库中存储的资料类型较为全面,收录有大量的非文本内容。[10]例如DSpaceatMIT收录的数字化资料包括期刊论文、技术报告、进行中的报告、会议论文、学位论文、资料集、图片影像、音讯、教学素材等,还包括跨主题多媒体等多种档案格式。[3]
英国南安普顿大学认知科学教授Steven H概括了机构知识库的5个收藏目标:(1)存贮本机构的研究成果,如文章的预印本、后印本、学年论文、学位论文等;(2)实现对数字资源的管理;(3) 实现对数字资源的长期保存;(4) 收藏教学资源,如教案、笔记、手稿、图片等;(5)图书期刊的电子版。致力于促进学术交流和改变现有学术出版体系结构的SPARC组织对机构知识库所收藏的内容范围限定为:预印本、经过同行评价的文章、专著、教学资料、辅助研究资料、会议论文、电子论文、学位论文和灰色文献。[9]除了强调存储传统格式的内容外,也有学者提出应对非传统格式的内容给予更高的关注。[11]Robinson M提出除了正式的文件外,更应强调“非传统”格式内容的存储,如乐谱、报纸文章、演讲内容以及反映研究人员所做工作的相关材料等。[12]另外,学者Arachchige JJG提出,有关信息科学类的预印本、会议文献海报、工具书、图书章节、技术报告、工作报告、论文和报纸杂志文章都可以存放在E-LIS(E-prints in Library and Information Science)中。不仅如此,电子资料库更应包括更广泛的资源范围,如研究成果、杂志文章、工作文件、技术报告、演讲、讲座等。[13]
学者Mark T和Shearer K对康奈尔大学的机构知识库作了调查,指出康奈尔大学的机构知识库几乎未被本校师生所了解和使用,其所收集的论文数量非常少,有些院系的机构知识库甚至没有任何实质性的内容。多数教师还是习惯于使用机构知识库的代替品,比如个人网页和自认为比本校机构知识库更具有学术价值和更高认知度的学科存储库。通过调研,他们还进一步概括出教师们不愿意使用机构知识库的部分原因,如机构知识库的信息传播模式与其他信息传播模式雷同;机构知识库在版权保护政策上过于模糊,从而使版权作品面临被剽窃的风险;提交给机构知识库的论文往往未经同行评议,因此学术价值难以有效体现等。[5]
以Steven H为代表的研究团队对物理学、生物学、心理学、社会学、健康学、政治学、经济学、教育学、法律、商业和管理学学科的分析,发现各学科自存储文章所占的比率分布在5%—36%之间,引用优势的比率分布在13.6%—29.8%之间。[9]Shearer K指出:资源提供者的自存储行为和机构知识库的利用率是决定机构知识库成功的两个重要因素。而前者,是制约机构知识库发展的关键因素。相反,有过学科存储经历的科研人员会更积极地参与到机构知识库的建设中去,并提出了学科文化理论(DisciplinaryCulture Theory)。[11]该理论认为,如果科研人员通过学科存储经历熟悉自存储过程,那么与那些没有学科存储经历的科研人员相比,他们对将自己的科研成果提交到机构知识库中的热情更高。Xia Jingfeng研究了物理学科研人员在学科存储库和机构存储库的存储行为之后发现,具有学科存储经历的科研人员并没有存储更多的科研成果到机构知识库中。[14]SwanA还通过调查指出,研究人员与教师喜欢开放获取这种方式,但在没有机构或者基金强制他们存储的情况下,他们是不愿意自存储的。[15]
笔者通过调研发现,目前在ROARMAP注册的知识库中,只有176个机构知识库拥有强制政策,其中拥有机构强制政策的77个、部门强制政策的31个、基金强制政策的42个、学位论文强制政策的39个。学者A.Sale对比3个澳大利亚的机构知识库的存储率后发现,这3个IR分属以下3种情况:(1) 只有一个机构知识库;(2)有一个机构知识库,并由图书馆员鼓励和帮助存储;(3)有一个机构知识库,有自存档强制政策,并辅之以图书馆员的帮助。结果表明,在采纳了强制存档政策两年内,他们的存档率分别为15%、30%和接近100%。[16]仅从以上数据就可以观察到强制政策对于自存储行为的显著影响。当前已有RCUK,WelcomeTrust等35% 的基金组织支持开放获取,NIH、哈佛大学等机构要求员工向大学提供他们研究的副本和发布其电子版的非专有授权。可见,制定强制内容存缴政策,对于机构知识库的内容建设至关重要,是机构知识库内容发展的长期保证机制。当然,内容存缴的强制政策不是图书馆自己就能制定并被员工认可的,这就需要机构知识库建设团队积极向机构管理层宣传机构知识库的目标、优点,促使他们制定相应的强制提交政策。
从以上情况可以看出,国外对于机构知识库内容建设方面的研究正在不断深入和深化,显然已经认识到了机构知识库内容建设方面的危机,同时国外研究者的每一个结论都是针对国外机构知识库实例实施过程中切实存在的问题细致分析之后得出的,具有很高的实践意义和可参考价值。
通过对我国机构知识库网站调研,笔者认为,我国的机构知识库相对来说还处于起步阶段。到目前为止,香港科技大学、逢甲大学、台湾大学的机构知识库中收录的资料数量一般在100000笔以上,(台湾大学机构典藏库已经达到了176935笔),[17]发展速度还是较快的;而大陆地区建置的较成规模的机构库只有厦门大学学术典藏库,中国国家图书馆建设的图书情报学开放文库,北京科技大学物理文库、奇迹文库,浙江大学机构知识库等,目前收录资料只有5000笔左右。发展较好的台湾大学机构典藏库虽然收录的资料数量已经达到了17多万笔,但是可以获取的全文数量仅为55689笔,全文获取率仅为31.4%。[17]大陆地区机构知识库的全文获取率就更加低了。而且,其机构知识库大多以典藏传统学术出版物和灰色文献为主,鲜有音视频资料。以目前运行较好的机构知识库厦门大学学术典藏库为例,厦门大学学术典藏库收录内容共5665条(数据截至2010年11月),其中,已发表论文收录了4960条,占总收录内容的87.6%;其他会议论文、专利、工作文稿、演示文稿仅收录了705条,只占收录内容的12.4%。[18]
目前国内研究机构知识库内容建设的文章数量不多,通过调研CNKI中10年来有关机构知识库的研究文献,有关机构知识库内容建设的文章仅仅有9篇,研究问题也集中在下面3个方面:内容建设现状和发展趋势(1篇)、资源的收集策略(3篇)、机构知识库自存储行为研究(5篇)。笔者通过结合以上9篇文献中的研究成果与国内机构知识库建设方面文献中关于内容建设方面的内容,对近年来有关机构知识库的内容建设进行梳理分析,认为近几年国内机构知识库的研究主要集中在以下5个方面。
机构知识库的内容建设研究现状研究对于我们研究内容建设的影响因素等具有直接的现实作用。张东华等分别从收录范围、内容获取、激励机制和质量控制4个方面对于机构知识库内容建设进行了系统介绍。[19]薛青林则指出机构知识库内容建设应从以下几个方面努力:一是持续不断宣传,培养作者自存档意识;二是将加强宣传和专题教育,帮助科研人员添加学术成果到库中;三是制定科学合理公平的内容提交和使用政策。[20]
在所有关于内容建设的研究中,资源的收集政策研究相比之下还是比较多的。中国科学院的马建霞等在分析了机构知识库的现状和目标定位之后,指出解决当前机构知识库内容建设危机的首要措施是制定强制的存缴政策,建立内容发展的长期机制;[21]浙江树人大学图书馆员余丰民分析了机构知识库资源内容不多的原因并针对原因分析给出了一些解决措施。余丰民认为,开放存取意识淡薄、教职员工的工作压力大和机构知识库操作不便利3个因素是制约机构知识库内容数量的原因,可以采取宣传先行、组织协调、协助递交与激励机制、构建强制递交机制和逐步递交等方式加以解决;[22]赖辉荣在《破解机构机构知识库建设中资源收集难题之策略》一文中指出资源收集困难已经成为制约机构知识库建设的一大瓶颈,要破解这一瓶颈,应采取多元化策略。具体包括:加强宣传,提高对机构知识库的认知度和认可度;提供利用率推送服务;简化提交内容的程序,并建立协助提交机制;制定与学术评价机制相结合的激励政策、制定强制性自存储政策;提供知识产权和隐私权保护;建立质量控制机制,提高对机构知识库的价值认识和信任度等7个方面。[23]从以上研究我们可以看出,国内学者对于解决资源收集难的问题提出的解决策略大同小异,大都是从战略角度来提策略,经过实地访谈和调研之后得出的策略很少。提出策略的可执行程度和有效性都不高。
孟祥业提出机构知识库的资源内容收集是影响机构知识库内容建设速度的关键因素所在,资源内容收集的关键在目前情况下主要取决于作者的自存储行为。作者的自存储质量对于资料的数量、完整性,资料的质量保障是非常重要的。[24]李晓辉根据国外的经验,总结出3种资源提交方式:第一种为分布式,这种模式完全由资源提供者上传并管理自己的研究成果;第二种方式为半分布式,由机构内的各个单位指定专门人员分别负责协助单位的资源提供者上传并管理研究成果;第三种为集中式,由机构图书馆或机构内指定的单位帮助上传并管理研究成果。[25]郭清蓉通过介绍机构知识库自存储及其评价存在的缺陷,总结了机构知识库自存储评价因素,如存储者信息、存储数量、全文可获得性等。通过评价因素的分析,提出了建立机构知识库的自存储行为评价体系。[26]中国科学院国家科学图书馆的研究生金瑛对机构知识库的存储行为影响因素研究进行了评述,其通过对国内外机构知识库自存储行为的影响因素内外因进行归纳,指出有效的机构知识库存储行为模式是未来研究的重点,找出更多的影响因素将成为今后一个时期内该领域的研究内容。李晓辉博士也针对机构知识库的自存储政策进行了评述,指出了制定自存储政策中应该注意的存储位置唯一、存储与出版、版权等相关问题。[27]郭清蓉对推动自存储的政策提出4点建议:建立宣传与教育政策机制;建立管理政策机制;建立强制政策机制;建立技术政策机制。从以上研究中可以看出,作为机构知识库最主要存储形式的自存储行为,决定着这个机构知识库的内容数量与质量,但是目前国内的自存储发展形势非常不乐观,是什么影响了作者的自存储行为,如何改善都是我们进一步研究的关键。
陈传夫等撰写的《机构典藏资源的分布及获取策略研究》一文对如何整合国内外机构知识库资源进行了研究。文章介绍了机构典藏库的数量、学科、内容类型、语种、软件等分布情况,并给出了机构知识库资源获取的3种方法(直接获取法、间接获取法、集成目录获取法)和国内外主要机构知识库网站网址,为图书馆方便地获取相关机构知识库资源提供了可行的方法。[28]
目前,机构知识库内容质量控制研究、理论研究较多,实践研究较少,机构知识库资源质量控制是机构知识库构建成功的重要因素,这也是国内需要认真研究的课题。郎庆华在分析了影响机构知识库自存储资源质量的因素后,认为资源质量应从以下5个方面加以控制,即政策控制、技术控制、管理控制、服务控制和方法控制。[29]
通过以上研究可以发现当前机构知识库内容建设是国内外机构知识库研究界重点专注的问题。我国对于机构知识库内容建设的研究正处于起步阶段,研究方向也都是集中在内容建设的某几个方面,系统研究内容建设各个方面问题的文献资料非常少,因此,加强国内机构知识库内容建设系统研究势在必行。
[1] ROAR.Registry of Open Access Repositories[EB /OL].[2010互11互18].http://roar.eprints.org/.
[2] e Scholarship Repository[EB/OL].[2010互11互15].http://repositories.cdlib.org/esc-holarship/.
[3] DSpace at MIT[EB/OL].[2010互11互15].http://dspace.mit.edu/.
[4] Ware MB.Universities Own Electronic Repository yet to Impacton Open Access,Naturecom’s Web Focus:Access to the Literature[EB/OL].[2006互12互15].http://www.nature.com/nature/focus/accessdebate/4.html.
[5] Mark T,Shearer K.Institutional Repositories:a Review of Content Recruitment Strategies[EB/OL].[2010互11互06].http://www.ifla.org/IV/ifla72/papers/155-Mark_Shearer-en.pdf.
[6] Daly R,Organ M.Research online:digital commons as a publishing plat for mat the University of Wollongong,Australia[J].Serials Review,2009 (3):149互153.
[7] Kierkegaard S.Open access to public documents more cecrecy,less transparency [J].Computer Law&SecurityReport,2009(1):2互3.
[8] Nacy F F,Susan G.Understanding faculty to improve content recruitment for institutional repositories[EB/OL].[2011互11互06].http://www.dlib.org/dlib/january05/foster/01foster.html.
[9] 朱翃.国外机构知识库研究的现状、热点及其建设概况 [J].情报探索,2009(12):25互27.
[10] e-Prints Soton[EB/OL].[2010互11互06].http://eprints.soton.ac.uk/.
[11] Shearer K.Institutional Repositories:towards the identification of critical success factors[EB/OL].[2009互12互23].http://dspace.ucalgary.ca/bitstream/1880/43357/6/CAIS-IR.pdf.
[12] Robinson M.Promoting the visibility of educational researchthrou ghanin stitutionalre pository[J].Serials Review,2009(3):133互137.
[13] Arachchige J J G.Promotion of Open Access Through Self-Archivingin Sri Lanka[EB/OL].[2010互03互14].http://eprints.rclis.org/16441/.
[14] XiaJingfeng,Opperman DB.Current trends in institutionalre positories forinstitutions off eringmaster's and baccalaurea tedegrees[J].Serials Review,2010(1):10互18.
[15] Swan A,Brown S.Open Access Self-Archiving:an Author Study[EB/OL].[2009互12互23].http://eprints.ecs.soton.ac.uk/10999/1/jisc2.pdf.
[16] 孙坦.2002—2009年国外机构知识库评价研究述评 [J].图书馆建设,2010(4):6互9.
[17] 台湾大学机构典藏库 [EB/OL].[2010互11互18].http://ntur.lib.ntu.edu.tw/.
[18] 厦门大学学术典藏库 [EB/OL].[2010互11互18].http://dspace.xmu.edu.cn/dspace/.
[19] 张东华.高校机构知识库的内容构建与管理模式研究 [J].情报科学,2009(6):836互838.
[20] 薛青林.国内机构知识库建设的问题和对策[J].图书馆建设,2009(5):17互21.
[21] 马建霞.机构知识库内容建设与服务设计的趋势[J].理论与探索,2010:23互27.
[22] 余丰民.大学机构知识库资源建设对策研究[J].浙江树人大学学报,2010(5):93互95.
[23] 赖辉荣.破解机构知识库建设中资源收集难题之策略[J].国家图书馆学刊,2009(3):59互61.
[24] 孟祥业.我国机构知识库建设研究综述[J].情报探索,2010(7):27互28.
[25] 李晓辉.基于机构知识库的自存储政策述评[J].情报研究,2010(5):36互39.
[26] 郭清蓉.机构知识库自存储评价体系的构建[J].情报杂志,2009(7):74互77.
[27] 金瑛.机构知识库存储行为影响因素研究述评[J].图书馆建设,2010(4):14互17.
[28] 陈传夫,王云娣.机构典藏资源的分布及获取策略研究[J].中国图书馆学报,2008(1):47互50.
[29] 郎庆华.机构知识库自存储资源的获取策略研究[J].情报杂志,2009(7):166互169.