张晓丹+张志平
〔摘要〕开放获取运动在世界各个国家正轰轰烈烈地开展着,作为开放获取重要部分的机构知识库,承担着保存科研机构知识资产和知识开放共享的重要职责。本文对于国外及国内机构知识库的构建方式进行了调查研究,并结合研究结果及国内科研机构的实际情况,构建了机构知识库框架模型,并以中国科学技术信息研究所机构知识库为实例验证了该模型的有效性,并为科技资源共享与传播及国内机构知识库的发展起到推进的作用。
〔关键词〕机构知识库构建;开放获取;资源共享与传播
机构知识库(Institutional Repository,简称IR)是开放获取的重要组成部分,是新型学术信息交流体系和教育科研知识基础设施的有机组成部分,承担着保存机构知识资产和支持知识开放共享的重要职责。
据统计,截止到2014年1月1日,在国际著名开放存取名录OpenDOAR(Directory of Open Access Repositories)注册的机构知识库已达2 684个。除台湾地区外,中国只有36个机构进行了注册,包括香港大学、香港理工大学、北京大学、厦门大学和中科院系统的研究院等。
机构知识库的建设不仅可改善学术交流环境、促进人类知识广泛传播外,对科研人员的成果积累、提高学术水平都有帮助。因此,结合机构知识库的研究成果及国内科研机构的实际情况,构建科研机构的机构知识库框架模型,是本文主要解决的问题,可为科技资源共享与传播及国内机构知识库的发展起到推进的作用[1-2]。
1研究现状与背景
欧美等国家的机构知识库发展已经到了成熟阶段,很多国家及其机构都有开放获取期刊和各种级别的机构知识库供科研人员免费获取和利用。据统计,已建立了机构知识库的国家有澳大利亚、加拿大、美国、比利时、法国、德国、挪威、芬兰等国家。从OpenDOAR可看出,国内仅有香港大学、厦门大学、台湾大学、清华大学、中国科学院国家科学图书馆、中国科学技术信息研究所等建立了机构知识库。虽然机构知识库在中国国内的科研机构中已经得到了广泛的认可和推动,但整体发展还处于起步阶段[3-4]。
2012年10月,在中国科学院国家科学图书馆和北京大学图书馆及中国科学技术信息研究所等14家国内著名科研机构共同组建了中国机构知识库推进工作组(China IR Implementation Group),其宗旨是推动我国开放获取的发展,使我国开放获取的发展进入到了新的阶段。
2014年7月第34卷第7期现?代?情?报Journal of Modern InformationJuly,2014Vol34No72014年7月第34卷第7期科研机构的机构知识库构建研究July,2014Vol34No72科研机构的机构知识库构建方案
国内科研机构是科学研究及科研产出的主要源泉,因此,其机构知识库的建设可实现科研机构开展的知识产出的获取、组织、保存、传播及评价等。推动学术交流、科技进步及机构知识库在我国的发展进程[5-6]。
从图1可以看出,机构知识库的基本框架可以分为3层:数据库层、逻辑事物层及应用层。其中,数据库层主要包括需要公开的信息资源的数据库,有:科研项目库、科研成果库、学科建设库、科研机构出版刊物库及其专家等。逻辑事物层是指对数据库层进行信息抽取,获得应用层所需要的数据与信息,便于发布。如所内专家介绍信息、学科介绍信息、项目介绍信息、科研成果检索和浏览信息及所内出版刊物展示信息等。
应用层为对以上信息进行发布,主要功能有统计、可视化、检索、浏览等功能。
21机构知识库应用实例
中国科学技术研究所(以下简称中信所)作为中国机构知识库推进组的重要成员,自2005年体制改革以来,科研经费投入不断扩大,科研管理和激励机制日益建全,所内科研成果数量激增,科研产出类型多样化。但由于缺少对外知识共享平台,科研成果呈现分散乃至隐性状态,科研产出的长期可用性和有效性不明确,不利于机构内外的知识获取和共享,影响了其在业内学术影响力的扩张和科研知名度的提升。该所机构知识库构建的目标和意义在于:通过实现所内分散的科研产出的集中揭示、组织和统一管理,促进科研产出的共享和利用,促进所内、外的学术和科研交流;通过科研数字资产的长期保存,提高科研资产的管理和应用水平,确保资源的长期、持续可用;通过科研产出的开放获取和开放服务,使中信所的机构知识库被Google等多个学术搜索进行索引,扩大和提升机构的学术影响力和科研知名度等。
211资源构成
机构知识库是科研机构科研产出和科研成果的集中仓储与发布系统,主要开放的内容有:
(1)正式出版的科研产出和科研机构内部科研管理所认可的各种成果形式,包括期刊论文、会议论文、图书、图书章节、会议论文、标准、专利、 软件著作、研究报告、学位论文等;
(2)非正式出版但具有学术价值的科研产出,如专家报告、授课资料等;
(3)科研机构内部科研人员承担的各种项目:国家级项目、所内项目(如学科建设项目、重点任务项目、预研项目等)、横向项目及其他项目,主要公开信息包括:项目基本信息、科研产出、研究报告及科技奖励等;
(4)科研机构内部的专家信息:包括专家个人基本信息、研究领域、专家成果、照片;
(5)学科介绍:科研机构内部学科基本信息、学科带头人及成员;
(6)已获奖项:科研机构或机构内部人员获得的奖项展示,并附证书等获奖材料;
(7)其他:如科研机构内部所创办的期刊等可以对外部科研人员进行共享的信息等。
对以上科研资源集合进行整体揭示,包括自行构建具有成果性质的文献资源库、数值数据库、网站、服务系统等。
并对其进行广泛采集、统一揭示、组织和集中管理,以多种形式提供机构内外的共享和利用,促进科研机构内外的科研共享和学术交流;对公开发表的科研产出以一定的形式提供对外(如上层整合平台、知名搜索引擎、ROAR等)的开放获取,以大力促进科研机构内部科研产出的引用量和使用量增长,提高知名度和影响力;对于以机构资源集合和整体形象进行科研推广和宣传,如机构专家库、机构成果库、机构项目库等的抽取和形成,提供知识基础和支持。endprint
212开发工具
机构知识库开发采用的是DSpace工具的汉化版本CSpace。该工具是在中国科学院国家科学图书馆机构知识库CASIR平台基础上推出的开源免费的机构知识库开发工具。CSpace以发展机构知识能力和知识管理能力为目标,快速实现对本机构知识资产的收集、长期保存、合理传播利用,积极建设对知识内容进行捕获、转化、传播、利用和审计的能力,逐步建设包括知识内容分析、关系分析和能力审计在内的知识服务能力,开展综合知识管理[7]。
使用该开发工具,可使机构知识库推进组成员单位所建设的机构知识库资源在底层实现共享。其体系如图2所示。
CSpace的基本功能:
(1)存缴:提供对期刊论文、会议论文、专著、学位论文、研究报告、演示报告、多媒体资料等主要知识内容类型的存缴支持,同时,CSpace也提供了以批量方式装载外部数据(如来自SCI/WOS/ENDNOTE等系统软件的产出物数据)的方法和接口。
(2)组织与检索:提供了按照组织单元(研究/试验室、研究方向或课题组、学院、学系、部门、科室等)、知识内容类型、学科主题分类、时间、题名、作者等多种组织方式。支持从题名、作者、时间、关键词等多种途径和条件的简单检索或组合检索,并支持全文检索。
(3)访问控制:提供基于IP地址、特殊用户组对不同层次内容的访问控制、对作品发布时限灵活选择。支持基于OAI的元数据开放收割接口和基于SRU的开发检索接口。
(4)长期保存:支持对存缴对象的技术、权属、源流信息等与长期保存有关的信息的记录,对已存缴作品进行撤出管理,定期备份保存内容,以及对存缴对象以METS格式进行封装和输出迁移等。
(5)统计:支持按照研究所、研究/实验室、职称、身份、作者或用户、时间段等多条件组合的基于知识库内容的统计;提供IR整体或单篇作品在预定义时间段内的浏览、下载利用情况的应用情况统计。
(6)其他功能:可根据需要提供基于电子邮件的最新内容订阅、RSS订阅、浏览和检索结果的保存及输出、关联检索、推荐等。
其运行环境和条件:
(1)硬件平台:推荐双Intel Xeon处理器,2~4GB 内存,500G以上外存。若需要做数据的离线备份和保存,可以考虑配置内置或外置磁带机(库)。
(2)软件平台:Linux/Unix/Windows2000+ Postgre SQL 82+Tomcat 55+J2SE 15。
213系统功能介绍
中信所机构知识库系统首页如图2所示。该系统中所有作品遵循知识共享协议(Creative Commons)[8]。
该机构知识库所包含的科技资源类型包括:本所职工发表的期刊论文、本所职工撰写的科技报告、本所职工发表的会议论文、本所学生学位论文、本所职工撰写的专著、本所职工申请的专利、本所职工撰写的研究报告、本所年报、本所职工申请的软件著作权、本所邀请的著名科研学者等的演示文稿、本所职工申请的科研项目及所内专家的信息等共以万计的资源总量(学术科研成果、科研项目、专家团队、学科介绍、所办OA刊物(数字图书馆论坛等6本)、年报等。集中、统一存取机构内部生成的各类科研成果和科研产出,)。其中,科技报告数量为497篇,主要是关于科研人员在从事项目过程中对该项目的核心技术及创新部分进行总结,为科研用户在今后从事其他项目过程中遇到类似问题提供参考。
该系统的主要功能包括:用户可对所有资源的元数据、全文进行检索和下载,并可按部门、资源类型、按作者等进行分类浏览。
同时,该机构知识库可实现与相同架构和开发工具的机构知识库进行跨IR的混检,可进一步实现机构知识库资源的共享。
3结论与展望
本论文的研究体系是建立在世界各个科研机构的机构知识库建设基础上进行调查和研究后进行的,构建了适合国内科研机构特色的机构知识库。并以中信所机构知识库为试验实例,介绍了中信所机构知识库的构建过程和技术难点,该系统可实现科研机构的资源的共享与传播,为推动机构知识库的建设和科研资源的免费利用贡献了力量。
下一步工作拟将该文成果推广到与中信所类似的科研机构的机构知识库建设过程中,共享更多有价值的科研成果,研究如何为科研用户提供更为友好、方便的检索体验,提高科研检索率,并将国内科研究机构的机构知识库加入到ROAR组织中,以便提高并推动中国机构知识库的知名度及科技的发展。
参考文献
[1]Lynch,Clifford A.Institutional Repositories:Essential Infrastructure for Scholarship in the Digital Age.ARL,2003,(226):1-7[EB/OL].http:∥www.arl.org/resources/pubs/br/br226/br226ir.shtml,2013-10-26.
[2]Crow,Raym.The case for institutional repositories:a SPARC position paper.ARL Bimonthly Report 223(2002)[EB/OL].http:∥works.bepress.com/irresearch/7,2013-10-26.
[3]Shearer,Kathleen.Institutional repositories:towards the identification of critical success factors[J].Canadian journal of information and library science,2003,27(3):89-108.
[4]Ifeanyi J.Ezema.Local contents and the development of open access institutional repositories in Nigeria University libraries Challenges,strategies and scholarly implications[J].Library Hi Tech,2013,31(2):323-340.
[5]Proportion of Repositories by Country-Worldwide[EB/OL].http:∥www.opendoar.org,2013-10-30.
[6]Markey K,Rieh S Y,Jean B S,etc.Census of institutional repositories in the United States:MIRACLE Project Research Findings[EB/OL].http:∥www.clir.org/pubs/abstract/reports/pub140,2013-10-26.
[7]李麟.我国科研人员对科技信息开放获取的态度——以中国科学院科研人员为例[J].图书情报工作,2006,50(7):34-38,50.[8]http:∥ir.istic.ac.cn[EB].
(本文责任编辑:孙国雷)endprint
212开发工具
机构知识库开发采用的是DSpace工具的汉化版本CSpace。该工具是在中国科学院国家科学图书馆机构知识库CASIR平台基础上推出的开源免费的机构知识库开发工具。CSpace以发展机构知识能力和知识管理能力为目标,快速实现对本机构知识资产的收集、长期保存、合理传播利用,积极建设对知识内容进行捕获、转化、传播、利用和审计的能力,逐步建设包括知识内容分析、关系分析和能力审计在内的知识服务能力,开展综合知识管理[7]。
使用该开发工具,可使机构知识库推进组成员单位所建设的机构知识库资源在底层实现共享。其体系如图2所示。
CSpace的基本功能:
(1)存缴:提供对期刊论文、会议论文、专著、学位论文、研究报告、演示报告、多媒体资料等主要知识内容类型的存缴支持,同时,CSpace也提供了以批量方式装载外部数据(如来自SCI/WOS/ENDNOTE等系统软件的产出物数据)的方法和接口。
(2)组织与检索:提供了按照组织单元(研究/试验室、研究方向或课题组、学院、学系、部门、科室等)、知识内容类型、学科主题分类、时间、题名、作者等多种组织方式。支持从题名、作者、时间、关键词等多种途径和条件的简单检索或组合检索,并支持全文检索。
(3)访问控制:提供基于IP地址、特殊用户组对不同层次内容的访问控制、对作品发布时限灵活选择。支持基于OAI的元数据开放收割接口和基于SRU的开发检索接口。
(4)长期保存:支持对存缴对象的技术、权属、源流信息等与长期保存有关的信息的记录,对已存缴作品进行撤出管理,定期备份保存内容,以及对存缴对象以METS格式进行封装和输出迁移等。
(5)统计:支持按照研究所、研究/实验室、职称、身份、作者或用户、时间段等多条件组合的基于知识库内容的统计;提供IR整体或单篇作品在预定义时间段内的浏览、下载利用情况的应用情况统计。
(6)其他功能:可根据需要提供基于电子邮件的最新内容订阅、RSS订阅、浏览和检索结果的保存及输出、关联检索、推荐等。
其运行环境和条件:
(1)硬件平台:推荐双Intel Xeon处理器,2~4GB 内存,500G以上外存。若需要做数据的离线备份和保存,可以考虑配置内置或外置磁带机(库)。
(2)软件平台:Linux/Unix/Windows2000+ Postgre SQL 82+Tomcat 55+J2SE 15。
213系统功能介绍
中信所机构知识库系统首页如图2所示。该系统中所有作品遵循知识共享协议(Creative Commons)[8]。
该机构知识库所包含的科技资源类型包括:本所职工发表的期刊论文、本所职工撰写的科技报告、本所职工发表的会议论文、本所学生学位论文、本所职工撰写的专著、本所职工申请的专利、本所职工撰写的研究报告、本所年报、本所职工申请的软件著作权、本所邀请的著名科研学者等的演示文稿、本所职工申请的科研项目及所内专家的信息等共以万计的资源总量(学术科研成果、科研项目、专家团队、学科介绍、所办OA刊物(数字图书馆论坛等6本)、年报等。集中、统一存取机构内部生成的各类科研成果和科研产出,)。其中,科技报告数量为497篇,主要是关于科研人员在从事项目过程中对该项目的核心技术及创新部分进行总结,为科研用户在今后从事其他项目过程中遇到类似问题提供参考。
该系统的主要功能包括:用户可对所有资源的元数据、全文进行检索和下载,并可按部门、资源类型、按作者等进行分类浏览。
同时,该机构知识库可实现与相同架构和开发工具的机构知识库进行跨IR的混检,可进一步实现机构知识库资源的共享。
3结论与展望
本论文的研究体系是建立在世界各个科研机构的机构知识库建设基础上进行调查和研究后进行的,构建了适合国内科研机构特色的机构知识库。并以中信所机构知识库为试验实例,介绍了中信所机构知识库的构建过程和技术难点,该系统可实现科研机构的资源的共享与传播,为推动机构知识库的建设和科研资源的免费利用贡献了力量。
下一步工作拟将该文成果推广到与中信所类似的科研机构的机构知识库建设过程中,共享更多有价值的科研成果,研究如何为科研用户提供更为友好、方便的检索体验,提高科研检索率,并将国内科研究机构的机构知识库加入到ROAR组织中,以便提高并推动中国机构知识库的知名度及科技的发展。
参考文献
[1]Lynch,Clifford A.Institutional Repositories:Essential Infrastructure for Scholarship in the Digital Age.ARL,2003,(226):1-7[EB/OL].http:∥www.arl.org/resources/pubs/br/br226/br226ir.shtml,2013-10-26.
[2]Crow,Raym.The case for institutional repositories:a SPARC position paper.ARL Bimonthly Report 223(2002)[EB/OL].http:∥works.bepress.com/irresearch/7,2013-10-26.
[3]Shearer,Kathleen.Institutional repositories:towards the identification of critical success factors[J].Canadian journal of information and library science,2003,27(3):89-108.
[4]Ifeanyi J.Ezema.Local contents and the development of open access institutional repositories in Nigeria University libraries Challenges,strategies and scholarly implications[J].Library Hi Tech,2013,31(2):323-340.
[5]Proportion of Repositories by Country-Worldwide[EB/OL].http:∥www.opendoar.org,2013-10-30.
[6]Markey K,Rieh S Y,Jean B S,etc.Census of institutional repositories in the United States:MIRACLE Project Research Findings[EB/OL].http:∥www.clir.org/pubs/abstract/reports/pub140,2013-10-26.
[7]李麟.我国科研人员对科技信息开放获取的态度——以中国科学院科研人员为例[J].图书情报工作,2006,50(7):34-38,50.[8]http:∥ir.istic.ac.cn[EB].
(本文责任编辑:孙国雷)endprint
212开发工具
机构知识库开发采用的是DSpace工具的汉化版本CSpace。该工具是在中国科学院国家科学图书馆机构知识库CASIR平台基础上推出的开源免费的机构知识库开发工具。CSpace以发展机构知识能力和知识管理能力为目标,快速实现对本机构知识资产的收集、长期保存、合理传播利用,积极建设对知识内容进行捕获、转化、传播、利用和审计的能力,逐步建设包括知识内容分析、关系分析和能力审计在内的知识服务能力,开展综合知识管理[7]。
使用该开发工具,可使机构知识库推进组成员单位所建设的机构知识库资源在底层实现共享。其体系如图2所示。
CSpace的基本功能:
(1)存缴:提供对期刊论文、会议论文、专著、学位论文、研究报告、演示报告、多媒体资料等主要知识内容类型的存缴支持,同时,CSpace也提供了以批量方式装载外部数据(如来自SCI/WOS/ENDNOTE等系统软件的产出物数据)的方法和接口。
(2)组织与检索:提供了按照组织单元(研究/试验室、研究方向或课题组、学院、学系、部门、科室等)、知识内容类型、学科主题分类、时间、题名、作者等多种组织方式。支持从题名、作者、时间、关键词等多种途径和条件的简单检索或组合检索,并支持全文检索。
(3)访问控制:提供基于IP地址、特殊用户组对不同层次内容的访问控制、对作品发布时限灵活选择。支持基于OAI的元数据开放收割接口和基于SRU的开发检索接口。
(4)长期保存:支持对存缴对象的技术、权属、源流信息等与长期保存有关的信息的记录,对已存缴作品进行撤出管理,定期备份保存内容,以及对存缴对象以METS格式进行封装和输出迁移等。
(5)统计:支持按照研究所、研究/实验室、职称、身份、作者或用户、时间段等多条件组合的基于知识库内容的统计;提供IR整体或单篇作品在预定义时间段内的浏览、下载利用情况的应用情况统计。
(6)其他功能:可根据需要提供基于电子邮件的最新内容订阅、RSS订阅、浏览和检索结果的保存及输出、关联检索、推荐等。
其运行环境和条件:
(1)硬件平台:推荐双Intel Xeon处理器,2~4GB 内存,500G以上外存。若需要做数据的离线备份和保存,可以考虑配置内置或外置磁带机(库)。
(2)软件平台:Linux/Unix/Windows2000+ Postgre SQL 82+Tomcat 55+J2SE 15。
213系统功能介绍
中信所机构知识库系统首页如图2所示。该系统中所有作品遵循知识共享协议(Creative Commons)[8]。
该机构知识库所包含的科技资源类型包括:本所职工发表的期刊论文、本所职工撰写的科技报告、本所职工发表的会议论文、本所学生学位论文、本所职工撰写的专著、本所职工申请的专利、本所职工撰写的研究报告、本所年报、本所职工申请的软件著作权、本所邀请的著名科研学者等的演示文稿、本所职工申请的科研项目及所内专家的信息等共以万计的资源总量(学术科研成果、科研项目、专家团队、学科介绍、所办OA刊物(数字图书馆论坛等6本)、年报等。集中、统一存取机构内部生成的各类科研成果和科研产出,)。其中,科技报告数量为497篇,主要是关于科研人员在从事项目过程中对该项目的核心技术及创新部分进行总结,为科研用户在今后从事其他项目过程中遇到类似问题提供参考。
该系统的主要功能包括:用户可对所有资源的元数据、全文进行检索和下载,并可按部门、资源类型、按作者等进行分类浏览。
同时,该机构知识库可实现与相同架构和开发工具的机构知识库进行跨IR的混检,可进一步实现机构知识库资源的共享。
3结论与展望
本论文的研究体系是建立在世界各个科研机构的机构知识库建设基础上进行调查和研究后进行的,构建了适合国内科研机构特色的机构知识库。并以中信所机构知识库为试验实例,介绍了中信所机构知识库的构建过程和技术难点,该系统可实现科研机构的资源的共享与传播,为推动机构知识库的建设和科研资源的免费利用贡献了力量。
下一步工作拟将该文成果推广到与中信所类似的科研机构的机构知识库建设过程中,共享更多有价值的科研成果,研究如何为科研用户提供更为友好、方便的检索体验,提高科研检索率,并将国内科研究机构的机构知识库加入到ROAR组织中,以便提高并推动中国机构知识库的知名度及科技的发展。
参考文献
[1]Lynch,Clifford A.Institutional Repositories:Essential Infrastructure for Scholarship in the Digital Age.ARL,2003,(226):1-7[EB/OL].http:∥www.arl.org/resources/pubs/br/br226/br226ir.shtml,2013-10-26.
[2]Crow,Raym.The case for institutional repositories:a SPARC position paper.ARL Bimonthly Report 223(2002)[EB/OL].http:∥works.bepress.com/irresearch/7,2013-10-26.
[3]Shearer,Kathleen.Institutional repositories:towards the identification of critical success factors[J].Canadian journal of information and library science,2003,27(3):89-108.
[4]Ifeanyi J.Ezema.Local contents and the development of open access institutional repositories in Nigeria University libraries Challenges,strategies and scholarly implications[J].Library Hi Tech,2013,31(2):323-340.
[5]Proportion of Repositories by Country-Worldwide[EB/OL].http:∥www.opendoar.org,2013-10-30.
[6]Markey K,Rieh S Y,Jean B S,etc.Census of institutional repositories in the United States:MIRACLE Project Research Findings[EB/OL].http:∥www.clir.org/pubs/abstract/reports/pub140,2013-10-26.
[7]李麟.我国科研人员对科技信息开放获取的态度——以中国科学院科研人员为例[J].图书情报工作,2006,50(7):34-38,50.[8]http:∥ir.istic.ac.cn[EB].
(本文责任编辑:孙国雷)endprint