郑璐
[摘 要]国内机构知识库(Institutional Repository,IR)建设发展已有十余年,取得了一定成果,但也面临诸多问题。文章以SHAO机构知识库为研究对象,从成果收录情况、功能建设情况以及使用情况三方面进行梳理,分析其在建设中存在的诸多问题,并提出针对性的解决策略。
[关键词]机构知识库;知识库建设;科研单位
doi:10.3969/j.issn.1673 - 0194.2024.02.065
[中图分类号]TP392;G250.74[文献标识码]A[文章编号]1673-0194(2024)02-0202-04
0 引 言
自我国第一个机构知识库建设上线,至今已有17年,经过多年的发展,我国机构知识库的数量和内容都已初具规模,在促进学术成果的开放获取中发挥了积极作用[1]。但是,其在建设实践和实际使用过程中也面临诸多问题。本文研究SHAO机构知识库建设现状,分析其建设过程中存在的主要问题,针对问题提出解决策略,以期为其他科研单位建设机构知识库提供参考,推动机构知识库可持续发展。
1 SHAO机构知识库建设现状
1.1 成果收录情况
SHAO机构知识库始建于2009年,截至2023年7月31日,平台中存储知识内容类型共12类,条目总量为8 310条,全文量共5 274篇,具体情况如图1所示。根据图1数据可以看出,SHAO机构知识库收录的成果内容类型以公开发表的期刊论文、会议论文等为主,共8类成果,约占条目总量的85%;演示报告、课件、精品课程、科学数据、学习讨论集、学术报告等未公开发表的过程性科研成果基本零收录。在平台收录的成果中,学位论文、专利、文集论文全文存储率较高,超过90%;期刊论文、会议论文的全文存储率约为70%;由于项目、成果两类是零存储,所以总体的全文存储率约为63.5%,存在较大的缺口。
1.2 功能建设情况
SHAO机构知识库是基于CSpace软件平台建设的,核心功能为知识成果的存储管理、发现利用服务以及个人学术主页、统计分析及图谱化揭示,包括基础功能、拓展功能和个性化服务功能三类。基础功能是存储知识成果的组织及浏览,包括成果展示、分类导航、一站式检索等;拓展功能是基于存储数据为用户提供的学科化服务,包括知识图谱、知识整合、学习讨论、学科评估及报告导出功能等;个性化服务功能包括成果存储认领、个人主页服务,其中个人主页包括个人信息、科研成果展示与统计、研究方向和合作作者的可视化展示等功能。此外,SHAO机构知识库还与权威商业数据库、本单位自建的人员系统对接,论文信息和本机构人员信息均采取自动同步的方式获取,实现数据自动共享、交换与关联集成。目前功能设置已经具备支持科研管理和学科建设的条件。
1.3 使用情况
SHAO全体人员均有本单位IR的账户,根据平台数据,目前SHAO机构知识库共有可用账户603个,但曾有平台操作记录的账户仅有26个,而最近一年平台操作记录超过10次的用户仅2名,且均为IR平台管理员。另外,SHAO机构知识库采取依据网际互连协议(Internet Protocol,IP)地址限制访客使用权限的模式,平台及条目信息开放全网访问权限,但全文下载权限仅限本机构IP地址。自2009年10月建成使用开始,截至2023年7月31日,SHAO机构知识库平台累计访问量35万余次,累计下载量16 254次,篇均下载频次约为3次,而根據Web of Science数据库数据,作者地址包含SHAO的论文自2013年至今篇均使用次数约为7.8次。IR的论文使用数据与商业数据库数据存在较大出入,说明SHAO机构知识库的使用数据无法客观地体现其科研影响力。
2 SHAO机构知识库建设面临的问题
2.1 用户参与度低,知识数据更新慢
SHAO机构知识库建设采用由图书馆工作人员负责建设和维护的模式,活跃用户仅有两名平台管理人员,普通用户几乎不参与建设,自存储方式的裹足不前使本应由科研人员参与共建共享的交流平台几乎成了图书馆的“独角戏”[2]。这种模式也导致知识数据收集、上传、更新的效率低。截至2023年7月31日,SHAO机构知识库仅有35条2023年的知识数据。数据收集、上传、更新慢是IR建设中普遍存在的问题,多数机构的IR并不能做到实时更新,因为科研教育机构每年会统计其科研产出成果,而IR最基础的作用是收集、整理、保存本单位的知识产品,为了提高工作效率,IR建设部门往往利用科研成果统计结果,省略收集和整理知识产品的步骤,所以其建设模式类似数字档案馆的建设,知识数据收集、上传往往是每年集中更新一次。这种建设方式不仅内容更新周期长,而且无法激发用户参与建设的积极性,同时降低了用户浏览使用IR的可能性,客观上抑制了其衍生功能和作用的发挥。
2.2 知识数据质量欠佳,限制平台功能发挥
当前,各单位IR采集的主要知识内容类型为期刊论文、会议论文、专著、学术论文、专利等公开发表的科研成果,而研究报告、演示报告、成果、会议录、课件等非公开发表,但详细记录科研过程,十分有科研价值和学术意义的资料鲜有收录[3],SHAO机构知识库同样如此。这种内容建设方式不符合IR的建设初衷,限制了IR功能的发挥和完善,导致IR的利用率和影响力无法提升。同时,由于采用人工采集并上传知识数据的方式,知识条目信息不全的现象普遍存在。以期刊论文为例,其条目信息包含题名、作者、出版物名称、出版时间、卷期号等至少16种字段,但条目信息项缺失或错误的现象十分普遍。由于知识数据质量欠佳,平台现有的部分知识挖掘分析结果不准确,更加导致知识关联、再组织等知识管理功能的发挥缺乏基础和前提条件,从根本上限制了平台功能的发挥。
2.3 限制开放获取,平台使用率低
SHAO机构知识库采取依据IP限制使用权限的方式,用户无法全网开放获取平台上的知识数据。这种限制开放获取的方式不仅限制了机构外用户出于学术目的的访问和下载,同时还限制了本机构用户的使用。用户使用率低进而降低了用户参与IR建设的意愿,用户的需求和建设意见便无法得到反馈,加剧了图书馆“自导自演”建设IR的模式,致使平台建设模式进入恶性循环。IR建设的封闭化和对IR内容开放获取的限制,使其成为“信息孤岛”,导致后续功能开发和系统完善无力的局面。同时,由于知识内容类型不丰富,且以公开发表的期刊论文、会议论文等论文为主要内容,这种知识类型使得机构知识库某种意义上成为机构论文库,其内容基本都已收录在商业数据库中。用户检索利用知识内容时,IR与广大专业数据库成为并列的检索工具,但与专业的商业数据库相比,IR目前建成的可使用的功能使其并不具有明显优势,因而IR的可替代性很强,这种情况大大限制了平台的使用率,进而限制了平台的作用及影响力的提升。
3 SHAO机构知识库建设问题的解决策略
3.1 完善知识存储方法
首先,采取全体用户协同建设的方法。IR是机构的知识管理工具,若只靠一两个专员负责建设和维护,建设效率和效果不佳的结果几乎可以预见,而全体用户协同建设是完善平台知识数据最高效的方法。IR是机构内部的“维基百科”,存储和展示的是机构内部所有人员的知识成果,全员参与IR建设不仅可以丰富知识内容类型、提高知识数据存储率,而且因为其对知识内容的逻辑结构和关联更加明了,让知识关联、挖掘和管理有了更大的可能,IR功能可以得到更强的发挥。
其次,改变依靠人工的方式,实现信息自动化抓取和存储、平台间共享,是完善知识存储的第二种方法。一方面是与权威商业数据库合作,实现机构知识信息的抓取和推送,这样不仅可以提高建设效率,而且可以保证条目信息的准确性和完善性,为知识组织和挖掘功能的发挥奠定基础。另一方面是将IR与本机构各知识平台和内部系统平台互通,将IR建设成为机构知识网络的结点。大多数机构的知识平台不止IR一种,出版物平台、部门或个人网站应用、开放研究者与贡献者身份识别码(Open Researcher and Contributor ID,ORCID)(如iAuthor)集成应用等,都有存储和管理成员科研成果的功能;同时,机构内部建设的人事平台、科研系统平台、会议视频平台等存储的本机构人员信息和科研数据,是本单位IR实现知识成果统计、知识挖掘的基础数据。通过IR将机构内的“信息孤岛”联通起来,发挥机构各网络功能,自动收集数据信息和知识内容,丰富链接和知识关联,实现并完善IR知识管理和组织功能。
3.2 改善平台建设模式
要想改善平台建设模式,首先各机构之间要展开共享合作。IR的建设发展不是某一单位的责任,而是广大单位共同的目标。当前处于协同创新的时代,目前国内也有建设发展IR的联盟,应充分发挥联盟的推动作用,搭建各单位之间的桥梁,开展共享与合作,实现资源整合,而聚合规模效应是建设IR的高效方式。建设IR的过程中,要组建相对稳定的技术团队,持续地建设和完善升级系统,并且分享建设经验与教训,如此,IR的建设才能取得巨大的进步和长足的发展。
其次,IR功能建设应该“走出去”,与其他相关知识平台对接,开放接口,嵌入功能或利用数据完善自身建设。商业数据库发展速度很快,其功能也比较强大和完善,将其功能嵌入融合是完善IR功能比较快速、便捷的方法。同时,IR建设应该关联权威数据库,获取实时知识数据,让用户在使用中了解相关成果及期刊影响力等相关数据。如此不仅可以拓展IR的功能,而且可以增强IR建设发展的活力。
最后,IR建设要采取开放获取的模式。对IR建设过程中产生的知识成果开放共享是保证其发展的持续动力。目前,国内外学术界对知识的开放获取达成共识,开放获取的意愿和实际行动也在不断加强。IR是伴随开放存取的发展而兴起的一种学术交流与资源共享的新模式,是开放存取的知识平台,对其存储内容实行开放获取是IR建设的目的,也是必然选择。改变现阶段平台访问和内容获取的限制,是提高IR利用率的重要前提,也是其发展完善的助力。
3.3 丰富平台内容与功能
为保证平台功能的发挥和持续开发,在保证内容质量的同时,更要丰富平台的内容类型。在科研教学等机构中,实验数据、培训教程、讲座、过程文件等非公开发表文献同样有着重要的价值[4]。因此,建设IR要拓宽思路,重新定位,改变发表成果“一统天下”的局面,丰富、完善知识库内容类型,优化机构产出知识存储结构,为IR知识关联、管理功能的开发拓展奠定基础。
另外,要建设平台的交流功能。将IR建设成为知识管理平台是目的,知识管理的过程有知识存储、知识关联、知识挖掘、知识组织及知识发现。这一过程中绝离不开知识分享和交流,所以还应该根据IR的功能定位将其建设成学术交流平台,即开发其学习社区的社交功能[5]。成熟的学习社区,如B站、知乎等,不仅是知识交流的平台,还兼有知识挖掘和组织的功能,其建设效果和影响力有目共睹。IR建设应借鉴学习社区的成熟经验,对IR功能重新进行定位,将协同创作纳入平台建设理念之一,包含个人社区、多人协作文档编辑平台、信息共享空间等,为用户提供实时的学习交流平台,将第一手科学数据、过程文档等留存在系统中。
如此,可以将IR建设成为知识内容类型丰富,且具有社交学习功能的知识管理平台,进而完善IR功能,提高平台利用率和影响力,实现建设目标。
3.4 提高知识服务能力
首先,对目前存储的知识信息进行全方位的组织挖掘,充分发挥已建成的功能。IR存储的本机构的知识成果必然具有连续性和关联性,对已存储的知识进行组织和分析是IR知识管理作用发挥的主要方式。对已存储的知识内容进行关联和分析,包括知识作品类型分布、研究单元产出分布、论文收录类型分布、研究人员发文量排行、论文引用排行、论文关键词共现图谱、作者合作网络图谱等,是知识管理的前提和知识服务能力建设的基础。知识组织和分析应有多种方式和切入点,知识图谱的功能也有可深入挖掘的巨大空间,各单位可根据教职人员的科研学习习惯和实际状况,提高知识挖掘的广度和深度,做深做细知识服务。
其次,建设平台的学科化服务功能。借鉴商业数据库的建设经验,不断完善参考文献导出、文献分析阅读、文献推送等知识服务功能,IR也具备开发上述功能的先决条件。另外,完善知识推送、引用格式推荐等知识服务,通过分析科研人员检索记录、论文高频词等探究其研究方向,向其实时推送相关的学科发展资讯、科研论文及专利等,为科研和学习提供助力。IR开发此功能具有优势,特别是在科研院所,因为科研学科相对集中,出版物等也有一定学科类型偏好,所以学科化服务具有更强的针对性。
4 结束语
目前,国内机构知识库建设已经取得一定的成绩,但是由于知识数据更新效率及质量欠佳,IR平台功能发挥受限,而限制开放获取又导致平台使用率和用户参与度低,这些问题限制了IR的可持续发展。在今后IR建设发展中,要拓宽其功能定位,改善知识集成、存储方法,坚持开放共享、协同共建的建设原则,在保证已建成的知识服务功能可发挥的基础上,迎合用户使用习惯和科研需求,有针对性地持续开发新功能,以增强平台知识管理和学科化服务能力,提高用户体验和平台利用率,达到IR建设的预期效果。
主要参考文献
[1]张伶,祝忠明,寇蕾蕾,等.国内科研机构和高校机构知识库建设现状调研与对比分析[J].知识管理论坛,2020(2):122-134.
[2]龚亦农.试论机构知识库建设的现实困境及发展对策[J].图书馆工作与研究,2016(3):41-46.
[3]钱建立,李鹏,李若溪.机构知识库可持续发展策略研究[J].情报杂志,2012(11):176-180,160.
[4]王洪军,李焱,祝国浩,等.团队协作与机构知识库平台的建设[J].中华医学圖书情报杂志,2016(2):52-56.
[5]聂华,韦成府,崔海媛.CALIS机构知识库:建设与推广、反思与展望[J].中国图书馆学报,2013(2):46-52.
[收稿日期]2023-08-12