国外高校机构知识库联盟系统工作流模式及启示

2017-04-12 00:00:00司莉史雅莉
图书馆建设 2017年1期

[摘要]国外在高校机构知识库联盟系统工作流设计方面起步较早并取得了一定成效。其中,澳大利亚ARROW项目发展较为成熟,包括4种工作流模式:机构知识库—科研管理系统模式、科研管理系统一机构知识库模式、联合导入与审核模式、功能集成模式。其为国内高校机构知识库联盟系统工作流模式的开发及应用带来如下借鉴和参考:因库制宜的工作流设计理念、明确各参与主体的职责与分工、重视联盟系统间的协同化发展。

[关键词]机构知识库联盟 工作流模式 澳大利亚联机研究仓储

[中图分类号] G250 [文献标识码]A

1引言

1962年美国校际政治与社会研究联盟(Inter-Uni-versity Consortium for Political and Social Research,简称ICPSR)成立,为向用户提供优质的数据资源,ICPSR将组织目标及过程管理方案纳入到了其年度战略规划,由ICPSR委员会负责统一管理和执行,成为高校机构知识库(Institutional Repository,简称IR)联盟工作流管理的重要典范。高校机构知识库联盟在国外已有50多年的发展历史。随着数据量的膨胀和联盟规模的扩大,对高校机构知识库联盟业务流程的合理规划变得日趋必要,工作流设计对于联盟的有效运行也越来越重要。除ICPSR外,当前国外发展较成熟的高校机构知识库联盟,如面向世界的澳大利亚联机研究仓储(Australian Research Repositories Online to the World,简称ARROW)、英国的7校机构知识库联盟项目SHERPA-LEAP(London Eprints Access Project-Securing a Hybrid Environment for Research Preservation and Access,伦敦在线资源获取项目——确保研究(数据)保存和获取的综合环境)等,在机构知识库联盟工作流模式开发及应用方面也已取得较好的应用成效。而国内高校机构知识库联盟在相关方面的研究和实践尚处于起步阶段,有针对性的案例也更加少见。笔者以ARROW项目的工作流模式为例展开讨论,通过实例分析为国内相关领域的研究和实践提供借鉴与参考。

2高校机构知识库联盟系统工作流模式现状研究

1996年,工作流管理联盟(Workftow Management Coalition,简称WfMC)认为,工作流即全部或部分业务过程的自动化,在此过程中,文档、信息或工作任务会根据特定程序规则从一个执行者(环节)传递至另一个执行者(环节)。将组织业务过程从现实世界中抽象出来,采用形式化方法对其进行描述,其结果即该组织的工作流模式。WfMC指出,通过工作流模式进行过程管理,有利于优化组织人力资源配置并促使其沿正确方向发展,同时还可提高组织业务效率,降低工作成本,改善用户服务质量。目前,国内外不少高校机构知识库联盟组织均根据自身实际情况开发了不同的工作流模式,以促进联盟科研服务功能的充分发挥。

在对已有文献进行调研的基础上,结合目前国外高校机构知识库联盟建设实践,笔者认为高校机构知识库联盟主要采用以下3种工作流模式:①机构知识库数据导入型工作流模式,是指由联盟各成员机构知识库负责数据采集,将收集组织好的数据导入到联盟科研管理系统,由其统一提供给用户使用;②联盟科研管理系统数据导入型工作流模式,是指由联盟科研管理系统负责数据采集,将收集组织好的数据导入到各成员机构知识库,数据服务仍由联盟科研管理系统负责;③混合式工作流模式,是对以上两种模式或其他模式的综合运用。据此,笔者对国内外部分高校机构知识库联盟的工作流模式进行了统计分析(见表1)。

由表1可知,在调研的23家高校机构知识库联盟中,机构知识库数据导入型工作流模式作为传统的过程管理方法仍占据着主导地位,采用该模式的占56.5%。联盟科研管理系统数据导入型工作流模式多运用于区域性高校机构知识库聯盟的建设,采用该模式的占21.7%。混合式工作流模式兼具二者的优势,采用该模式的占21.7%。目前,美国、澳大利亚等机构知识库联盟事业发展较为成熟的国家已经开始了实践探索,中国的香港、台湾机构知识库联盟系统也开始尝试混合式工作流管理模式。工作流模式在数据管理领域的运用和推广对于科研人员工作效率的提高以及数据资源的有效共享具有重要意义。

3 ARROW系统工作流模式及适用性分析

ARROW是由澳大利亚联邦教育、科学与培训部资助的国家示范项目,也是澳大利亚高等教育研究信息基础设施框架的重要组成部分。在联盟系统工作流管理方面,ARROW侧重于元数据流的采集管理。由于ARROW所面临的是多个系统之间的数据管理问题,其科研管理系统需要与各成员机构知识库系统进行有效协作。因此,ARROW项目高等教育研究数据采集(The Higher Education Re-search Data Collection,简称HERDC)工作组针对不同成员机构知识库的实际情况开发了以下4种工作流模式:①机构知识库一科研管理系统模式;②科研管理系统一机构知识库模式;③联合导入与审核模式;④功能集成模式。各成员机构知识库在联盟数据流管理过程中可因库制宜,选择最佳实践方案。

3.1机构知识库一科研管理系统模式

该模式工作流程为:①数据采集,由成员机构知识库负责并进行条目验证,数据提供者具体包摇学术型员工、专职研究员、院系教师、信息发布者、行政管理者、图书馆员以及研究办公室人员等;②数据导入与管理,联盟科研办公室需向HERDC工作组做汇报,才能将数据由成员机构知识库导入科研管理系统,科研管理系统对未收集齐的数据进行补充收集并反馈给成员机构知识库;③数据输出,科研管理系统作为统一服务平台,将整合后的数据提供给用户使用(见图1)。

该模式的特色在于:①在数据收集过程中,各成员机构知识库负责进行条目验证,可有效提高科研管理系统数据质量,减少数据冗余。②模式运行可依托于现有软件系统,编程和开发工作主要应用于成员机构知识库与科研管理系统之间数据流的同步和更新,从而有效避免数据不同步问题。但采用该模式需考虑以下两方面问题:①各成员机构知识库系统负荷量较大,模式运行速率较慢,可能会影响资源利用率。②科研办公室和各成员机构知识库需在涉及HERDC报告的所有问题上事先达成一致。

因而,机构知识库一科研管理系统模式较适用于联盟成员较多,且各成员机构知识库系统运行环境相对一致的高校机构知识库联盟的建设,以保证系统资源的有效整合。成员机构知识库负责数据采集的主要工作,还应具备较高的资源监控能力。在实际运行过程中,由于该模式目前发展较为成熟,很多大规模高校机构知识库联盟的建设较倾向于采用该模式完成业务流程管理。

3.2科研管理系统一机构知识库模式

该模式与机构知识库—科研管理系统模式的主要区别在于数据采集主体的变化。其工作流程为:①数据采集,由科研管理系统集中采集,数据的提供者不变;②数据导入与管理,科研管理系统对收集到的数据资源进行加工整合后导入到各成员机构知识库,成员机构知识库对未收集齐的数据进行补充收集并反馈给科研管理系统;③数据输出,科研管理系统作为统一服务平台,将经成员机构知识库审核后的数据资源提供给用户使用(见图2)。

该模式的特色在于:①由科研管理系统负责数据采集,无需进行HERDC验证与审核,直接将数据存储于成员机构知识库,在很大程度上减少了数据的二次验证过程。②数据由科研管理系统导入成员机构知识库,可借助现有数据输入/输出工具批量实现,减少了数据导入工作量,服务效率更高。但采用该模式需考虑以下两方面问题①科研管理系统收集用户所需的所有数据,包括文献的数字对象标识符(Digital Object Identifier,简称DOI)信息和摘要,这给数据系统和科研办公室都带来了巨大的工作负荷,对联盟科研办公室工作人员的从业能力也提出了更高要求。②由于各成员机构知识库系统存在差异,科研管理系统作为系统间数据同步与更新的主体,无法通过常规的数据接口实现,需要专门的定制软件来完成。

因而,考虑到科研管理系统的运行效率,机构知识库一科研管理系统模式较适用于中小型高校机构知识库联盟的建设。该模式下,联盟科研办公室工作人员需具备较高的专业素养,能对数据进行有效甄别和遴选,同时具备一定的软件开发与应用能力。

3.3联合导入与审核模式

该模式的工作流程为:①数据采集,设计独立的数据导入与审核系统来负责资源采集工作,数据的提供者不变;②联合导入与审核,数据导入与审核系统在对所收集的数据资源进行审核与组织之后,将其导入到科研管理系统和各成员机构知识库,二者可对未收集齐的数据进行补充收集,并反馈给联合导入与审核系统进行审核。③数据输出,科研管理系统作为统一服务平台,将经成员机构知识库审核后的数据资源提供给用户使用。但在数据服务过程中,科研管理系统可根据用户实际需求,与成员机构知识库进行互动与协调(见图3)。

该模式的特色在于:①联合导入与审核系统会向资源贡献者一次性收集所需信息并对其进行即时检测,最大程度地降低了其资源贡献成本;②输入工具方面有所创新,联合导入与审核系统可自动识别系统需求,针对每个系统只提供其所需数据;③数据采集模块独立于科研管理系统和各成员机构知识库,有效降低了二者系统的负荷量。联盟科研服务效率得到保障。但采用该模式需考虑的主要问题是:数据采集工作不依赖于科研管理系统和各成员机构知识库,需独立开发联合导入与审核系统并将其嵌入到相应工作模块。系统开发一方面面临着技术挑战,另一方面也需大量的资金支持。

因而,采用联合导入与审核模式建立高校机构知识库联盟,首先,需要各成员高校机构知识库系统在功能设计与兼容性方面具备较高的同质性,为新系统的开发、嵌入及运行提供有利条件。其次,由于该模式涉及联合导入与审核系统的开发,联盟科研办公室与各成员机构知识库需就系统开发的成本投入、数据共享方案等问题达成一致。

3.4功能集成模式

该模式工作流程為:将数据的获取、管理和揭示功能集成到新的系统中,由新的集成化服务系统直接负责数据的输入与服务,具体工作环节包括:数据输入—数据管理与揭示—数据输出(见图4)。与前3种模式不同的是,该模式实行集成化服务,数据的管理与揭示、数据的输出等任务均由新系统完成,科研管理系统和各成员机构库在业务完成过程中的系统负荷相对较小。

该模式的特色在于:①联合导入与审核模式类似,数据收集及存储工作基本一次性完成,可降低用户资源贡献成本,消除系统间的数据不同步问题。②通过功能集成,由集成系统统一向用户提供数据服务。但采用该模式需考虑的主要问题是:①集成系统在各成员机构知识库系统中不存在,需进行本地开发并完成系统嵌入。这就需要成员机构知识库为开源软件或能提供足够的应用程序编程接口(Application Programming Interface,简称API)支持本地开发。②本地开发的软件易受机构知识库系统升级或变化的影响,软件维护成本较高。并且,单个系统的协议框架、预期发展及管理问题等都需联盟科研办公室与各成员机构知识库达成一致。

因而,采用功能集成模式建立高校知识联盟,一方面对成员机构知识库系统开发环境具有较高要求,开发成功后的软件维护成本问题也应纳入预期规划。另一方面,由于数据的采集、管理与应用均由新的集成系统完成,联盟科研办公室与各成员机构知识库对新系统的适用性进行预调研,同时应做好宣传推广工作并针对用户开展相关培训。

4国内高校机构知识库联盟系统工作流设计建议

由以上分析可知,高校机构知识库联盟工作流设计是一项系统化工程,需考虑软件开发成本、系统运行环境、联盟及各成员机构知识库之间的协调等一系列问题。ARROW机构知识库联盟在工作流设计方面,可为国内相关实践发展提供参考和借鉴。具体而言,可从强调因库制宜的工作流设计理念、明确各参与主体的职责与分工、重视联盟系统间的协同化发展3方面进行阐释。

4.1强调因库制宜的工作流设计理念

高校机构知识库联盟的工作流设计面临着对各成员机构知识库数据资源的统一组织与调配问题。高校机构知识库联盟的数据管理系统需要与各成员机构知识库系统实现有效对接。ARROW从系统设计的角度出发,充分考虑了不同高校机构知识库系统在数据收集情况、管理方法、系统性能以及运行环境等方面存在的客观差异,开发了针对不同机构知识库的多种工作流模式,使得各成员机构知识库可根据自身实际运行情况选择最佳方案,从而使联盟系统充分发挥其科研效用。这种因库制宜的设计理念将在很大程度上降低系统负荷,提高系统运行效率。近年来,国内高校机构知识库陆续建立并取得了初步发展,呈现出区域性联盟发展趋势。但各地发展并不均衡,高校机构知识库的资源建设水平也存在差异。ARROW这种因库制宜的工作流设计理念,可为国内高校机构知识库联盟的建设发展提供新思路。

4.2明确各参与主体的职责与分工

在工作流设计过程中,各参与主体的职责分工明确与否对整个系统的顺利运行有着非常重要的影响。ARROW开发的4种工作流模式,均对数据采集、数据审核与验证、数据资源的补充与更新、数据服务等各项工作任务进行了明确分工。其中,机构知识库34研管理系统模式与科研管理系统一机构知识库模式的联盟过程管理主要是通过成员机构知识库和科研管理系统实现的。联合导入与审核模式与功能集成模式,通过系统开发与功能集成,将数据审核、数据服务等工作任务分配至新系统,降低了原有系统的工作负荷。目前,国内高校机构知识库陆续建立并取得了初步发展,区域性联盟趋势日渐明显。但现有高校机构知识库联盟在工作流的设计过程中,并未对各参与主体的职责与分工做出明确规定,通常都是由联盟科研管理机构负责统一管理与协调,成员机构知识库只是作为联盟会员进行数据上传,对于资源审核、数据更新等工作流程的设计仍有待完善。因而,国内可借鉴ARROW这种责任制工作流模式,提高联盟工作效率。

4.3重视联盟系统间的协同化发展

由ARROW案例分析可知,在高校机构知识库联盟工作流设计过程中涉及到的系统协同化问题主要分为两类:其一是现有系统之间的协同化问题,即科研管理系统与各成员机构知识库之间的数据同步与更新。其二是为合理规划业务流程、满足用户需求而新开发的系统与现有系统之间的API对接与数据统一管理问题。数据系统间协同性的高低是影响高校机构知识库联盟科研效用的重要因素。因此,从长远来看,我国高校机构知识库联盟的建立和发展应充分考虑系统间的协同化问题。

具体而言,应从以下3方面着手解决:①明确数据补充采集与更新的主体。将数据同步问题作为联盟工作流模式运行的独立业务环节进行规划,确保各系统间数据资源的及时更新。②正确评估本地系统开发及运行环境。在工作流設计过程中,如需进行系统开发,首先应对现有系统的性能和运行环境进行准确评估,为新系统的开发及其与现有系统的有效对接创造条件。③提供系统的协同化运行及维护的资金保障。系统的协同化发展需要一定的资金支持,尤其是在本地系统维护或新系统开发过程中,需要大量的成本投入,因而,联盟在工作流模式开发或选取时,应将该问题纳入重点考虑范围。

5结语

基于对国内外相关研究成果和实践情况的调研分析,本文立足于国内高校机构知识库联盟建设的现实需求,对国外高校机构知识库联盟成功案例ARROW项目的工作流模式进行了分析。经研究发现,ARROW在工作流设计理念、模式开发、参与主体的职责分工以及多系统间的协同化发展等方面已经取得了较为成功的实践探索,对我国高校机构知识库联盟工作流模式的开发和应用具有重要借鉴意义。目前,国内相关研究成果多集中于对高校机构知识库联盟建设宏观性问题的分析,涉及高校机构知识库联盟工作流模式的研究还比较少。与此同时,业界相关方面的实践尚处于项目调研或系统开发阶段。因此,未来国内高校机构知识库联盟的建设和推广一方面有赖于政府、学术界和业界的多方支持与参与,另一方面也可借鉴ARROW等国外成功案例的实践经验,设计与优化适应我国国情的高校机构知识库联盟工作流模式。