●李 洪(深圳大学 图书馆,广东 深圳 518060)
随着电子资源在图书馆文献购置经费和馆藏数量所占比例的持续增长,图书馆的馆藏结构发生了明显的变化。与纸质资源相比,各个图书馆对电子资源的采购和管理流程更加复杂,需要处理的可变因素更多,但图书馆却一直缺乏能满足电子资源管理要求的系统。大多数图书馆目前都只能利用手工记录、电子文档等传统方式进行电子资源的管理,大量信息分散在图书馆各个部门(采访部、电子资源部、参考部、电脑部) 和各个独立的运行系统 (OPAC、Metalib/SFX、文献港、门户等)中,信息的沟通缺乏有效的渠道,使用数据的收集非常困难。这种方式已经变得越来越难以满足现代图书馆的需要,图书馆迫切需要一个对电子资源的整个生命周期进行自动化、规范化管理的系统,即电子资源管理系统(Electronic Resource Management System,简称 ERMS)。
关于 ERMS,Digital Library Federation(简称 DLF)的定义是:一个提供电子资源的选择、评估、订购和维护等相关信息和工作流的管理,并提供对电子资源及其商务和许可条款的访问的系统。[1]清华大学图书馆的张喜来等认为,从应用功能角度来看,ERMS是管理有关电子资源的选购、使用及维护等方面信息的系统。[2]
由于国内目前还没有一套成熟的ERMS,一些图书馆开始考虑引进国外商业性的ERMS。然而,目前国外商业性的ERMS不能完全满足国内图书馆的实际需求(如缺少中文知识库,缺乏文档的保存和检索功能,较难包容国内采购流程和管理办法的特殊性等),因此有必要开发一个适合本国图书馆需要的ERMS。在调研了 ExLibris公司的 Verde、[3]ProQuest公司的Serials Solutions和EBSCO公司的Discovery Solutions等大量相关产品的基础上,深圳大学图书馆正开发一个适合我国实际情况,同时能满足区域合作需求的开放源代码的电子资源管理系统(Open Source ERMS,简称 Open_ERMS)。
虽然图书馆基于电子资源生命周期的电子资源管理工作流程究竟具体包括哪些环节尚存在不同看法和表述,但图书馆界和产业界已基本达成这样的共识,即ERMS应基于电子资源生命周期,体现图书馆的电子资源管理工作流程。[4]
为了指导ERMS的开发,DLF提供了有关ERMS的详细报告——Electronic Resource Management Initiatives(简称ERMI),可作为ERMS系统开发的权威指南。
DLF的ERMI报告将电子资源生命周期划分为四个阶段(见图1):产品试用与考虑(包括数据库试用、试用评估),采购(包括许可谈判、技术评估、商务谈判),安装与使用,维护与评估(包括续订/停订、收藏范围的变更、使用统计、成本统计、技术问题的解决)。[1]
图1 ERMI电子资源生命周期
Open_ERMS以ERMI报告为指导,参考ERMI报告附录A中的功能需求,同时结合深圳大学图书馆电子资源管理的实际流程中各生命周期的业务内容和遇到的具体问题,作为系统需求分析的依据。
包括收集电子资源的信息、决定是否试用、申请试用、根据需要安装本地镜像、开通测试、发布试用通知、试用期宣传与培训、解答读者咨询与搜集读者反馈意见、试用统计、试用评估。在此阶段,用户对ERMS的功能需求有以下几个方面。
(1)保存、记录信息。按照资源提供商或者其他类别分类保存电子资源的信息及有关电子资源的往来邮件,分类保存试用回执、试用申请表、试用评估文档、试用协议的电子版,应能支持 Word、Excel、PDF、电子邮件等格式的文件上传并提供浏览和检索功能。记录在试用开通测试及试用过程中所遇到的问题、发生的情况及处理结果,希望ERMS能以备注形式记录这些信息。
(2)进行资源评估。试用时需考虑该电子资源与本馆已有资源的重复情况。因此,希望ERMS能实现资源比对功能,能对两种或多种电子资源进行比较,分析重复情况,找出某一电子资源所独有的内容,这意味着ERMS应该具有完善的知识库。
(3)发送试用通知。根据固定的试用通知模板填写试用通知,ERMS据此创建试用记录。在将资源标记为试用状态后,希望ERMS以邮件形式通知图书馆相关人员及相关院系试用生效,并提供访问说明。在试用到期之前的指定时间,提醒有关各方试用即将到期。
(4)搜集反馈意见。在每个试用资源网页上设有收集用户反馈意见的入口,希望ERMS自动把这些反馈意见汇总并关联到资源评估工作。希望在试用记录的备注字段中记录参与资源引进的各方建议及最后的购买决定及经费等信息。
在对电子资源进行试用、评估、论证、决定购买后,即进入采购阶段。图书馆与电子资源供应商进行谈判,包括技术评估、资源内容、价格、使用期限、使用许可等,然后确定购买方案、合同条款、付款方式,签订购买协议、许可协议,选定付款代理商,签订代理付款协议,办理付款手续。在此阶段,用户对ERMS的功能需求有以下几个方面。
(1)对电子资源进行著录,建立知识库。
知识库(KnowledgeBase,简称KB) 是包含各个层级电子资源记录的信息库。知识库分为中央知识库(Global Knowledge Base,CKB) 和本地知识库(LKB)。CKB数据主要由联盟维护,同时接受从不同机构上载的数据,但只允许拥有“上载数据”权限的机构,通过支持合作的模块上载数据;从CKB下载到本地ERMS的数据称为GKB数据;在本地ERMS建立的数据称为LKB数据。①见深圳大学电脑部ERM小组2010年编《ERM需求分析说明书》。
希望能使用标准的软件或开发工具从外部导入订购资源的数据。希望支持站点定义(Site-Defined)及辅助性描述数据,以对MARC中未覆盖的字段进行描述。希望实现数据统一维护功能,以实现OPAC、门户、联邦检索工具、本地各种解决方案及目录系统间的交换与共享。使得同一记录在某一系统中有更新,其他系统的该记录也相应地自动更新,或通过动态数据的交换,或从一个系统拷贝到另一系统。
希望能提供知识库的检索和浏览功能,尤其需要提供各层级电子资源的列表功能。
(2)记录、管理采购过程。记录决定采购的日期。对于决定采购的资源,通知许可方创建及协商许可协议。如果许可协议未在设定的日期内完成,根据设定的截止期,提醒相关联系人。在指定的日期前向图书馆有关部门或馆员发送各类通知,例如,在需要各负责人审核、签署论证报告或验收报告之前,应自动提前发送相关材料给他们,以使其事先了解相关报告内容。记录采购的状态,如谈判期、签订协议期等。由于采购过程比较复杂,历时较长,最好能记录详细的采购过程,并在需要时向相关人员发送通知,如办理付款或寄送合同后,自动给资源供应商发送通知。
(3)记录、管理许可权限。包括但不限于资源是否提供数字拷贝、打印、并发用户、馆际互借、教学参考、电子链接、远程教育、课程网站及课件、永久访问及存档等权限及在何种条件下提供。能够添加新的服务,允许馆员自定义服务的名称及相关操作,如公共显示列表、报告、提醒等。基于合同管理及监督的目的,希望记录额外的许可条款及元数据,如许可开始日期、结束日期、保密条款及其他重要条款。
(4)保存文档。需要保存订购论证报告、订购回执、谈判文件、许可协议、订购协议、付款协议、验收报告等的电子版或有签字、盖章的扫描件。由于协议在签订之前往往会有个双方协商修改的过程,电子版往往并不是最终版,所以需要保存最终有双方签字、盖章的协议的扫描件。
进行数据安装或网络开通后,经测试成功并验收,即完成安装过程,进入使用阶段。首先对电子资源进行著录,然后制作资源使用指南网页,发布购买信息,解答读者咨询,对使用过程中遇到的故障进行处理,对读者进行培训与宣传,还要提供其他深层次服务。在此阶段,用户对ERMS的功能需求有以下几个方面。
(1)提醒开通,发送通知。有些资源购买后较长时间才开通,需要ERMS能在应开通的日期前进行提醒。在馆员发布了购买开通或资源变更通知后,希望该通知能以邮件或其他方式发送给相关机构负责人。若图书馆有个性化服务系统(如My Library),新发布的电子资源信息应推送到相关学科的读者信箱。若图书馆在校外SNS社区或微博中设有账户,新发布的信息应能及时转发出去。
(2) 管理检索与访问。希望ERMS存储与管理URIs,并能为终端用户所用。实现代理访问/访问管理与其他功能融合,为所有用户或选择的用户提供代理访问服务的无缝链接。实行访问控制,记录授权的用户分类及授权的站点,并基于这些信息为终端用户及馆员生成资源显示列表。在馆员界面,应能进行以下操作:浏览、检索电子资源;查看馆员的完整安全文档资料及功能角色;与图书馆其他系统、门户及相关系统中存储的有关信息链接;查看对外隐藏的资源;查看工作分配、提醒。应能提供一个数据库列表或浏览式的检索模式,能生成动态的或个性化的数据库网页。能生成A-Z期刊导航。能提供与目录系统中的纸本的链接、与其他可获得的电子版本的链接。能实时标识不能访问的资源,并记录资源访问故障的时间、情况、解决故障的方法和过程、解除故障的时间等。能清楚地表达电子资源的层次结构。能在一个窗口中显示电子资源的生命周期内所有的相关信息(如合同、发票、使用统计、联系人等)。能实现各种报告的输出功能,以便查看,如输出本馆采购的期刊列表、数据库列表、提供商列表等。
(3)显示与控制使用权限。不论用户以何种方式访问,希望系统以情境敏感方式向用户显示相关的许可信息,包括向用户显示其是否有权访问,提供相关的许可使用、使用限制及特定要求等信息。希望提供安全访问控制及权限维护。
(4)支持用户教育活动。能存储培训账号相关的信息及其他用户教育安排,并能为培训的馆员及部分终端用户所访问,记录提供给馆员及终端用户的文档信息或链接,记录与培训课程相关的链接,统计问卷调查的结果。
(5)提供其他深层次服务。希望利用ERMS实现如下图书馆深层次服务:定期发布学校师生论文被权威数据库收录情况并加以分析,列出各学科高影响因子的期刊,对咨询服务和推荐导读进行管理等。
包括续订、停订、合同执行情况管理、收藏范围变更、使用统计、成本统计、技术问题的解决、收集用户反馈信息等。在此阶段,用户对ERMS的功能需求有以下几个方面。
(1)管理合同执行情况。镜像数据是否按照合同约定的期限定期更新、备份光盘是否收到、赠送内容是否收到等等,这些目前都是靠人工管理,希望ERMS能进行管理。
(2)管理续订/停订。对于有明确的续订或后续付款的截止日期的资源,应在设定的时间段之前进行通知,记录续订操作或续订决定及续订日期。在续订时,向馆员提供有关电子资源的订购模式、相关联的纸本资源、商业条款等商业信息。
对于合同到期且不再续订的资源,希望能对合同终止行为及相关决定进行管理:根据合同条款,是否允许图书馆终止合同,如果允许,记录提前通知日期及适用的条款;根据合同条款,是否允许授权方终止合同,如果允许,记录提前通知日期及适用的条款;记录合同终止日期及终止原因;记录终止合同所需满足的协议条款,并根据这些信息进行提醒;随着现有合同的终止,管理、记录永久使用的访问权限。
(3)维护知识库及管理电子资源。当电子资源的题名、收录范围、包含的图书或期刊的题名等信息发生变更时,需要对知识库进行维护更新,并将有关变化通知给相关工作人员和读者。
当校园网IP地址变化时,ERMS应自动通知资源供应商修改IP范围。在接到资源供应商关于电子资源的内容、访问方式、访问网址等变化的通知后,通过对ERMS的维护,应能对电子资源的多处相关网页进行同步更新。
(4)资源使用统计及数量统计与分析。使用统计报告的获取方式有图书馆从管理员界面自行下载、系统定期自动发送、资源商主动发送邮件或图书馆向资源商索取等,希望ERMS可以保存使用统计报告并进行汇总、分析。ERMS应支持COUNTER统计标准,并能链接支持COUNTER标准的电子资源供应商的使用统计平台,进行使用跟踪,以便图书馆对不同出版商的电子资源,在标准化的使用率数据中进行比较,从而更好地监控资源的使用情况。
The Standardized Usage Statistics Harvesting Initiative,SUSHI,是在COUNTER标准的基础上,采用统一的协议,来收集不同数据库商提供的数据并进行处理,使用户在很大程度上能更系统、高效地收集和分析数据库商提供的使用数据。[5]对于加入了SUSHI协议的资源,ERMS应能实现自动收割统计报告的功能。
ERMS应能自动生成满足各种需求的统计报表,协助图书馆员的采访决策。如生成按时间、资源类型、学科、引进方式等的电子资源数量统计,生成按全文下载量、检索次数、平均单篇全文下载成本、平均单次检索成本等电子资源使用统计等。这些报表应能被存储、下载、访问、检索,还能灵活地配置各种查询过滤条件,且可按不同的方式排序与显示字段。
ERMS还应根据全文满足率、每种目标资源点击率、某种电子期刊的点击率等量化指标统计分析出使用频率最高的期刊、数据库以及不同群体对特定资源的使用率,以此作为评估电子资源的重要依据,使图书馆能掌握所拥有的电子资源与读者满意度之间的关系,从而动态研究资源的使用效率。
(1)图书馆管理。包括联盟管理、合作图书馆管理和图书馆管理。图书馆常常以参加联盟的集团方式引进电子资源,因此,ERMS应支持各种联盟模式,记录联盟名称、联系方式、参加联盟的成员馆名称、数量、分享的资源,并具备联盟整合检索和多分支机构检索的功能,以便查找联盟内其他成员的收藏等。此外,系统还要记录本机构的图书馆信息,如名称、联系方式、位置等。
(2)联系信息管理。在电子资源整个生命周期过程中,图书馆员须经常与图书馆其他相关工作人员、电子资源供应商、付款代理商、联盟联系人、院系相关联络人等联系。为了工作的便利,ERMS应对这些联系单位和人员的基本信息进行记载与管理,包括:联系人信息和联系方职责信息。输入联系方单位名称应能查询其下的多个联系人的基本信息。由于联系信息随时可能变化,应允许对其进行新增、批量新增、维护、删除等操作。
(3)个性化设置与任务分配。ERMS通常是按照通用性原则设定了电子资源的工作流程,不同的图书馆对电子资源的采购管理的细节可能有所不同,因此,系统应允许管理员根据本地需求自定义字段和工作流程,根据业务重点设置各模块参数,根据用户的不同角色为其分配相应的权限。工作流上级的馆员应能对下级的馆员进行任务分配并能随时查看任务完成情况。
此外,还需要系统实现管理信息(如访问地址、管理员维护地址、账号密码、使用统计链接地址等)的管理与电子资源相关的纸质资源管理等等。
本系统的开发原则是立足于开源技术,遵循计算机行业和图书馆行业的相关标准进行开发,把ERMI模型与中国的实际情况相结合,并具有较好的可扩展性。
基于上述原则,Open_ERMS基于MVC三层架构的总体思想采用轻量级的J2EE技术框架进行开发。在此技术框架指导下,本系统使用Struts2、Spring2和Ibatis这三个开源框架作为技术骨架。如图2所示,Ibatis主要负责系统对数据库的数据访问;Struts2主要负责页面逻辑跳转、页面数据展示等功能;Spring2主要负责类装载以及数据库事务管理。
在数据库方面,系统采用的是加州大学伯克利分校计算机系开发的开源关系型数据库管理系统PostgreSQL。该数据库的开源协议是BSD,支持几乎所有主流的操作系统平台,而且功能非常丰富,其中包括存储过程、事务、触发器、视图、表分区、多过程语言支持和多种数据类型及索引的支持。本系统使用的是8.4.3版。
本系统的开发语言是 Java(JDK6.0),使用E-clipse开发工具,采用Tomcat6.0作为Web服务器。
图2 系统架构
系统依据需求报告进行开发的过程中需要注意以下技术难点:
(1)Open_ERMS应该具有完善的知识库用于支撑其各种服务,因此知识库的建设成为系统的重中之重。系统不仅需要能导入不同数据格式的各种数据来源的电子资源数据,同时还需要建立良好的更新机制,并能适应以后的云发展战略目标。
(2)Open_ERMS具有文档管理的功能,因此需要考虑如何对上传的文档进行有效地管理,尤其是检索方面。目前本系统采用开源的全文索引工具包Lucene进行文档检索。
(3)系统应具有良好的扩展性,方便进行二次开发,提高程序的复用性、可维护性,因此需要尽量降低系统的耦合度。
(4) 为了支持Open_ERMS与其他异构系统间的互操作,系统本身应能支持诸如Web Service、OpenAPI等技术的开发。同时系统应能支持Counter、Sushi等标准和协议,遵循国际标准,提升系统的共享能力。
经过两年的研制,Open_ERMS已于今年4月投入试运行。在具体使用中遇到的最大困难在于数据的规范,无论是电子资源本身的信息还是管理流程中的相关信息,都需要制定相应的著录规则。目前已制定了知识库的简编规则,详编规则尚待制定。其他信息各字段的著录规则也正在实践中逐步制定。Open_ERMS将在使用中不断地进行完善,以便更好地满足电子资源管理工作的需要。