◎黄秋萍 吴 锐 邓芳芳
目前,查收查引已经成为大多数高校图书馆学科服务的基础服务工作,根据查收查引的服务方式主要分为以下几类。
一是通过自主开发或购买的商业化查收查引系统开展服务。袁浩等学者指出清华大学、中国科学院文献情报中心、北京大学、北京邮电大学、武汉大学等重点知名高校和研究所通过自建或合作建设的方式开发了查收查引系统,在很大程度上节约了人力物力,提高了查收查引的工作效率。但是大多数系统平台只具备电子化在线委托、办理进度查询、网上支付费用、报告下载等功能,只能算半自动化、半人工的工作模式。
二是利用文献管理软件、数据分析软件、机构知识库等工具开发查收查引软件。张雪娟、樊亚芳等学者提出用Note Express等文献管理软件辅助人工检索的方法完成查收查引工作,极大地减少了重复性操作步骤,提高了工作效率和服务质量。刘艳民等学者开发出了基于机构知识库CSpace的查收查引功能模块,可达到95%的收录引用准确率,能有效满足高峰期用户的检索需求。这类软件虽优化了人工检索的流程,但仍需以邮件的方式接受检索委托,处理委托的实时性和反馈结果的便捷性不佳,有的需要机构知识库的支撑才能实现。
三是许多地方高校由于经费不足、人员有限等因素仍然沿用传统的人工查收查引方法。委托人需要到图书馆现场填写查收查引委托或在线下载并填写查收查引委托表,然后将其发至检索人员邮箱,由检索人员在数据库中对委托项目逐条检索并人工生成报告后,再以电话或者邮件方式通知委托人领取检索证明。
综上所述,各高校图书馆采用的查收查引服务方式不尽相同,在服务过程中不同程度地存在各种问题。一是委托检索流程烦琐,服务效率低。委托检索步骤繁多,占用了委托人过多的时间与精力,另外,检索人员需要在多个数据库中进行检索和比对,多次反复检索,容易导致工作人员身心疲惫。二是检索数据难以保存和管理,多年累积的检索数据得不到有效保存和管理,检索最终成为一次性劳动。三是委托高峰期人手严重不足。在每年的科研工作量考核、科研奖励、职称评聘、聘期考核期往往出现委托高峰,检索人员工作量激增,检索耗时较长。针对以上问题,研究开发出便捷高效的查收查引服务平台对地方高校图书馆来说尤为迫切。
华东交通大学图书馆为了提高查收查引工作效率,积极转变查收查引服务工作思路,优化传统检索工作流程,将原来触发性的常规工作转变为有规律的周期性工作,将等待用户上门委托的被动式服务转变为不受时空限制、提供自助检索和检索证明下载的主动式服务。
华东交通大学图书馆利用现代化信息技术,采用JSP编程技术和SQL Server数据库搭建基于B/S结构的非结构化文档管理的查收查引服务平台。平台以论文索引自建数据库为核心,整合多个数据库的论文收录引用数据,提供多种途径的检索,并管理论文检索证明文档,支持网页动态发布,实现权限分级管理,包括数据存取模块、内容管理模块、数据加工模块、资源检索模块、信息发布模块等。整个平台的运行流程从内容管理模块创建论文索引自建数据库开始,对用户角色、资源权限及资源相关配置进行统一管理,由数据加工模块对论文索引元数据进行导入、整编、标引、分类、检查、入库等一系列处理,其中包括非结构化检索证明文档的存储管理,进而在资源检索模块对平台的多种检索途径和检索导航进行设置,再通过信息发布模块将查收查引服务平台呈现在web上,并配合资源检索模块实现论文索引信息的检索功能,以上所有平台业务模块与底层数据库之间的数据传输与交互均在数据存取模块的支持下完成。查收查引服务平台建设分为论文索引数据资源化与自建库平台建设两个阶段,图1展示了查收查引服务平台的建设方案框架。
图1 查收查引服务平台建设方案框架(作者自绘)
查收查引服务平台建设的第一阶段是将来源于SCI、SSCI、EI、CPCI等数据库的论文索引原始数据资源化,包括论文索引元数据设计、数据采集、数据处理等三个过程,为自建数据库的元数据存储做准备。
元数据设计是任何资源数据库建设首要考虑的问题,主要目的在于建立规范的资源建设标准和数据采集方案,确保资源建设的科学性、合理性和稳定性。根据不同数据库中论文索引数据的内容特征,结合查收查引服务中检索结果的实际需要,确定自建数据库中论文索引元数据的所有必要字段及其数据类型。建设查收查引服务平台的主要目的是实现论文自助检索和检索证明的自助下载,因此论文索引元数据必须包含非结构化文档数字对象格式的检索证明下载字段。与此同时,为了保证检索证明的唯一性和真实性,便于检索证明的批量生成和加工上传,论文索引元数据还应该包含检索证明编号字段,保证其与检索证明电子文档中的证明编号一一对应。
论文索引原始数据主要来源于SCI、SSCI、EI、CPCI等数据库,现以SCI和EI论文为例介绍原始数据的采集过程。从Web of Science和Engineering Village数据库平台中,通过作者单位、发表年份等关键词检索出科研人员可能需要委托检索的SCI和EI论文,利用数据库平台的批量导出功能下载论文索引原始数据。由于两大数据库平台对导出的论文条目有数量限制,检索人员可以采取分年度导出再合并到单个Excel工作表的方式对原始数据进行整理。在采集论文索引原始数据的过程中,必须保证采集数据的原始性、真实性、完整性。
在采集的论文索引原始数据基础上,按照论文索引元数据设计的字段标准,筛选剔除掉非必要字段,将原始数据必要字段处理为符合标准要求的数据内容,最终生成规范的论文检索证明文档。论文索引元数据处理主要分为以下四个步骤。(1)添加检索证明唯一性编号。按照预先制定的编号规则对每条论文索引数据进行唯一性编号,以形成一条完整的自建库论文索引元数据。(2)批量生成检索证明。为了提高检索证明电子文档的生成效率,利用Word软件将论文索引元数据导入检索证明统一模板,由此批量合并生成含有所有元数据的检索证明。(3)拆分出独立的检索证明。为了保证每篇论文都有独立的检索证明可供下载,必须将合并后的文档拆分成以检索证明编号为文件名的单独Word文档。(4)复核并加密PDF证明文档。对于已经生成的检索证明内容需要再次进行人工复核和格式上的微调,以保证检索结果的完整性、准确性和证明文档整体的美观性。为了避免检索证明的内容被复制和篡改,同时防止电子印章和检索人员签名图片被恶意盗用,需要将证明电子文档转换并加密为PDF格式。
论文索引原始数据的采集及元数据的处理流程如图2所示,论文索引元数据处理完毕即实现了论文索引数据资源化,再通过论文索引自建库平台中的数据加工完成元数据入库及检索证明上传,便形成了查收查引服务平台的数据基础。
图2 论文索引原始数据采集及元数据处理流程图(以SCI、EI论文为例)(作者自绘)
论文索引数据资源化为论文索引自建库平台建设提供了数据支撑。现对论文索引自建库平台具体功能的实现做进一步阐述。
数据存取模块的功能是实现稳定、高效的数据存取,建立业务逻辑与底层数据库之间的交互,以提高平台的运行性能。数据存取模块遵循SOA架构标准,采用基于JDBC规范的标准接口,利用基于组件模型的编程方法,使用SQLServer数据库与JAVA设计模式进行开发,以实现数据导入、数据更新、数字对象存储、数据信息提取、数据库备份等功能。论文索引自建库平台的数字资源包括论文索引元数据、加工数据、检索证明数字对象。其中,元数据、加工数据存储于结构化数据库中,检索证明数字对象存储于文件存储系统中。为了满足文件存储系统的易用性和兼容性要求,采用NFS/CIFS协议的存储方案解决平台非结构化文档数字对象的统一存储、管理和共享问题,以保证数据的一致性和安全性。
内容管理模块可以实现自建数据库的信息管理、用户角色管理、资源权限管理、分类导航管理、文档数字对象管理等功能。(1)自建数据库的信息管理包含创建、删除、修改数据库,配置数据库名称、基本信息、数据库文件保存路径等功能。(2)将用户角色和资源权限管理相结合,实现对资源的安全管理,如不同用户对资源有不同的访问级别。(3)分类导航管理可根据实际需要设置学科、发文年份、索引类别等分类导航,对已标引的资源实现自动分类。(4)文档数字对象管理是系统管理员根据实际需求,对数字对象进行重新命名,如保留原文件名或将上传的文件名改为以时间序列命名,必须保证文件名的唯一性。
数据加工模块主要是通过对导入的论文索引元数据与检索证明数字对象进行整编、标引、分类、检查、入库加工,建立元数据与检索证明文档一一对应的关系,以提供多种类型分类导航和多种途径检索的功能。利用JSP开发技术实现基于web界面的数据解决方案,其中包含批量导入论文索引元数据,上传检索证明数字对象,按学科类别、发文年份、索引类别标引和分类,检查数据一致性,审核入库等步骤。
资源检索模块是查收查引服务平台的重要部分,是用户能否有效利用平台的关键。资源检索模块的工作原理是用户在前端web界面输入关键词或设置检索条件,由后端程序根据检索设置自动生成SQL语句检索式,在数据库中执行查询语句,将检索结果传递到前端界面。资源检索模块可配置不同检索方式,支持多导航辅助检索,也可进行各类型数据库的统一跨库检索。
信息发布模块是查收查引服务平台对外服务的窗口,实现了自建数据库在网页上发布的各种信息配置管理,其建设遵循标准的OpenURL、Z39.50、Portlet、SAML、Web Services等协议,包含定制多种发布风格,设置检索字段、概览字段、细览字段的格式,支持多种导航等功能,为用户提供集检索、浏览、下载等于一体的Web综合性门户网站。
华东交通大学图书馆利用现代化信息技术搭建的高校图书馆查收查引服务平台,具有方便易用、检索高效、下载快捷、管理规范、发布灵活、更新及时等特点,不仅极大地提高了查收查引工作的效率,而且改进了传统查收查引服务模式的不足,是一次从被动服务到主动服务的转变和创新实践,能使用户随时随地进行自助检索和下载检索证明。
通过大力宣传和推广查收查引服务新平台,用户逐渐接受和习惯了自助检索和下载的新模式。查收查引服务平台在华东交通大学图书馆正常运行一年,研究发现高校师生委托人工查收查引的数量大幅减少,相比去年同期减少了50%。用户对查收查引服务新模式的便利性、时效性、准确性都给予了充分肯定,此举进一步提升了图书馆查收查引服务的用户满意度,也为其他想要优化检索工作流程、提高检索工作效率的地方高校图书馆的查收查引服务工作提供了参考和借鉴。