国内部分查收查引系统比较研究与优化策略

2021-06-09 09:16:54曹敏媛周保昌
图书馆学刊 2021年5期
关键词:北邮题录检索

袁 浩 曹敏媛 李 青 周保昌

(国家图书馆,北京100081)

查收查引又叫收引查证、文献查证、代查代检等,是图书馆参考咨询领域的一项重要工作。该服务通过对用户发表或指定的论文或著作在SCI、EI、CPCI-S、CSCD等国内外著名检索工具中的收录及引用情况进行检索并出具检索报告,为客户申报两院院士、国家自然科学基金、杰出青年基金等国家各类教育科研基金,机构学术水平评估和个人职称评定等工作提供客观、准确的依据。

近年来,随着越来越多管理机构对查收查引检索结果的认可,查收查引业务的需求不断增长。国家图书馆科技查新中心接收查引查证业务咨询量从2013年的2716单增长到2019年的4749单,增长率达74.9%;浙江大学图书馆2016—2018年接受的查收查引业务委托达23826人次[1],年均约8000人次;苏州地区查引服务量在几年内增加了数十倍,平均年增长30%以上[2];海南大学图书馆2014—2018年五年间查收查引业务量从628单增长到1685单[3]。

查收查引业务的交付结果相对固定,且基本不涉及解读文献内容,适合引入系统工具辅助提升工作效率。随着业务量的不断增长,提升工作效率、减轻工作人员压力的需求变得愈加迫切,越来越多的图书馆开始关注查收查引系统。笔者梳理了国内查收查引系统研究和应用现状,并通过个案访谈及部分系统试用,比较主要查收查引系统的功能特点,最后对系统的优化提出建议。

1 查收查引系统现状

1.1 查收查引系统研究现状

在CNKI总库平台进行跨库检索,选择期刊、学位论文、会议、报纸等数据库,在主题字段检索查收查引、收引查证、文献查证、论文收引、收录引用、引证检索、引文检索、代查代检、代检代查等相关词,获得了查收查引研究的相关文献。通过文献梳理,笔者认为当前查收查引系统的研究大体分为3个方向。

(1)对业务功能的研究。此类研究聚焦于查收查引系统中的个别重要功能的优化和深入探讨,比如跨库检索[4]、他引区分[5-6]、报告生成]、自助打印[9]、云端访问[10]等。比如,阚洪海研究了基于水晶报表的查收查引报告自动生成技术,与人工排版相比,系统能平均节省2/3以上的时间;陈斯斯[12]研究如何将微信小程序与查收查引系统相结合,探讨移动服务场景中的查收查引工作。

(2)对具体工具的研究。此类研究普遍使用NoteExpress、EndNote、Excel、Word、VBA等成熟工具的功能,解决工作中的具体问题,以提升查收查引工作效率[13-17]。典型研究包括,陈伟[18]联合使用多个工具,比如Excel、Word和Endnote、NoteEx⁃press等实现批量检索、批量编辑字段、快速插入引证文献等功能;张雪娟[19]研究了利用NoteExpress辅助人工实现自引去除、他引列表输出,以及总他引次数等的快速统计。

(3)对软件系统的研究。随着查收查引工作的广泛开展以及业务量的不断攀升,众多大学或机构掀起了开发查收查引系统的风潮,比如清华大学[20]、中国科学院文献情报中心[21-22]、北京大学[23-24]、北京邮电大学[25-26]、西安知先[27-28]、武汉大学[29]等机构都通过自建或合作建设的方式开发了查收查引系统。这些均是系统层面的研究,不过也有繁简之分,有些系统功能完备,比如师晓青[30]以山东大学应用场景为例,将查收、查引和查新整合于一个平台,详细规划和设计了6个角色用户的权限和主要功能,包括检索员、用户、检索审核员、科研审核员、人事审核员和系统管理员等,并且系统还含有电子签章和服务评价功能,但也有些系统查询范围仅覆盖个别数据库,限制了使用场景。

1.2 查收查引系统应用现状

应用方面,通过前述文献调研可知有十余家图书馆自行开发了查收查引系统,这些系统大部分仅应用于自己的图书馆,也不乏一些佼佼者通过商业渠道将系统向全国推广,并通过市场选择得到了普遍的应用。通过网络调研和个案访谈可知,当前有五家查收查引系统应用较为广泛,这五家代表了当前查收查引系统的最高水平。

(1)中科嘉速(北京)并行软件有限公司开发的引证报告服务系统。该系统由中国科学院软件研究所研发(以下简称中科院系统),目前被中科院系统内的图书馆、北京师范大学图书馆等多个机构使用,笔者所在的单位也是该系统的用户。

(2)北京开元数图科技有限公司开发的查收查引系统[31]。该系统由CALIS牵头研发并测试(以下简称CALIS系统),目前在高校图书馆系统内使用广泛,用户包括北京大学图书馆、清华大学图书馆等。

(3)北京创讯未来软件技术有限公司开发的科技查新站管理服务平台[32]。北创软件依托于北京邮电大学,是专业的图书馆信息化供应商,该平台基于北京邮电大学的需求开发,可单独购买其中的查收查引功能(以下简称北邮系统),经与株洲田心信息技术有限公司合作,迭代完善后在业界推广,用户包括北京邮电大学、中国农业科学院、吉林大学、四川大学、哈尔滨工业大学等多种类型的机构。

(4)西安知先信息技术有限公司开发的论文查收查引自助服务系统[33](以下简称知先系统)。西安知先在业内比较知名的是其Notefirst文献管理软件,公司在文献收集和整理方面的技术积累为其开发查收查引系统打下坚实基础,目前的用户包括河南大学图书馆等。另外,业内还有陕西中科创元信息科技有限公司开发的查收查引系统,据了解该系统与西安知先虽分属不同公司,但颇有渊源,功能类似,可合并考虑。

(5)宝和数据股份有限公司开发的查收查引系统[34](以下简称宝和系统)。该系统目前的用户集中在江苏地区,如南京大学、东南大学等,也有北京化工大学、重庆大学等众多外地区的用户。

2 部分查收查引系统功能对比

由于既定任务明确,因此无论何种查收查引系统,核心功能模块一致,均须包含题录信息提交、适配目标数据库、数据检索与获取、区分自引、导出报告这五大模块。除了这些涉及基本流程的核心模块外,系统还应当包含一些其他的功能,如用户管理、工作量统计、费用计算、权限管理等。本研究以查收查引系统的核心功能模块为对象,通过个案访谈及部分系统试用,对中科院、CALIS、北邮、知先、宝和这5家系统的详细功能进行对比。

2.1 题录信息提交

提交待检索的题录信息是查收查引系统工作的前提,也是用户接触到的第一个功能模块,系统支持的提交功能的灵活性、功能完备性,与用户感知到的系统易用性密切相关。5家查收查引系统在题录提交方式上的功能对比见表1。

从表1可以看出,几家系统在题录信息提交方面各有特点。中科院系统偏重特定模板的导入,其他的导入功能并未涉及,CALIS和北邮系统在本地库添加、在线检索和特定模板导入方面支持较为全面,知先和宝和系统尚不具有在线检索并导入功能。更具体的特定模板导入功能中,各个系统的侧重点并一样,不过并无优劣之分,均能覆盖主流需求。

另外,中科院系统没有用户端,所以需要馆员在系统中提交待检索的题录信息,而其他系统的题录信息均由用户在提交委托时候自行上传,这更有利于提升馆员工作效率,当然,如何平衡用户提交题录信息的便利性和系统对题录信息可靠性的要求,是需要着重考虑的问题,这也是调研中发现有些机构的系统有用户端,但却未被开放给用户使用的原因。

2.2 适配目标数据库

可检索的数据库数量,决定了系统覆盖面,系统适配的数据库越多,涉及到的功能也越复杂,相应馆员需要手工检索的情况就越少,这可显著提高工作效率。表2梳理了5家查收查引系统可检索的数据库范围。

由表2可知,在可检索的数据库方面,五家系统在WOS核心合集及其子库、EI、SCOPUS、CSCD、CSSCI、JCR等常用数据库方面大体没有差别。宝和系统在EI、CSSCI等常见数据库的支持方面有些不足,在影响因子和分区检索方面的表现不错。CALIS系统特色是支持WOS平台上数量众多的数据库,比如WOS总库、MEDLINE、INSPEC等,但不支持CNKI、万方等中文平台的查收查引。其余三家支持的数据库较为均衡,相对而言,北邮软件在可检索的数据库方面表现不俗,值得关注。

表1 五家查收查引系统支持的题录提交方式

从表2中也可以发现,并没有一个系统可以覆盖所有数据库,另外,随着图书馆事业的发展,新的查收查引需求不断涌现,比如ESCI检索、AMI检索、期刊总被引分区等需求也在不断拓展业务的边界,增加数据库的需求永无止境,无限满足需求会因边际成本增高的问题变得不太现实,这提醒我们,要对查收查引系统有一个理性认识,另外系统的设计者需在特定环节给手工报告留下空间。

2.3 数据检索与获取

数据检索与获取是整个查收查引系统的核心功能,系统检索过程的准确度、易用性十分重要。这方面各个系统各有强项,比如中科院和北邮系统支持汉英翻译,用户上传的中文题录信息可被自动翻译为外文进行SCI、EI等数据库的检索,这是增加系统查全率的重要举措。CALIS和北邮系统检索策略可查看和编辑,此项功能可增加馆员对系统结果的信任,减少人工核对成本。北邮系统具有机构成果库的功能,支持定期统计和发布本机构在各数据库商的收录成果,并自动发送收录通知到老师或科研秘书。西安知先有特色的代理检索,可以通过代理模式检索到非本馆馆藏的资源。宝和系统支持脱机和联机查询的选择,可以利用已经存在的机构库数据,满足特定工作需求。

取回结果后,对于机器无法判断的情况,各个系统均提供的了疑似结果的人工判断功能,其中,中科院系统可批量展示疑似结果,节省了人工确认的时间。另外,针对系统漏检的情况,CALIS和北邮系统都具有丰富的人工添加功能。比如CA⁃LIS系统支持Text、GB/T国标、SCIBIB、Excel、CSS⁃CI_TXT、EndNote等格式的人工添加,北邮系统Text格式的上传功能非常丰富,支持WOS、SCO⁃PUS、EI、CSCD、CSSCI、CNKI等数量众多的数据库。

2.4 区分自引及导出报告

区分自引为查收查引工作流程中的重要环节,因需要耗费大量人工而颇受关注。本次调研5家系统在区分自引方面的功能如表3所示,可见这一需求在几家系统中均有实现,整体支持率效果较好。中科院系统未涵盖区分第一作者的功能,另外实际工作中也会遇到其他一些特殊的区分自引需求,这些功能未涵盖与实际工作中使用较少有关。

另外调研时发现,北邮系统和知先系统支持总他引次数的计算。系统可以排除一篇文章被不同数据库引用时,有重复引用的情况,比如北邮系统,以SCI为优先的顺序,逐个排除后续数据库引用次数中的重复引用记录,以计算去重后的引用次数。这一功能使得以往难以开展的总他引次数的服务,变得可以讨论,这一课题需要持续关注。

导出报告时,各个系统均需按照使用方提供的模板导出相应报告,使用机构不同,报告模板便不一样,这方面的个性化显著,故不再赘述。值得一提的是调研中发现北邮系统可自动计算第一作者、通讯作者、共同通讯作者等的收录和引用数,虽然文章是否属于第一作者等的标注由用户在客户端提交时完成,这种方式值得探讨,但也十分有益。另外,知先系统的检索报告导出时论文排序用户可自行选择,也可按被引频次升序或降序排序以及按作者排名进行排序。

3 查收查引系统功能优化策略

通过调研发现,当前主流的查收查引系统在主要功能模块方面均支持良好且各有特色,未来在互相吸收借鉴优势的基础上,可考虑从以下方面开展系统功能优化。

3.1 业务处理全流程化

目前,各个查收查引系统在核心功能方面均实现了较为完备的功能,未来需要继续丰富和完善查收查引工作流程前端和后端的功能,实现全流程业务管理。比如,用户提交委托是查收查引流程的起点,在用户端实现实时查看委托进度,自行检索并确认题录信息等功能,会显著提升用户使用体验和馆员工作效率。另外,当前系统普遍没有开发或整合签章、缴费、发票和物流系统,未来,用户在线缴费后实时获取电子报告和发票或查看纸质报告的快递信息,无疑将进一步提升用户满意度并减少馆员沟通成本。另外,查收查引系统作为一个业务系统,往往不是单独存在的,其中的用户管理、流程管理、档案管理等功能需要考虑与其他业务系统实现互联互通,共同搭建平台级应用。

表3 五家查收查引系统区分自引功能

3.2 提升查全查准率

查全查准是对查收查引系统的根本要求,当前的查收查引系统在基本满足实际工作需要的前提下,总有各种情况影响查全查准率。究其原因,系统开发时考虑的情况有限,难以穷尽用户提交题录和待检索数据库中的各种情况,比如检索国外人名、少数民族人名或者标题等字段中有特殊字符时,系统都可能因考虑不全而漏检,这些例外情况虽然偶发,但不可预见,需要馆员核对所有结果后才能发现例外情况,影响服务效率的提升。这一问题的解决首先有赖于软件开发者通过多年服务积淀,持续精进,更全面地考虑系统运行过程中遇到的各种情况,另外可考虑引入规范库,实现人名、刊名等的规范化管理并向馆员开放管理权限,方便日常积累。

3.3 业务系统移动化

当前查收查引系统基本是在PC端实现的,很少涉及移动端,随着移动互联网的发展,基于手机App、微信公众号或小程序等的应用越来越流行,尤其是受到疫情影响,非接触式服务以及自助式服务的需求盛行,在服务过程中发现,时常有用户提出希望在移动端提交委托和获取结果,实现一部手机全搞定,而当前多数查收查引系统由于设计之初未考虑移动端的应用,直接用手机浏览器访问会因兼容性不足而无法正常显示页面或页面虽能显示,但提交和下载等功能失效。未来查收查引系统需考虑满足用户的移动化服务需求,通过适配移动端浏览器或开发基于手机App或微信平台的系统,实现泛在服务。

致谢:本研究得到国家图书馆鲁玥、杨东波老师,北京大学图书馆唐勇老师,北京邮电大学图书馆陈嘉勇老师,西安知先销售经理闫敏老师,军事科学院图书馆郑斐老师的支持和帮助,在此表示衷心感谢。

猜你喜欢
北邮题录检索
听YoYo讲李白的故事
大学生(2021年10期)2021-10-20 23:24:31
智能机器人“北邮一号”正式亮相
科学导报(2019年24期)2019-09-03 04:33:02
2019年第4-6期便捷检索目录
北京邮电大学:“编程王国”欢迎你
近刊题录
近刊题录
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
NoteExpress 在撰写文章综述时的技巧解析
第18次全国焊接学术会议论文题录
东信北邮再次助力中国移动新一代营业厅建设
电信科学(2012年7期)2012-04-01 19:39:23