郑燕平
(淮阴师范学院图书馆,江苏 淮安 223300)
图书采访是图书馆文献资源建设的一项重要工作,是决定图书馆文献资源建设质量和服务水平的关键因素之一。 目前图书馆图书采访的方式主要包括预定、现采、网购等,其中现采方式因其具有直观性、及时性、互补性和互动性等特点,深受图书馆欢迎,是目前除预定之外应用最多的图书采访方式。 图书馆在采用现采方式进行图书采访时,需制定高效可行的现采查重方式,以提高现采查重质量与效率,保证图书订购质量。
图书查重是图书馆采访工作的一项重要流程,是避免图书重复采购、保证订购质量、节约经费的重要措施。 图书现采查重不同于在馆查重,其查重质量与效率取决于以下几个方面。
采访人员进行图书查重工作时所用的图书馆馆藏信息数据库被称作查重对比库。 查重对比库是图书查重的基础,该库不仅包括所有的馆藏书目信息数据(含在订书目信息数据),如ISBN、题名、责任者、出版社、版本、丛编等信息,而且还包括所有与馆藏图书相关的附属信息和统计信息等,如借阅率、复本量、馆藏地等信息。 现采查重所采用的查重对比库越完整则其查重结果的准确性就越高,所能反馈的馆藏信息就越全面,越有助于采访人员做出正确的订购判断。
查重条件设置决定采访人员可使用的查重途径。 图书查重条件一般有ISBN、题名、责任者、出版社、丛编名等,但在现采查重时为提高查重效率,采访人员往往仅采用ISBN 作为查重条件。 单一采用ISBN查重会因一书多号或一号多书或因1987 年前出版发行(没有ISBN 号)图书重印的情况,导致采访人员出现误判。避免这些情况出现的最有效办法就是增加查重条件,当采访人员认为ISBN 查重结果有误时就可以采用其他的查重途径进行二次查重或组配查重,从而提高查重结果的准确率。
图书查重结果是采访人员进行图书采选的重要参考依据。 查重结果显示的信息中借阅率、在馆数量和在订数量等信息可以帮助采访人员对已购图书是否需要进行增补做出判断;馆藏地信息可帮助采访人员判断已购图书是否为院系资料室自购,而图书馆未购图书,防止漏订;丛编信息可帮助采访人员对馆藏丛书和套书进行补漏。 查重结果显示的信息越多,越有助于采访人员在现采采选时做出科学合理的分析判断,从而提高现采图书的质量。
查重方便性决定了现采查重方式的可行性与使用率。查重方便性包括携带方便性和使用方便性两个部分。携带方便性就是要求现采查重所使用的查重设备应轻便化。这是由于图书现采场地一般较大,采访人员在现采时需要不断走动变化位置,如果查重设备过重过大会大大增加采访人员的工作负担。 使用方便性则主要针对图书信息数据输入而言。 图书现采时采访人员要面对上百家出版社出版的数万种图书,并在较短的时间内完成采购任务, 这就要求采访人员要以最快速度将图书信息数据输入到查重系统中。为提高现采查重工作效率,采访人员在查重方式的选择上往往会首先考虑查重方便性。
依据图书现采查重所采用的查重对比库的不同,可以将现采查重方式划分为以采访人员所记忆的馆藏信息作为查重对比库的传统人工记忆查重方式,以图书馆系统中导出的备份馆藏数据作为查重对比库的备份数据库查重方式和通过互联网远程登录到本馆的服务器上, 进行实时查重的互联网实时查重方式三种类型,它们之间的比较如表1 所示。
图书馆现代化建设之前,人工记忆查重方式是现采查重的主要方式,该查重方式不需要借助任何现代化技术,仅依靠采访人员对馆藏的了解程度,通过题名、责任者等信息进行查重。 这种查重方式当馆藏量较少时其查重质量较好,但当馆藏量超出采访人员记忆能力时其查重质量则显著降低。 目前人工记忆查重方式依然被部分未完成现代化建设的小型图书馆所采用。 随着大部分图书馆现代化建设的完成,越来越多的图书馆在现采查重时引入了现代技术以提高查重质量。
备份数据库查重方式在这一时期快速发展起来。早期的备份数据库查重方式需要以笔记本电脑和条码扫描器作为查重工具,并且笔记本电脑中要安装单机版的征订查重软件。当采集器出现后,因其待机时间长、重量轻、使用方便等特点,很快取代了笔记本电脑。 备份数据库查重方式在查重质量上有了较大的提升,但其在使用中也存在较多的不足之处,如:备份数据导入时间长;采访数据无法实时更新,易出现重购情况;须进行二次采访数据处理等。
为克服备份数据库查重方式存在的不足,部分图书馆系统商专门开发了互联网实时现采系统,互联网实时查重方式应运而生。互联网实时查重方式具有众多优势,以汇文图书外采系统为例,该外采系统的客户端可以通过无线网络实现与图书馆馆藏信息数据库保持实时数据交流, 并且提供多订户实时订购;设置多种查重条件;查重结果可显示书目记录、在订数量、在馆数量、流通量、馆藏地、征订号等信息供采访人员分析判断;采购数据同步传回图书馆采访系统中,不必进行二次数据处理,减少了重复工作量[1]。互联网实时查重方式实现了在馆查重的所有功能,其查重质量与在馆查重质量相一致,是现采查重的发展趋势。 然而,目前互联网实时查重方式因其查重方便性较差而使用率非常低,比如:要配备笔记本电脑作为客户端和条码扫描器作为输入设备;要有良好的无线网络环境;采用非ISBN 查重途径进行查重时其信息输入速度较慢等。
现代技术的发展,特别是云计算、4G 网络、二维码等技术在图书馆中的逐步应用,将使互联网实时查重方式的查重方便性得到极大提高。
终端设备使用与携带的不方便是互联网实时查重方式不被采访人员接受的一个重要原因,而云计算在图书馆中的应用将使实时查重终端设备轻便化成为可能。 云计算的概念目前存在多种不同的解释。2011 年9 月美国国家标准技术研究院(NIST)的云计算规范推出之后,业界的认可度非常高,几乎可认为这是目前最权威的云计算定义[2]。 即:云计算是一个模型,这个模型可以方便地按需访问一个可配置的计算资源(例如网络、服务器、存储设备、应用程序以及服务)的公共集。这些资源可以被迅速提供并发布,同时最小化管理成本或服务提供商的干涉。 云计算三种服务模式包括:基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)[3]。
SaaS 是一种通过互联网提供软件的模式,厂商将应用软件统一部署在自己的服务器上,客户可以根据自己实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并通过互联网获得厂商提供的服务[4]。在SaaS 模式中,客户端不需要安装任何类似传统模式的客户端软件。 用户只要使用具有联网功能的终端设备就能随时随地通过互联网进行应用软件的管理和操作。 SaaS 模式正在流行,越来越多的图书馆应用和服务(包括图书馆管理系统,流通、采访、编目、电子资源管理等)都将SaaS 化。美国、日本、印度等国家都已经出现了基于SaaS 的图书馆管理系统[5]。基于SaaS模式构建的图书馆管理系统将改变目前互联网实时查重方式必须依靠笔记本电脑作为客户端来安装客户端软件的限制,采访人员仅需携带一部可以联网并可以扫描条码的终端设备就可以进行现采工作。 这类终端设备包括智能手机、可联网的采集器等,在使用与携带方便性上能完全达到采访人员的要求。
无线网络是制约互联网实时查重方式普及的另一个瓶颈。笔者曾向使用汇文外采系统的采访人员了解该系统的使用情况,得到的答复除了反映笔记本电脑携带不便外更多的是抱怨网速太慢,导致单本图书的查重时间大幅增加,同时网络的稳定性太差,时常掉线,严重影响现采工作效率。4G 网络技术是未来无线网络发展的趋势,其超高速的网络传输特点,将打破制约互联网实时查重方式普及的网速瓶颈。
4G 是第四代移动通信及其技术的简称,是集3G 与WLAN 于一体,其开发更加具有明确的目标性:提高移动装置无线访问互联网的速度。 4G 系统能够以100 Mbps 的速度下载,比拨号上网快2 000 倍,上传的速度也能达到20 Mbps,并能够满足几乎所有用户对于无线服务的要求。 4G 能够对跨越公众的和专用的、室内和室外的多种无线系统和网络提供无缝的服务,对无线频率的使用效率比第二代和第三代系统都高得多,且抗信号衰落性能更好[6]。2012 年国际电信联盟在无线电通信全会全体会议上,正式审议通过将LTE-Advanced 和WirelessMAN-Advanced(802.16m)技术规范确立为IMT-Advanced(俗称“4G”)国际标准,中国主导制定的TD-LTE-Advanced 同时成为IMT-Advanced 国际标准[7]。 2013 年中国移动建设的网络计划覆盖全国地市级以上的100 个城市,基站数量超过20 万个,覆盖人口超过5 亿,网络建成后将成为目前为止全球最大的4G 网络[8]。除了中国移动外,中国电信和中国联通也已表态,将加快推进4G 网络的商用进程,并宣布在上海等地进行4G 网络规模测试和各项试商用测试[9]。 随着4G 网络的逐步建设与普及,制约互联网实时查重的无线网络问题将得到根本的改善。
表1 图书现采查重方式比较
图书信息自动化识别技术是提高互联网实时查重效率的关键。图书信息自动化识别主要依靠条码技术,采访人员通过扫描条码从而获得条码中的信息。 图书采用的条码目前为一维条码,仅能存储ISBN 信息, 单一的ISBN 信息存储能力无法满足互联网实时查重方式中多条件查重与实时生成订购数据对图书信息的需求,这些图书信息至少应包括ISBN、题名、责任者、版本、丛编、出版社、价格等。 要存储如此巨大的信息量,必须采用新的条码技术。
二维码(2-dimensional bar code),是相对于一维码而言的,它根据某种特定的几何图形,将数据符号信息按一定规律记录在平面(二维方向上)分布的黑白相间的图形内。 在代码编制上,它巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息,通过图象输入设备或光电扫描设备自动识读以实现信息自动处理。 二维条形码能够在横向和纵向两个方位同时表达信息,因此能在很小的面积内表达大量的信息[10]。 以具有我国自主知识产权的“汉信码”为例,在打印精度支持的情况下,每平方英寸最多可表示7 829 个数字字符,2 174 个汉字字符和4 350个英文字母[11]。如此大的存储量完全能将图书的MARC 数据信息存入其中,而采访人员仅需使用条码扫描设备就能将图书信息输入到查重系统中,节省大量的信息输入时间。 二维码技术已经开始在图书馆管理系统中得到应用,如汇文系统4.5 版本已在书目详细信息中添加了二维码动态生成功能,读者可方便地用手机记录图书信息。 然而,目前国内常见的二维码都是从国外引进,大多基于英文、日文信息字符集设计,表示汉字效率不高,不能满足我国汉字信息化自动采集的需要。 如汇文所采用的QR Code 来源于日本,虽然是目前支持汉字最好的二维码制,但也仅支持汉字GB 2312 字符集[12]。 而由我国自主研发的“汉信码”则可支持GB18030 大字符集,但目前“汉信码”的普及率相对较低,要想将其应用于图书发行管理中还有较长的路要走。
互联网实时查重方式具有与在馆查重相一致的查重质量,是图书馆现采查重的发展发向。 目前由于互联网实时查重方式在查重方便性上还存在较大的不足,其还无法取代备份数据库查重方式,而云计算、4G 网络建设和二维码技术则可以分别从终端设备轻便化、 网络高速化和信息采集自动化三个方面提升互联网实时查重方式的查重方便性。 这些现代化新技术在图书馆中的广泛应用,必将对互联网实时查重方式的普及起到重要的推动作用。
[1] 图书外采系统[EB/OL].[2013-04-05].http://www.libsys.com.cn/waicai.php.
[2] cloud.云计算的NIST 定义[EB/OL].[2013-03-11].http://w-w.cn/article-1254-1.html.
[3] Peter Mell, Tim Grance. The NIST Definition of Cloud Computing [R/OL].[2013-03-11].http://csrc.nist.gov/publications/nistpubs/800-145/SP800-145.pdf.
[4] 康美娟.基于SAAS 理念整合CALIS、CASHL 构建高校文献保障服务联盟[J].图书馆,2010(3):29-31.
[5] 肖小勃,邵 晶,张惠君.CALIS 三期SaaS 平台及云服务[J/OL].图书情报工作网刊,2012,52(3):52-56[2013-04-04].http://www.kmf.ac.cn/tabid/583/InfoID/2504/frtid/816/Default.aspx.
[6] 4G[EB/OL].[3013-04-04].http://baike.baidu.com/view/27827.htm.
[7] 左诚.4G 国际标准正式审核通过 我国TD-LTE 入选[EB/OL].[2013-04-04].http://www.c114.net/news/16/a666834.html.
[8] 潘敬文.广东建成全国最大规模4G 网络[N/OL].信息时报,2013-03-12(A3)[2013-04-04].http://informationtimes.dayoo.com/html/2013-03/12/content_2177021.htm.
[9] 侯云龙.中移动1800 亿启动4G 建设[N/OL].经济参考报,2012-10-10(A01)[2013-04-04].http://dz.jjckb.cn/www/pages/webpage2009/html/2012-10/10/content_50698.htm?div=-1.
[10] mayz.二维码简介以及应用前景分析[EB/OL].[2013-04-04].http://www.evget.com/zh-CN/info/catalog/18217.html.
[11] 马小春.汉信码开启中国二维条码发展新纪元[EB/OL].[2013-04-04].http://www.gs1cn.org/News/article.aspx?&id=6224.
[12] QR 码[EB/OL].[2013-04-04].http://baike.baidu.com/view/985086.htm.