高校图书馆特藏按需数字化探索

2015-04-07 15:47田甜
河南图书馆学刊 2015年3期
关键词:图书馆

关键词:图书馆;特藏;EBM;按需数字化

摘要:文章介绍了数字化的设备以及数字化过程中需要考虑的因素。图书馆可以引进EBM,借鉴国外的管理模式,大胆尝试对特色资源按需数字化,加速特藏的流通,更好地为读者服务。

中图分类号:G250文献标识码:A文章编号:1003-1588(2015)03-0096-02

1高校图书馆特藏数字化

普通高校评估要求高校图书馆有长期积累、独具特色的资源,每个高校都有自己的重点学科,所具有的电子资源也都各有侧重。在网络环境下,人类获取信息的手段和方式越来越多,图书馆馆藏如果仅停留在普通水平上,就与互联网无异。在检索方便快捷方面,图书馆与baidu、Google相比并不占优势。OCLC在2006年进行的一项全球调查显示,89%的高校学生首选Google等网络搜索引擎搜集信息资源,而选择图书馆的比例仅占2%。由此,高校图书馆如果想保持永久的生命力,致力于特色资源建设是其必然选择。特色资源的收藏并不是目的,其目的在于最大限度地实现资源共享,提供特色服务。如果所有纸质特藏资源内容都能提供电子目录摘要,那么在读者有需要时就可以按需数字化或打印,在共享的同时又保护了珍贵的原始资料。

2数字化的设备

书刊扫描仪是专为书刊、期刊、报纸、古籍、易损坏文档而设计的A2大幅面扫描设备,扫描出来的图像,可直接用于印刷。目前国内没有任何企业生产制造此类型的扫描设备,国内市场上也只有几个国外品牌的书刊扫描仪,国外有图书馆用这种书刊扫描仪把所有图书扫描成电子档,存储在数据库里,建立虚拟图书馆,供人们网上阅读。以下介绍3种图书扫描仪(机)。

2.1美国Kirtas全自动书刊扫描仪(Espresso Book Machine)

美国Kirtas全自动书刊扫描仪简称EBM,是技术先进、功能卓越和最受欢迎的书刊数字化的全自动电子设备,可实现自动翻页、自动扫描、批量数字化处理功能,可以把传统的印刷书刊、杂志以及很多珍贵的古代书籍知识以数字化的方式储存下来。 EBM是一种集成式按需印刷系统,主要由美国On Demand Books,LLC(ODB)公司的EspressNet软件系统、打印系统、书帖整理对齐系统、装订系统、裁切系统构成,其中EspressNet的软件系统相当于一个指挥调度中枢和核算中心,而打印系统、书帖整理对齐系统,胶订系统、裁切系统的功能则相当于一个印刷装订厂。该扫描仪2003年11月获得美国科学技术创新最优奖。据ODB公开的资料, 已经有近61台EBM安装在世界各地的书店、图书馆和大学。其中大学书店21家,独立书店19家,图书馆14家,其他连锁书店7家。剑桥大学出版社拥有一台,用来把剑桥图书馆收藏的重要的学生用书数字化。中国仅有一台,在中国出版集团。EBM主要用于绝版图书、专业性强的学术著作、个人出版和根据顾客需求专门定制的图书。

2.2谷歌图书扫描机

2004年12月,谷歌启动了一项名为“数字图书馆”的工程,即把全球知名大学和研究机构所属图书馆的藏书转化为电子书。这些图书馆包括斯坦福大学、哈佛大学、密歇根大学、牛津大学所属图书馆及纽约公共图书馆等。在谷歌启动“数字图书馆”之前,业界通常使用光学字符识别软件(OCR)来实现纸质书的数字化。但OCR软件要求被扫描的图书每页必须平整放置。而对于整本书籍来说,不损坏书籍装订的通行扫描方法是:将图书一页页打开放在玻璃面板上压平。另一种方式是把已装订的图书一页页拆开。由此可见,上述两种图书扫描方式效率都不高,且容易毁坏书籍。而谷歌所开发的批量化图书扫描技术解决了这一难题。谷歌向USPTO提交的图书扫描专利申请说明书显示,工作人员把被扫描书籍放入谷歌专门开发的图书硬件设备后,该设备所配备的红外技术摄像头将检测被扫描书籍的三维形态和角度,然后把该信息传输至OCR软件,并进行失真校准,使OCR软件能够更准确地识别被扫描文本。利用谷歌最新的图书扫描技术,被扫描图书既不用放在玻璃面板上压平,也不用将其一页页拆开,因此其扫描速度和准确率都大幅提高。2013年11月15日,谷歌与美国作家协会(Authors Guild)之间长达八年之久的版权争议告一段落,曼哈顿联邦地区华裔法官陈卓光(Denny Chin)做出判决,表示谷歌扫描图书是拥有益处的公平行为。谷歌电子扫描的内容是经过“高度改编的”,并不会侵犯原创市场。按照新的判决,谷歌将能够继续电子扫描存在版权争议的约2,000万册图书。

2.3DIY图书扫描仪

研究生Daniel Reetz 自制了DIY图书扫描仪,整个扫描仪由两个相机、两个小灯以及回收来的木板等组成,OCR软件则用的是开源。扫描一本400页的图书仅用时20分钟。耗时三天,总花费300美元(包括2台佳能Power shot A590相机)。使用这个扫描仪也极其简单:将书本摊开放到V型托盘上,按按钮开始,翻页时当然也是“全自动”(全部自己动手),300美元的东西你不能寄希望它有多么智能。当然还存在其他问题,最为重要的是:自制图书扫描仪的版权问题,即你购买一本书后是否拥有了它所有形式的所有权。

田甜:高校图书馆特藏按需数字化探索田甜:高校图书馆特藏按需数字化探索3特藏按需数字化需要考虑的因素

3.1特藏数字化的后期制作

数字化后的图像有时会扭曲,所有图像页面需要裁切和修正。一般有自动和人工两部分,全自动扫描仪一般都具有裁切、移除不想要的部分等功能,根据书的大小,花费的时间也不等。有时也还需要人工用图像编辑软件来处理,这项工作大都外包。

3.2特藏数字化的质量、成本和数字化所需时间三者之间的关系

特藏数字化的质量、成本和数字化所需时间三者之间的关系为:质量越高,后期制作需要越多,花费越大;质量越高,后期制作需要越多,数字化持续时间越长;数字化持续时间越长,顾客的数字化请求越少。鉴于“客户”将支付前期数字化的成本,必须找到质量、成本、所需时间的最佳平衡点。笔者建议:①质量方面,如果图书馆是帮助读者尽快有效地得到信息,那么内容能满足用户需要就可以,不需要达到商业出版的作品质量。②时间方面,满足用户需要的数字化内容应该尽快交付,应该告知用户交付使用的时间表。③成本方面,如果前期的成本仍然很高,可以依据数字化的产品综合价值,降低首次数字化的成本,因为以后可能还会有大量用户,并非所有的数字化成本都必须由首位客户支付。数字化副本和打印品必须让一般的大学生用户能够负担得起,考虑到按需的属性,价位应该在学术文本书和大众平装书之间。

3.3数字化管理和存储设备

目前剑桥大学根据现存的打印和数字化流程,仅存贮PDF格式的文档。有些图书馆可能也想存贮高质量的JPG或者是TIFF格式的文件。图书馆在考虑按需数字化时,需要考虑以下问题:①假定外部有数字化图书馆,是否还有必要在本馆保存数字化的产品。②产权问题或者说原始资料的所有者是否授权。

4结语

综上所述,虽然最初的投资比较大,但EBM全自动书刊扫描仪提供了一种快速高效的全文数字化方式。当然,图书馆也可以租用设备或者使用第三方(代理)加工数字化。尽管在按需数字化服务中可能有高利润,但这种需求可能仅限于特定的读者。特藏重在用而不是藏,图书馆工作人员应该考虑怎样最大化地满足读者的需要,让特藏快速、高效地流通,更好地为读者服务。

参考文献:

[1]Ian Rowlands,David Nicholas, Peter Williams,etal. The Google generation: the information behavior of the researcher of the future [R]. Aslib Proceedings,2008(60):290-310.

[2]EBM Locations: List View [EB/OL].[2014-06-06].http://ondemandbooks.com/ebm_locations_list.php.

[3]谷歌胜诉 扫描图书是合法使用[EB/OL].[2014-06-06].http://it.sohu.com/201311

15/n390185443.shtml.

[4]图书扫描仪DIY仅300美元[EB/OL].[2014-06-06].http://www.molei.net/article/7976.html.

[5]Henry P.Zulu. Digitalization of Scholarly Works at the Special Collections of the University of Zambia Library[D].长春:东北师范大学,2010.

(编校:周雪芹)

猜你喜欢
图书馆
图书馆
迷宫弯弯绕
迷宫弯弯绕
图书馆
图书馆里静悄悄
气味图书馆
欢迎到图书馆做客
你会估算吗
去图书馆