余 艳
(湖南工业大学 ,株洲412008)
在图书馆的馆藏管理和利用过程中,随着服务工作的开展会产生大量的数据,如何从这些原始数据中提炼有价值的信息,是开展文献深层服务的基础。在信息技术不断发展的今天,图书馆的服务不断延伸,馆藏布局不断拓展,文献典藏工作的频率不断加快,新的工作模式不断产生,动态典藏机制逐渐被图书馆所采用。动态典藏机制能很好地反映读者的需求变化和馆藏布局,有助于图书馆优化馆藏文献分配[1]。通过大量实践,在文献动态典藏过程中使用其工作流程中的来源数据(即上游数据)进行分析提炼,并将其应用到文献典藏工作中,不但加快了文献典藏速度,解决了典藏数据的准确性,而且为实现动态典藏和典藏自动化积累了丰富的经验。
文献典藏涉及到的来源数据贯穿图书馆工作的全过程。具体来说,有采编验收数据、读者借还数据、专题分析数据、馆藏调整数据、利用率数据以及下架剔旧数据等。
图书采编数据是构成文献典藏数据最原始的来源,这些数据包含文献的采访来源数据、编目数据以及验收加工数据等。通过采编整理加工,揭示了文献的实体、属性等各个概念之间的层次关系。将文献的书目数据与馆藏数据进行整合,并与文献典藏规范进行匹配和筛选,提取特定的典藏数据,能方便地使用批量典藏方式进行文献典藏。
读者借还数据是馆藏文献利用的直接表现。目前高校内部跨校区的馆藏布局基本采用通借通还的管理模式,读者习惯于就近借还图书,通过对借还数据的馆藏处理,可分析出文献的流动位置,利用动态典藏机制,可实现文献位置与文献需求的动态平衡。
专题分析数据是指图书馆通过对某一专题的揭示而向读者推荐或展示的书目数据。这类数据一般时效性和针对性很强,结合馆藏情况将符合专题数据要求的文献调出,展示完毕后将数据还原为原馆藏状态。
馆藏调整数据主要是指图书馆随着馆藏结构的调整,对馆藏文献进行成批增减时的数据。这类数据在馆藏调整中需要进行类目划分、归架控制、转移决策等数据分析。在新馆建设规划、新增馆藏地以及馆藏调拨时经常需要对这类数据进行预处理,才能保证实物调整的准确性和科学性。
利用率数据,是在一定的时限内对馆藏进行利用率分析的数据。通过对数据的分析,了解读者对馆藏的需求情况,及时补充馆藏,调整典藏计划,满足群体读者的现实需求。
下架剔旧数据是指在利用或展示过程中造成破损而没有阅览价值的馆藏,以及相当长一段时间未曾利用且没有收藏价值的馆藏需要进行下架和剔旧处理。这些馆藏在数据处理时经常会出现实物与数据衔接不准或无数据来源的情况。
上述各类数据的处理,经常是与文献实物相关联的,因此,在数据分析与处理过程中,必定以采集的文献实物为参照,将大量的文献实物进行整序,是文献典藏中最关键的步骤。
文献实物采用何种方式进行整序,哪种整序方式是最佳选择,在文献典藏前就需要作好充分的准备。各种整序方法的灵活运用,是文献典藏质量保证的基础。整序是针对文献进行的,由于文献典藏涉及到的文献贯穿于图书馆工作的全过程,随着文献实物的流动和变化,典藏过程的整序始终将静态实物与动态数据相结合对照进行。
文献整序是指利用一定的规则、方法和技术对文献的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使文献从无序集合转换为有序集合的过程。文献整序方法主要有简单聚类和知识聚类两种[2]。简单聚类主要是指按照文献外部属性的逻辑关系来归类,这种易于表现和操作的聚类方式是典藏过程整序的主要方法。而知识聚类是指按照知识体系结构分门别类地运用分类法或主题法进行归类。这种方式的整序是图书馆进行文献展示的重要方法。
文献典藏的来源数据不同,其所对应的实物整序方法也不尽相同。一般来说,实物整序置于来源数据前,来源数据是通过实物整序的数据而获取的。具体有以下几种整序方式:(1)时序整序方式。这种方式主要体现在文献的流动过程中,如采编对文献加工的先后次序构成文献典藏前的数据来源,读者归还文献时间同样能构成按时间顺序进行的文献排序方式。(2)地序整序方式。馆藏地和读者借还点的区分,在典藏的来源数据中也有相当大的一部分,特别是在馆藏调整中,将某一馆藏点转换成另一馆藏点,一般采取调用馆藏点的所有数据作为来源数据,然后再进行析出典藏。(3)编号整序方式。针对一些毫无规律无序堆放的文献,宜采用一种自编规则的流水序号方式进行整序处理,将其与图书馆系统数据库的数据结合,提取其文献典藏的来源数据。这种方式一般应用于下架和剔旧文献的处理。(4)类目整序方式。当数据来源于专题分析数据和利用率分析数据时,来源数据先于实物整序数据,利用来源数据提取文献实物,进行一定方式的专题汇集或知识聚类。这种方式一般采用类目整序的方法,应用于专题展示或文献推荐中。(5)综合整序方式。由于工作环境和工作方式的差异,在进行同一批次的典藏过程中,往往会形成多种方式的序列文献,只要能进行有效区分,灵活利用来源数据,也能将文献实物准确地典藏。
随着文献资源的不断丰富和文献需求的日益增长,一些看似无序的文献,只要进行准确的来源数据分析,就能发现其实是有序的。整序工作只是一种概念而已,从无序中找出有序,才是研究文献典藏来源数据的重要目的之一。
多途径的来源数据给文献典藏带来多种形式的工作特征,数据分析与处理、实物核对与校验、流程监视与反馈等都是文献典藏过程的工作内容。来源数据的分析和处理可提高文献典藏的工作质量和效益,来源数据在文献典藏中的应用具体体现在以下几个方面:(1)数据提取。数据提取是从数据源中抽取数据的过程。根据文献典藏要求,对来源数据进行数据提取的方法有全量提取、增量提取和筛选提取几种。全量提取,或称作数据复制,是将来源数据原封不动地抽取出来,并转换成文献典藏要求可以识别的格式。增量提取只抽取来源数据中要新增或修改的数据,捕获变化的数据是增量抽取的关键。筛选提取,即抽取来源数据中符合典藏限定条件要求的部分数据。(2)质量控制。典藏质量控制是图书馆的关键性工作之一,典藏工作不是完全孤立和静止的,它与前期的数据工作和后期借阅工作存在着紧密的内在联系。前期的数据错误,如果没有进行质量控制,就会沿袭这种错误,从而影响图书馆后期工作的质量,也给后期工作质量控制带来一定难度。在典藏分配之前,对来源数据进行分析和校对,既可发现前期工作的错误和缺点,控制好前期工作质量,又可解决典藏过程中的差错,将典藏质量问题控制在最小的范围内。(3)动态典藏。从理论上说,没有一个绝对合理的典藏分配模式能同时满足各种用户的文献需求,因而需要建立一种具有自我完善和调节功能的典藏分配机制[3],动态典藏模式便应运而生。动态典藏模式可以灵活机动地调整藏书位置,实现各馆藏点的藏书优势互补和动态平衡,提高馆藏利用效益。通过对来源数据进行分析,可为动态典藏提供最佳的决策方案,改善文献动态典藏的运行机制,最大限度地满足读者的需求,提高图书馆的服务水平。(4)自动分拣。目前,在图书馆自动化业务系统中,主要通过人工来实现大量的借还书分拣工作,劳动强度大,作业时间长,不但增加了工作人员的工作量,而且拖延了图书归架的时间,同时由于工作人员的不可控性,图书分拣的准确率也难以提高。从目前条码技术在图书馆行业应用的成熟度和RFID技术研发应用的现状来看,利用来源数据的分析结果处理文献典藏过程中的分拣工作,既能配合当前的条码技术,又能适应RFID自动分拣技术,并能实时准确地实现图书的分拣自动化和信息化。随着RFID标签价格的降低和分拣技术的不断成熟,文献典藏的来源数据必会在图书馆工作中得到广泛的应用。(5)信息服务。图书馆的信息服务,能否对读者产生吸引力,很大程度上有赖于馆藏资源的深度开发。文献典藏中的来源数据来自于读者的需求反馈。通过对来源数据的分析,重新组合成再生信息,为馆藏资源进入读者流通借阅提供了再利用的信息渠道,同时也为馆藏资源的动态典藏提供了原始的数据依据。
文献典藏的来源数据是一种动态的工作数据,在图书馆的各项工作中几乎都能生成相应的来源数据,这些数据为下一项工作的顺利开展提供了最真实和准确的数据来源。随着图书馆文献典藏信息业务量的快速增长,传统手工典藏方式已明显不能保质保量地完成新增任务,对传统方法进行扬弃,使之更加科学化、系统化和最优化,采用新的思路去解决新的问题,来源数据的应用在文献典藏中已有非常明显的优势,能够给图书馆带来耳目一新的文献管理模式,简化了文献典藏流程。依据来源数据的分析,可概览文献典藏全局工作,形成文献利用的预警分析和趋势判断,同时也是图书馆信息服务发展的突破口。
[1]严敏斐,方向明,孙爱莉.基于动态典藏机制的馆藏评估体系的优化研究[J].图书馆界,2010,(5):39-40.
[2]罗时进.信息学概论[M].苏州:苏州大学出版社,1998.167-169.
[3]方向明.基于动态典藏机制的馆藏评估体系的优化研究[J].图书馆学研究,2009,(12):34-37.
[4]刘白秋.图书馆自动识别技术应用现状与比较分析[J].集成电路应用,2010,(4):26-28.
大学图书情报学刊2014年2期