河南省地方文献联合目录合作平台系统建构研究

2016-11-07 02:58孔德超
河南图书馆学刊 2016年10期
关键词:馆藏河南省文献

孔德超

(河南省图书馆,河南郑州 450052)



河南省地方文献联合目录合作平台系统建构研究

孔德超

(河南省图书馆,河南郑州450052)

河南省地方文献;文献联合目录合作系统;检索系统

地方文献整理是图书馆文献信息资源建设的重要补充方式。河南省未能形成统一的地方文献联合目录体系,呈现为各自为战、缺乏共享、品种重复等现象。为此,依托河南省图书馆,联合公共、高校图书馆,着手开发由河南省地方文献目录数据中心、河南省地方文献目录检索系统、河南省地方数字资源互访系统及河南省地方文献数据分析系统4部分组成的河南省地方文献联合目录合作平台系统,以期统一地方文献联合编目与共享,最大化地发挥地方文献的作用。

地方文献是指反映某一地区政治、经济、科技、文化、教育、艺术、卫生、体育、历史、地理等重要内容的文献资源[1],其收藏范围包括有关本地方的文献或由本地方人士编著的文献以及由本地方编辑出版的文献[2]。地方文献承载着一个地区的发展脉络,是一个地区客观缩影和文化底蕴的集中反映。地方文献和一个地区的各项工作有密切的关系,对经济建设和社会发展至关重要。不论是从制订地区发展规划、开发地方资源,还是到规划人文旅游、发掘地方特色、研究地方任务、历史以及编纂地方史志,都离不开地方文献。目前河南省还没有统一的地方文献联合目录信息,没有明确统计出全省地方文献的不重复品种,很多图书馆投入大量资金做地方特色数据库,但没有条件与其他图书馆共享,致使各图书馆特色地方资源不能实现全省互访共享。研发河南省地方文献联合目录合作平台系统,汇集河南省各类型图书馆地方文献联合目录信息,具有重大现实意义。

1 河南省地方文献联合目录合作平台系统建构意义

2015年,全国出版新品种地方文献5万种,其中河南省出版机构出版1,600种左右(不含中小学教辅),外地出版河南省地方文献内容约300种。另外,再加上各类型非正式出版物、图书、影像及各类型文献全年品种达1万种以上[3]。因资金有限,图书馆难以全部采购,只能选择性采购,这就造成了各个图书馆的重复式漏采现象,即有些品种重复性购买,而另一些品种又都没有采购。长期以来,因没有统一的合作平台,河南省无法统计出全省准确的地方文献品种数量以及各图书馆的确切馆藏。河南省图书馆根据全省地方文献的馆藏现状,联合各地方图书馆、郑州大学图书馆以及河南大学图书馆,并组织一批专家在全省范围内对地方文献进行目录的收集、整理工作,统计各图书馆馆藏以及各馆准确的馆藏目录信息,根据全国出版信息及馆藏信息,提供准确的馆藏文献的出版地或馆藏地,为河南各个地方文献研究机构提供数据支持。同时,利用河南省图书馆的技术优势,研发出的河南省地方文献联合目录合作平台是将上述设想通过大数据分析,采用先进技术实现整理、查询及分析功能的有效统一体。

目前一些图书馆建有地方资源特色数据库,该系统的完成可以达到资源互访的目的,提高资源利用率。特别是编目联合中心的建立,可以使各图书馆实现资源共建共享的目的。系统对读者群体及借阅趋势的分析也是借助“互联网+”的科技模式,将科技与图书馆业务有机地结合在一起,发挥大数据功能,使该系统的应用成果可以在取得社会效益的同时产生经济效益。该系统的完成,可以使全省各类型图书馆地方文献资源得以统计梳理,能详细了解全省地方文献资源现状,有利于以后的科学馆藏建设,丰富河南省内馆藏文献资源。

2 平台系统建构的内容与技术支持

河南省地方文献联合目录合作平台系统的建构主要是将全省图书馆地方文献馆藏资源数据加以收集、整理分析,通过系统统计出全省的地方文献馆藏品种和全部出版书目进行对比,查漏补缺,完善河南省区域文献资料的馆藏。

2.1平台系统建构内容

河南省地方文献联合目录合作平台由河南省地方文献目录数据中心、河南省地方文献目录检索系统、河南省地方数字资源互访系统及河南省地方文献数据分析系统4部分组成。

2.1.1河南省地方文献联合目录数据中心。河南省地方文献联合目录数据中心主要收录河南省不同类型图书馆馆藏地方文献数据,不但包括地方文献基本数据、书目数据、读者数据、特藏数据等,同时也包括电子资源、古籍善本、非书资料、地图等书目记录,能连接图片、影像、全文数据库的多媒体联合数据库,甚至一些纸质地方文献通过数字化处理后呈现出的书目信息。河南省地方文献联合目录合作研发系统计划到2017年年底完成累计160余万条书目记录、600余万条馆藏信息。目录数据库涵盖地方文献的印刷型图书、连续出版物、电子期刊和古籍等多种文献类型,覆盖中文、西文和日文等语种。数据中心涉及数字资源聚合的问题,数字资源聚合是指运用一定的技术与手段,将分布异构的海量数据资源聚合起来,通过加工排序的处理,使其形成一个整体,并呈现出知识性、便利性与规律性[4]。数字资源聚合主要是通过数字资源语义分析与关联聚合的方式,来构建基于语义关联的知识聚合模型,达到数字资源聚合的目的,同时也为后期河南省地方文献目录检索与数字资源互访提供便利的条件。

2.1.2河南省地方文献目录检索系统。河南省地方文献目录检索系统可以使省内各图书馆的地方文献馆藏信息通过检索系统查询、借阅到本馆未收藏的资料,有利于读者服务工作,并且通过馆藏目录检索,可以对所缺少的文献进行查漏补缺,完善全省统一的馆藏资源。地方文献目录检索的前提在于科学、合理的分类。地方文献分编包括历史文献资料与近现代地方文献资料[5]。辛亥革命之前历史文献资料采用四库分类法,即“经、史、子、集”划分;民国时期的近代地方文献史料往往运用《中小型图书馆图书分类法》;现代地方文献分类多采用杜定友先生的《中国图书馆图书分类法》的统一分类法。一些特殊地方文献分类,例如全国方志目录,通常采用权威的《中国地方志联合目录》《中国地方志综录》《中国地方志总目提要》等。河南省地方文献分类基本上按照以上时间阶段划分。

2.1.3河南省数字资源互访系统。目前,河南省很多图书馆做出了有浓郁地方特色的文献数据库,但因没有统一的发布平台,其他图书馆无法访问。数字资源互访体现了知识共享、共知、开放获取的理念。河南省地方数字资源互访系统可以使各图书馆富有地方特色馆藏的数字资源对读者开放,使资源共享的目标得以实现。该系统将提供共享平台,解决资源上传与共享问题。

2.1.4河南省地方文献数据分析系统。地方文献数据分析系统一是通过对借阅目录的数据分析,科学地开展地方馆藏工作,了解读者实际需求,有的放矢地发挥地方馆藏资源的价值。二是通过对读者信息数据分析,了解不同行业、不同年龄读者的差异需求,根据读者借阅数据,为出版社提供图书类别发行对象的分析报告,为各图书馆资源共建共享提供理论数据的支持。

2.2平台系统技术支持

河南省地方文献联合目录合作平台系统的研发突破传统模式,运用图书馆学与科技手段相结合的方式对标准MARC图书编目、馆藏数据和非标准特藏资源数据进行处理、分析。

为保证提供离线计算、即席查询、实时计算、实时查询这几个方面的功能,大数据平台采用hadoop+spark+hive的数据架构[6],其中hadoop的HDFS分布式文件系统解决存储问题;hadoop mapreduce、hive、spark application、sparkSQL解决离线计算和即席查询的问题;spark streaming解决实时计算问题;另外,采用HBase解决实时查询的问题。除此之外,平台中不能缺少任务调度系统和数据交换工具:任务调度系统解决所有大数据平台中的任务调度与监控;数据交换工具解决其他数据源与HDFS之间的数据传输。该系统采用SkyNet调度监控系统,其具有分布式架构、高可用性、高容错性、完善易用的Web用户界面、支持任意类型的任务、完整的日志记录、任务之间的灵活依赖、灵活多样的告警规则等特性。

河南省地方文献联合目录合作平台系统建立有稳定、高效、大容量、节能、环保的数据中心,计划采用目前大数据中心流行的冷通道机房,达到提高制冷效率、节能减耗的目标;建立集群服务器虚拟化,提升灾备能力,HBA光纤高效SAN存储、硬件设备IOE(IBM、Oracle、EMC)用于保障数据安全。

为保证河南省地方文献联合目录合作平台系统的正常开发并尽可能地完善设计,河南省图书馆采用Welcom公司的OpenPlan作为开发的管理工具。Open Plan可以根据需求在不同的级别上,针对不同的部门或兴趣产生各种数据报表,自上而下实现分解资源、资源优化、费用控制、风险分析等,有效保障项目开发、执行各个环节的顺利进行。根据以上分析,河南省地方文献联合目录合作平台系统模型建构如下(见图1)。

图1 河南省地方文献联合目录合作平台系统建构示意图

2.3平台系统实施方案

本项目前期将陆续完成项目需求分析、项目可行性分析和研发工具及人员的准备、联合目录平台的开发、数字资源的互访系统的开发、目录检索系统及借阅书籍分析模块的开发工作,并收集河南省地方文献目录馆藏数据,组织专家对地方文献目录进行整理、分类,项目验收合格后开始在省内图书馆中推广实施,预计实现建立起涵盖80%以上的图书馆馆藏的河南省馆藏信息数据库的目标。

3 结语

河南省处于中原大地,是一个历史悠久的大省,各地方图书馆保存着丰富的特色文献,但由于各种原因,我们无法准确了解地方文献的馆藏分布。通过河南省地方文献联合目录合作平台可以把这些特藏展示出来,并通过对这些丰厚的地域文化资源进行开发利用,使宝贵的地方文献资源在本地经济社会的发展进程中发挥重要的作用,使其产生巨大的社会效益和经济效益。同时,通过平台中的技术功能,可以检索目录,实现资源共建共享,特色数据库系统可以实现资源互访共享功能,以便尽快让读者看到省内特色数据库资源,实现资源的使用价值。合作系统的研发实现了数字资源共享,便于各馆之间数据交换和读者进行目录检索,有利于读者查阅,以更好地为读者服务。

现阶段,关于地方文献的市场需求数据无法统计,造成出版社的盲目选题和库存积压。而通过该系统的大数据分析可以为出版社提供数据支持,并可大大减轻出版社的库存压力。全国580余家出版社(截至2014年年底,全国共有出版社583家(包括副牌社33家)[7]有此类需求的出版社在200家以上。同时本软件通过大数据的分析可与相关产品厂家合作,特别是分析高校学生读者借阅数字资源的内容数据,可以利用大数据资源,了解读者阅读趋向,开发相应产品,促进智慧型图书馆的建设,为整个图书出版行业的建设贡献力量。

[1]邓福泉,杨宏.地方文献统一分类研究[J].图书馆理论与实践,2016(1):69-70.

[2]赵萍萍.关于机读目录中地方文献主题标引的探讨[J].国家图书馆学刊,2003(2):80-83.

[3]杨超.公共图书馆地方文献的征集与利用刍议[J].图书情报导刊,2016(3):11-12.

[4]张建红.基于语义关联的海量数字资源知识聚合与服务研究[J].图书馆工作与研究,2016(8):44-47.

[5]李妹.近代地方文献分类实例探析:以云南省图书馆为例[C].中华医学会第二十一次全国医学信息学术会议论文汇编,2015:555-559.

[6]吴黎兵,邱鑫,叶璐瑶,等.基于Hadoop的SQL查询引擎性能研究[J].华中师范大学学报(自然科学版),2016(2):174-182.

[7]江水.2014新书出版种数微降:《2014年全国新闻出版业基本情况》出炉[N].图书馆报,2015-09-15.

(编校:崔萌)

2016-09-10

孔德超(1968—),河南省图书馆馆长,河南省图书馆学会理事长,研究馆员。

G253

A

1003-1588(2016)10-0113-03

猜你喜欢
馆藏河南省文献
馆藏
河南省树人教育交流中心
河南省树人教育交流中心
河南省树人教育交流中心
河南省树人教育交流中心
Hostile takeovers in China and Japan
博物馆的生存之道:馆藏能否变卖?
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
知还印馆藏印选——古印篇
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges