罗 静
(贵州省图书馆, 贵州 贵阳 550004)
大数据背景下的资源建设与服务分析
——以贵州省公共图书馆数字资源建设和服务为例
罗 静
(贵州省图书馆, 贵州 贵阳 550004)
从大数据与公共图书馆资源建设的关系入手,通过对贵州省公共图书馆数字资源建设与服务的统计与分析,为贵州省公共图书馆今后的资源建设提出合理建议。
大数据; 贵州;数字图书馆
在人类步入大数据时代的今天,在呈爆炸性增长的信息数据环境下,通过大数据分析、云计算、数据挖掘等技术手段进行专业化处理,原本看起来分散的、难以收集和使用的数据被广泛地利用起来,伴随着各行各业的不断创新,大数据为人类创造了更多的价值。大数据的发展对图书馆信息化、数字化建设也产生了重要影响。图书馆作为信息储存的重要机构,拥有海量的数字资源,是公众获取信息的主要场所,为公众提供了丰富、便捷的信息服务。同时,大数据环境下图书馆的数字资源建设与服务,也面临着更多的机遇和挑战,及时调整自己的服务定位与资源建设策略,将更好地提升公共图书馆在大数据时代中的社会价值。
(一)大数据相关概念和内涵
大数据(big data)用IT行业俗语描述为巨量数据集合。2011年,全球知名的管理咨询公司麦肯锡所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。[1]
大数据技术的主要含义不是在于掌握庞大的数据和信息,而是在于对大量数据进行高性能的分析和处理,通过专业化操作,从而实现知识的提取和利用,并能提供知识的服务。比如:可以分析企业用户行为习惯进行产品推送、对成千上万的路线和车辆数据进行分析规划出实时交通路线、预测市场发展趋势等等。大数据技术的价值在于应用,其核心能力是发现规律和预测未来。[2]
(二)大数据发展与图书馆资源建设关系
大数据推动图书馆数字资源信息的网络化共享、集中化整合、协作化开发和高效化利用。特别是进入21 世纪以来,图书馆海量的数字资源日益成为主要的知识资源载体,以数字资源为基础的复合图书馆已逐渐成为图书馆服务与管理的主要形态。网络条件下,读者对信息的需求呈现复杂性和多样化,图书馆读者已经扩展到馆外用户,能否充分利用现有的数字资源、读者数据、阅读信息、电子文献点击率等各类数据建立元数据集合,对读者阅读行为习惯进行大数据分析与数据挖掘,为更多的用户提供个性化、专业化和智能化的便捷服务,已经成为衡量图书馆价值的重要指标。
大数据时代,图书馆资源建设工作不能仅仅依靠采编或者资源部门,还需要与数据专业部门和专业技术人员配合,制定相关的数字资源收集、整理、保存、挖掘、保密规范等制度,同时需要依靠大数据、云计算、移动通信、物联网等先进的数据处理技术,将经验模式逐渐转化为通过建立模型、数据分析进行辅助决策的科学模式。[3]
(一)基础设施建设
贵州省、市级公共图书馆除铜仁市图书馆新馆正在建设中之外,其余市级图书馆都已完成服务器、存储、网络等硬件设备的配置,2012年-2014年,贵州省图书馆、贵阳市图书馆、毕节市图书馆、黔南州图书馆、遵义市图书馆、黔西南州图书馆均已实现与国家图书馆的vpn虚拟网链接,2014年贵州省图书馆完成了与国家图书馆的专网连接,通过虚拟网可以共享国家图书馆40余个数字资源库,市级馆还可以共享省馆近10个数字资源库,弥补了市级图书馆在数字资源建设的不足。2013年起省馆与各级市馆相继部署了“元数据加工系统”、“唯一标识符系统”、“统一用户认证系统”、“政府公开信息整合服务” 等一系列软件系统平台,逐步对全省的数字资源建设进行元数据标识、标引,对读者信息进行整合。此外,全省建成各级“文化信息资源共享工程”服务点19377个,覆盖省、市、县、乡(镇)、村五级服务网络基本形成。
国家对文化事业的重视和投入力度的加大,为贵州省公共图书馆初步实现数字资源共享奠定了坚实的基础。但同时我们也应该看到,通过虚拟网和专网还是存在只能在各馆局域网内共享的局限,由于各馆读者管理系统不同,读者信息整合进展缓慢,大数据背景下,还需依靠数据整合、挖掘与分析技术,实现广域网内资源的共建共享。
(二)数字资源建设
1.根据2015年12月统计数据,表1汇总了全省各级公共图书馆自建特色数字资源库和商购数字资源的内容与数量。
表1 全省公共图书馆数字资源列表
注:带“*”表示重复建设。
2.征集与联建资源
2010年开始,贵州省图书馆与国家图书馆在数字资源征集与联建方面进行了广泛的合作和共享,建成了《贵州少数民族风情史料片之苗族篇》《德江傩戏视频专题片》《侗族大歌视频专题片》《锦鸡舞视频专题片》《苗族蜡染视频专题片》《贵州少数民族风情史料片之侗族篇》和《贵州少数民族风情史料片之布依族篇》等专题数据库。 2012年开始,省馆、贵阳市、遵义市、毕节市和黔东南州图书馆参与国家资源联合建设项目,已完成“元数据库”1万条、“唯一标识符注册与维护数据库”1万条、“政府公开信息整合服务平台”17.5万条、“地方文献数字化”39.5万页,“网事典藏”网站200个 及“图书馆公开课”60讲等资源建设任务。
3.共享资源
包括国家图书馆古籍、电子图书、电子期刊、老照片、国家统计数据库、中国/世界进口商名录数据库、Emerald回溯期刊数据库、美国国会文献集、EAI美国早期印刷品、珍稀原始典藏档案合集等近40余个中外文数字资源库,让贵州公众足不出户就能免费访问国家数字图书馆丰富的资源。
4.国家馆推送资源
数字图书馆推广工程为各级图书馆推送4TB数字资源(全部镜像在本地)包括了5000册电子图书、200种电子期刊、6000集精品视频、3.2万张图片资源、26万条政府公开信息等,涵盖传统文化经典、少儿视频、文津经典诵读、国图公开课、非物质文化遗产、老照片、政府公开信息等多种精品数字资源。
不难看出,近几年依托文化部开展实施的数字图书馆推广工程、文化信息资源共享工程和公共电子阅览室三大公共数字文化惠民工程,贵州省公共图书馆在基础设施建设、数字资源内容和数量建设等方面有了长足的发展。但是自建馆藏特色数字资源相对贫乏,各馆自建的数字资源集中在地方志、民族文献等地方文献方面,内容单一、数据量小、建库质量不高。外购商业数字资源重复建设情况未能避免。全省与国家馆联合建设的政府公开信息以及网事典藏等数字资源只是分散的单个数据集,没有统一平台进行数据检索、提取和发布。大数据环境下,对于如何发挥数字资源的整体优势,实现我省资源的共建共享和高效、便捷的信息化服务,还任重而道远。
(一)贵州数字图书馆的建立
除了传统的图书馆资源服务外,2009年,为了向贵州省公众提供数字资源区域性整合服务,贵州省图书馆开通了贵州数字图书馆,作为一家全省范围免费开放的数字图书馆,贵州数字图书馆采用“IP+账号”的方式向全省公民提供数字资源免费服务,实现了每一位公民在贵州省任何能上网的地方,登录贵州数字图书馆的门户网站,都能免费获得数字资源的查询、浏览、下载、原文传递和知识导航等服务。目前主要是将省馆商购的数字资源图书、期刊、报纸、论文、视听等专题数字资源进行组织、分类与整合,通过贵州数字图书馆门户网站,实现基于元数据的一站式检索和用户目标明确的单一数据库检索。全省各级公共图书馆作为分馆加入,多途径实现资源的浏览、传递以及全文下载。
截止到2016年6月,贵州数字图书馆的累计访问量近1亿5千万人次,年均访问量2000多万人次。电子期刊和论文平均每年下载量为250万页,文献传递量平均每年1000万页,电子图书下载量平均每年6万页。目前,注册用户达120多万人。
(二)移动图书馆建设
各类数字网络的发展、移动数字阅读和通信终端设备的普及改变了人们的阅读习惯。2011年起,贵州省图书馆以移动无线通信网络为支撑,以图书馆集成管理系统平台和基于元数据的信息资源整合为基础,以适应移动终端一站式信息搜索应用为核心,以云共享服务为保障,先后推出了掌上贵图、省图书馆微信平台、电子借阅机等新媒体服务。2014年,贵阳市图书馆、遵义市图书馆、黔南州图书馆、毕节市图书馆也先后加入数字图书馆推广工程移动阅读分站,为公众提供随时随地的移动数字服务。
虽然贵州数字图书馆和移动图书馆的开通为公众获取图书馆的数字资源提供了更为便捷的通道,扩展了贵州省数字资源的服务渠道,但是全省各市级公共图书馆自建和外购的数字资源未能在贵州数字图书馆上实现整合,服务模式还是仅限于查询、浏览、下载、原文传递和知识导航等传统网络服务,未能对读者数据、阅读习惯、使用率等进行大数据分析,在个性化、专业化服务及主动推送服务等方面较为欠缺。
大数据环境下图书馆数字资源的建设已逐渐取代了图书馆传统服务与文本资源,从对贵州省公共图书馆数字资源建设现状的分析中,可以感受到数字资源对图书馆发展影响深远。然而,另一方面,我们也意识到,目前图书馆在数字资源建设上还存在许多问题。因此,关于对数字资源建设策略的研究已成为公共图书馆面临的一项重要课题。
译 文 :We willcontinue to strengthen the Party’s ability to purify itself,and forever maintain its close ties with the people.
(一)建立区域联盟开展专题特色数字资源建设
对于自建特色库,首先应对全省统筹规划,可由省馆牵头成立技术协会或者行业委员会进行协调组织,依靠国家项目资金完成建设。县、市、省逐级上报登记,由技术委员会在逻辑层面进行查重和筛选。以地方文献数据库建设为例,毕节市、遵义市、安顺市等市级馆分别组织市内各级县馆完成本区域地方文献的收集、上报、扫描、加工、标引和元数据著录等初始工作,技术委员会汇总数据,在省馆构建的特色数据库平台上,结合相关的行业词表、分类体系以及属性、规则、语义等基础知识库,实现对上报数据资源内容(主要是元数据内容)的智能化分析、索引、解析和关联聚合,完成专题数据的筛选和重组。其次,是对特色库中的数据进行专题组织,划分出栏目、专题和路径。通过搜索引擎、分析引擎、规则引擎等实现数据统计与用户行为分析,为个性化的专题聚合与推送奠定基础。最后在专题数据的发布上还应为用户提供灵活多样的知识发现、获取和利用服务。例如:除了基本的全文检索和分类导航外,还应包括专业化的主题汇聚、关联延伸、利用统计分析和热点信息推荐以及个性化的知识订阅推送等服务。
(二)实现商业数字资源的共建共享
对于商业数字资源,可以考虑全省公共图书馆进行联合采购的方式,以最少的经费获取最多的资源来实现共享。在贵州,数字资源已经有了较为成熟的服务平台——贵州数字图书馆,如果进行联合购买,可以实现有限经费的最大化效益。例如:cnki数据全库,如果购买全省范围使用,其价格任何一个图书馆都难以承受,但是如果省馆购买科技期刊、贵阳市馆购买博硕论文、毕节市馆购买标准全文,最后在贵州数字图书馆进行整合和发布,这样不仅有效避免重复建设,实现资源的共建共享,还能丰富资源数量和内容,将结余资金用于进行大数据分析、挖掘和云计算等深层次开发上,为用户提供更加优质的服务。
(三)搭建全省统一的专题信息服务平台
针对目前各馆在建的“政府公开信息”“网事典藏”和“地方文献”等分散数据库集,建立全省统一的信息服务平台,以政府公开信息数据库为例,设计贵州省公共图书馆政府公开信息整合服务平台统一门户,以各级图书馆所采集的政府机关门户网站的互联网信息资源为对象,构建集互联网信息资源采集、加工、存储、归档、组织、发布与利用为一体的政府公开信息整合服务平台。以贵州省图书馆为中心结点,面向全省各级公共图书馆实现本地部署,通过系统间的分级调控、智能调度、权限管控等方式,构建互联互通、统一检索、分级揭示的政府公开信息整合服务体系。随着大数据技术的发展,甚至还可以将整合后的政府公开信息平台、网事典藏服务平台和地方文献专题库等进行二次整合,建立统一加工、组织和发布的综合性系统平台,满足不同类型、不同格式、不同内容的数字资源的发布和展示,多途径为全省公众提供方便、快捷的开放式信息服务。
利用统一门户将公共图书馆的信息和内容无缝连接起来提供给广大公众,并根据各类用户自行定制的风格提供个性化内容。如今,人们通过分享、评价等方式获得越来越多的信息资源,公共图书馆读者管理系统各不相同,需要开放所有系统的接口较难实现,但是利用大数据技术进行读者信息元数据抓取,建立读者元数据库则是一个可行的办法。再通过元数据去分析读者的年龄、爱好、检索习惯等信息,发现有价值的数据间关系,从而了解不同读者在各个时期的个性化需求,对其兴趣进行预测,并向其定期推送所需数据。[4]同时,大数据环境下,数据发布可以建立面向计算机、手机、数字电视等各种终端用户的个性化和多样化服务推送。
(五)建立图书馆信息化人才队伍
大数据环境下不仅要求图书馆员具备相应的学科知识,还应有一支具备资源组织、挖掘整理、大数据分析和专题发布等信息化综合型人才队伍,将数据快速地转化为知识和信息传达给用户。近几年,国家非常重视对新技术人才的培养,在图书馆行业专业培训中比重逐年加大,贵州省公共图书馆还可以考虑“走出去、请进来”的方式培养各馆的专业人才,通过到国家图书馆、各省图书馆等挂职的方式和邀请专业技术人员下挂的方式,提升本馆业务人员综合技能,以满足大数据环境下图书馆数字资源建设对人才的高度需求。
[1] 百度百科.大数据[EB/OL].(2016-05-21) http://baike.baidu.com/item/大数据/1356941.
[2]王晔煊,杨艳君.大数据背景下高校图书馆的资源建设[J]. 鞍山师范学院学报,2013,15(6) : 101.
[3]范华.大数据时代的图书馆资源建设工作[J].四川图书馆学报,2015(4).
[4]付丽娟.大数据时代下高校图书馆数字资源建设研究[J].内蒙古科技与经济,2015(9).
责任编辑 刘晓华
Analysis on Resource Construction and Service Under the Background of the Big Data——Taking Digital Resource Construction and Service of Public Libraries in Guizhou Province as an Example
LUO Jing
(Guizhou Provincial Library, Guiyang 550004, Guizhou, China)
According to statistics and analysis of digital resource construction and service for public libraries in Guizhou province, this paper aims to propose some reasonable suggestions for the future resource construction of public libraries in Guizhou based on relationship between big data and resource construction of public libraries.
big data; Guizhou; digital library
2016-08-09
罗 静(1976-),女,湖南邵阳人,贵州省图书馆副研究馆员。主要研究方向:数字化图书馆建设。
G250.74
A
1673-6133(2016)05-0069-04