冯园园
(铁岭师范高等专科学校图书馆,辽宁铁岭112000)
大数据思维下图书馆数字资源建设与利用研究
冯园园
(铁岭师范高等专科学校图书馆,辽宁铁岭112000)
对大数据和大数据思维进行了阐述,分析了大数据时代图书馆数字馆藏资源建设面临的挑战,指出图书馆存在同质化建设、缺乏完善的资金投入结构、缺乏特色数字资源服务等问题。研究了大数据思维下图书馆数字资源的建设方法,以及基于大数据思维的图书馆数字资源的合理利用。
大数据思维图书馆馆藏资源建设利用
物联网、移动通讯技术的快速发展,为网络用户获取发布数据信息提供了便利,而无处不在的智能化终端的应用,也在每时每刻产生大量数据。根据全球互联网数据中心的监测,非结构化网络数据正以每年不低于55%的速度增加,标志着我们已经进入大数据时代。数据是图书馆开展各项服务的基础,在提供信息和资源服务的过程中,图书馆也在不断产生各类数据。大数据时代颠覆了人们的思维和学习方式,改变了以往以小数据为核心解决问题的典型模式,变为通过对海量数据对应关系的深入分析,迅速提取有价值信息的思维模式。大数据思维的应用,以感性技术和多源异构数据的挖掘分析,激发人们对生活、学习方式的重新认识,也提升了数字化资源利用的准确性和便捷性。目前图书馆已有的资源多为历史文献、科研资料等,属于结构化、静态的信息,缺少对网络资源、用户行为信息以及非正式数字出版物的搜集与收录,导致图书馆在数字馆藏资源建设方面的缺失。面对大数据时代的严峻挑战,图书馆应利用大数据思维,对馆藏资源建设工作进行重新定位,突破思维惯性构建数字资源建设方案,提升数字资源建设效率,进一步完善馆藏数据信息。
1.1大数据时代
大数据是在信息技术发展过程中,为解决信息环境下难以管理的异构数据问题,而提出的一种数据处理技术。大数据具有规模庞大、增长变化快、容量大等特征,属于经过处理具有较高决策力和优化能力的信息资产。大数据技术的核心在于,通过对海量常规软件无法管理数据的专业性分析,可以提升处理后数据的价值。2011年美国麦肯锡公司首次应用“大数据”一词,指代超出传统意义度量的,包括非结构性、结构性和半结构性的数据[1]。美国政府于2012年颁布《大数据研究和发展倡议》,计划在生物医学、生态环境等领域投入至少两亿美元,为大数据研究提供保障。从某种程度上来看,大数据属于前沿技术,能够从各种类型的数据中获得有用信息,并且具有极大的应用价值。大数据是互联网高速发展的产物,随着数字信息的爆炸式增长,大数据的种类与形式也在不断扩展。
1.2大数据思维的概念
大数据时代改变了人们对生活、对世界的理解方式,颠覆了传统的思维观念,一切都可以用数据进行描绘和观察。大数据技术引发的思维变革,对传统思维模式产生了巨大冲击,更加注重对碎片化信息的整合利用,注重对数据信息的视觉化处理和动态预测。小数据属于简单科学,大数据属于复杂科学,小数据与大数据之间存在对应关系,因此可以将大数据思维看做复杂性思维。大数据思维通过对异构多源数据价值的挖掘分析,发现未知数据的内在规律,能够引发人们对生活、工作方式的深入认知。大数据思维包含人们对数据资源的深入挖掘,对数据创新模式的不断总结,以及对大数据应用的理论性指导,旨在激发大数据的利用潜能。
1.3大数据思维的特点
大数据思维阐释了大数据技术的内在逻辑,具有开放性、动态性、关联性等特征。所有大数据都是对外开放的,实现了数据的个人独有到全民共享。对于大数据的研究可以不带任何预设,而是依据科学的方法和流程进行分析。大数据本身是由不同类型的数据、数据集构成的,打破了基于小数据的因果思维模式。在对数据信息进行挖掘时,不仅需要关注不同数据之间的关联,也需要关注不同数据集之间的间接、复杂的对应关系[2]。大数据是动态变化的,通过先进技术随时在线采集系统数据,并且迅速处理分析,可以大致了解系统的动态演化过程。大数据思维融合了统计学的思维观念,通过对看似杂乱的总体数据的研究,能够发现数据背后隐含的规律。
大数据技术改变了图书馆的服务环境,要求图书馆提供支持数据驱动的服务模式,适应用户的动态信息获取需求,也给图书馆数字资源建设带来新的挑战。
2.1缺乏完善的资金投入结构
我国图书馆在资源建设方面主要依靠政府拨款,部分依靠社会资金投入,筹措资金的渠道相对单一。大数据时代图书馆的数字资源建设,尤其是对海量异构分布信息的挖掘、筛选和利用,需要利用先进技术与设备,与传统方式相比运维成本更高[3]。虽然数字资源的获取更为便利,但是由于涉及到知识版权的鉴定与使用,并且流程相对繁琐,也需要耗费大量资金。同时政府资金投入无法满足大数据环境下的资源建设需求,即便是专项大额拨款,也只能满足图书馆购置软硬件设备的需求,在数字资源开发与持续利用方面的资金依然短缺。加上很多数据库资源并非免费获取的,价格也在持续上涨,导致图书馆无法保障数字资源的完整性,也影响到数字资源建设质量。
2.2缺乏特色数字资源服务
由于很多图书馆将结构化数字资源的搜集整理作为重点,缺少对非结构化数据的挖掘和存储,导致图书馆存储的资源类型千篇一律,缺乏深度与广度,无法满足用户对个性化资源的需求。很多图书馆都是基于网络开放获取资源,为用户提供信息检索、组织与推送服务,极少利用移动通讯网络、云计算等拓展服务领域,在数字资源采集整合方面缺乏创新意识,整体服务水平偏低。部分图书馆在数字馆藏资源建设方面,将已有资源的数字化作为重点,缺少与其他图书馆或信息机构的交流共享,缺乏对海量数据进行综合处理的能力,与个性化、多元化服务需求相差甚远。
2.3数字资源同质化现象严重
大数据环境下很多图书馆的数字资源迅速增多,虽然在一定程度上扩展了馆藏规模,但是由于图书馆缺乏科学的数字资源组织方法,导致建设中存在标准不一、重复建设等问题。在数字资源建设方面,很多图书馆采用购买成熟数据库、馆藏资源数字化和自建数据库的方式,满足用户对数据信息的需求。而部分商家为谋求利益对数字资源进行任意买卖,导致很多数据库的数据存在交叉重叠[4]。不仅影响到图书馆的资源建设效率,也导致数字资源的极大浪费。同时图书馆数字资源建设存在结构不合理等问题,缺乏对用户行为信息的敏锐感知,缺乏科学的数据资源建设决策,重视对结构化数据的整合,而忽视了对非机构化数据的采集和长期存储,很难适应大数据时代的需求变化。
大数据思维的应用有助于发现混杂数据存在的相互关系,挖掘海量数据中隐含的规律,为图书馆数字资源建设提供新思路。图书馆可以通过加强基础设施建设,注重特色馆藏资源建设,以及建设公共媒体数字资源库的方式,强化大数据环境下的数字资源建设。
3.1加强图书馆基础设施建设
互联网技术的广泛应用,使得在线信息检索工具得到普及,改变了人们的信息获取方式,更多的用户倾向于浏览、获取数字化资源。但是目前我国图书馆依然以印刷型资源为主,对于数字资源的采集、存储力度并不大。大数据环境下图书馆应该转变资源建设模式,通过基础设施建设,改善数字馆藏资源建设环境,为海量复杂数据的处理和利用创造条件。同时面对大数据环境下异构分布的数字资源,要求图书馆员了解图情学、信息技术等综合知识,具备信息检索、数据挖掘、数据组织等能力,掌握与数字资源建设相关工具的使用方法。图书馆在引进先进技术与设备的基础上,应该为图书馆员提供培训学习机会,鼓励图书馆员参与到科研活动、实践探索中,或者采用参观学习、知识讲座与学术交流的方式,提升图书馆员的整体素养,为图书馆数字资源的高效管理提供保障。
3.2注重特色馆藏资源建设
图书馆结合馆藏实际与社会经济发展状况,加强特色数字馆藏资源建设,能够充分体现自身资源特色,改变图书馆领域“全而不精”的状态。图书馆以特色馆藏资源建设提供特色服务,可以在馆际合作中凸显优势,也是提升图书馆竞争力的根本所在[5]。利用大数据技术对已有资源进行深入分析,发现本馆具有独特风格的文献资源,通过对这些文献资源的数字化处理,构建具有特色的图书馆数字资源体系。在依照计划进行数字资源建设的同时,图书馆应该将主要精力放在重点学科文献建设上,合理配置不同学科数字资源的比例,利用大数据技术多方收集具有代表性的文献资料,如工具书、论著、科研手稿等,保障特色文献资源的完整性和系统性。
3.3建设公共媒体数字资源库
面对大数据环境下众多公共媒体海量异构分布的数据,图书馆可以构建覆盖众多信息媒介的大数据服务系统,通过对复杂数据的整合处理,为用户提供便捷、高效的数据信息服务。图书馆公共媒体数字资源库的建设,首先应该结合图书馆日常运维情况,充分了解用户对馆藏资源建设需求,总结不同层次用户对数字资源的利用情况,建立能够处理海量数据且符合需求的资源库系统。图书馆数字资源库的建设,应该具有灵活性和兼容性,能够对结构化和非机构化数据进行统一管理,并且可以满足个性化服务需求。在建设阶段图书馆应该做好用户调研工作,以用户、数据资源、管理者为主体,综合多方需求设计具有个性化模式的系统[6]。基于大数据环境下数据库管理的全生命周期,对系统建设的各个环节进行细致分析,具体建设流程如图1所示。在资源获取阶段,利用大数据技术从公共媒体平台、开放数据库中获取满足用户需求的数据资源。然后对数据资源进行过滤和整合,在对数据关联、现象与过程等进行分析的基础上,遵循一定的准则进行数据重构,最后对数据资源进行实时分析,使之转化为可用的知识。
图1 图书馆公共媒体数字资源库建设流程
大数据思维突破了数据类型与时空限制,能够通过数字资源整合实现信息共享,进一步提高数字资源的利用价值。图书馆可以利用大数据思维成立图书馆联盟,提升数据安全监控能力,并在深入挖掘的基础上开发全新的服务模式。
4.1提升数据安全监控能力
互联网为我们提供了一个自由展现才华的空间,也是庞大的数据资源库,但是由于信息的开放式传播,使得数据安全问题变得尤为突出。图书馆基于大数据思维的数据资源库建设,应该严格遵循国家制定的相关数据安全法规,加强对数字资源的安全监控,保障数字资源利用和共享的安全性。同时图书馆应该制定统一的数字资源利用标准,设计数据资源库安全管理机制,以操作性强、详细的管理规范,减少图书馆数字资源利用中存在的分歧,维持图书馆数据的稳定运行。定期对图书馆数字馆藏资源进行安全检查,保障图书馆数字资源的利用有章可循,减少图书馆数字资源组织建设中存在的安全漏洞[7]。数字资源属于规模庞大的信息宝库,通过对数字资源进行挖掘分析,可以帮助用户了解学科发展方向,为科学决策提供参考。图书馆在利用大数据技术进行数据挖掘的同时,也需要提高图书馆员的数字资源安全意识。通过图书馆员数据安全培训,使其具备数据安全管理的大局观,在维护图书馆数字资源安全的基础上,促进数字馆藏资源建设的良性发展。
4.2实现馆藏资源的联合开发
通过对我国图书馆领域的发展状况进行综合分析,发现图书馆总体发展缺乏均衡性,在智能化、数字化建设方面差距较大。要想实现信息共享工程的目标,需要由技术实力雄厚的图书馆给予其他图书馆技术支持,以技术资源的联合管理,促进不同图书馆之间的协调发展。大数据技术吸引图书馆的一个显著特点,就是可以实现资源共建共享。多个图书馆通过引进现代化技术,以网络协议的方式实现馆际合作,不仅可以帮助图书馆收集完整的数字出版物,也可以更好地满足用户需求。要想真正实现数字资源共享,最大限度利用馆藏数字资源,各图书馆应以联盟的形式走资源联合开发道路[8]。应该注意的是,图书馆文献资源的格式标准,是保障数字资源建设的质量基础。协作图书馆必须制定统一的数据规范,并且建立数字馆藏资源联合开发系统(见图2)。该系统包括数字馆藏资源联合开发业务子系统、数字馆藏资源联合管理子系统以及数字馆藏资源标准化子系统等,也包括其他业务子系统。每个子系统分为多个部分,共同承担图书馆联盟开展的数字馆藏联合开发任务。
图2 图书馆数字馆藏资源联合开发系统框架
4.3开发全新的图书馆服务模式
大数据时代,馆藏资源规模已经不再是评价一个图书馆竞争实力的主要标准,用户更加关注图书馆的数据组织分析能力与知识服务水平。图书馆服务中对隐含知识的分析与转化能力,成为衡量其服务质量的重要指标。在这样的环境下,要求图书馆利用大数据思维,积极开发网络资源与非正式出版物中隐含的资源,通过对数据信息的高效处理转化,创新图书馆服务模式。一方面,图书馆可以利用多元化的公共媒体数据库,从中获取有价值的数据信息,结合用户需求提供知识咨询服务。由于知识咨询服务要求大量优质数据提供支撑,并且涉及多个学科领域,单纯从图书馆专业数据库中获取信息,已经无法满足用户对数据信息的个性化需求。而不同类型的公共媒体数据库,如微博、人人网等,其中蕴含大量灰色文献资源,借助大数据技术对系统数据进行持续跟踪和深入挖掘,可为用户提供非正式渠道获取的隐含信息,具有可靠性和准确性。大数据时代数据已经变成一种资产,谁能够迅速获取并掌握更多数据,就能够获得发展的先机。图书馆决策也逐渐由结合实践经验,向基于数据分析与经验相结合的方向发展。通过对用户行为数据进行深入分析,能够科学预测图书馆领域的发展动向,辅助图书馆做出正确的决策。大数据时代的数据分析日益朝着纵深化、多维化、实时化方向转变,要求图书馆提升对大规模数据信息的掌控能力,利用大数据思维分析当前,以更好地适应大数据时代的要求存在的问题,并且及时进行调整和创新。
大数据时代掀起了广泛的科学技术革命,颠覆了人们的生活、学习和工作方式,也以先进的数据存储、采集和处理技术促进了大数据思维的推广。大数据环境下图书馆改变了传统的馆藏资源建设模式,在采集整合纸质资源的基础上,提升了数字馆藏资源开发和利用力度,并朝着数字化、网络化方向发展。大数据思维在图书馆资源整合、效益评估中均有应用,为数字资源的组织利用提供了技术支持。图书馆应该利用大数据思维对馆藏资源进行综合评估,全面掌握用户信息行为及其动态变化,并对馆藏资源建设效益进行客观分析,进而不断提升图书馆资源建设水平。
[1]张馨允.智慧图书馆背景下的馆藏资源建设探究[J].兰台世界,2016(1):58-60.
[2]刘慧.图书馆馆藏资源建设评估研究[J].农业图书情报学刊,2015(2):26-31.
[3]杨一凡.馆藏资源建设与读者素质教育浅析[J].科技信息,2012(17):208-209.
[4]张佳丽.大数据时代少数民族地区高校图书馆馆员核心能力研究[J].农业图书情报学刊,2015(4):205-208.
[5]谭荣.大数据时代高校图书馆信息服务的创新[J].新媒体研究,2015(13):57-58.
[6]李鸿.大数据背景下高校图书馆的用户需求与信息服务[J].中国科技信息,2014(21):79-80.
[7]王楠.大数据时代高校图书馆特色信息资源整合研究——以地方信息资源为例[J].科技资讯,2014(21):253.
[8]曾祥文,王华.大数据时代高校图书馆信息化建设探讨[J].科技创新导报,2013(35):202.
冯园园女,1980年生。硕士,馆员。研究方向:图书馆信息自动化。
G253
(2016-07-04;责编:徐向东。)