余波 王桀
摘 要:近几年大数据行业的兴起给信息技术带来了深刻的变革。在这样的背景下,数字图书馆的建设也要有大数据思维,在资源建设、技术应用、服务方面都要有一个大的提升,服务模式由被动“等待”共性化转向积极主动“自动推送和个性化”。未来的图书馆一定要充分利用大数据这个平台,每一个图书管理员也应该努力成为数据分析员。
关键词:大数据 数据 应用研究
中图分类号:G251.5 文献标识码:A 文章编号:1003-9082 ( 2017 ) 08-00-01
引言
信息技术的飞速发展,人们的生产、生活、学习已经越来越离不开互联网。随之而来的人们生产、存储的巨量且复杂的数据开始激增。随着数据量从GB时代迈入TB时代,麦肯锡公司在2011年提出了大数据这个概念。互联网时代已经对现有的图书馆造成了很大的冲击,纸质图书借阅量的下降,人们对网络资源需求的不断提高,图书馆数据库建设的滞后等都要求图书馆应该跟紧时代脚步,加快转型步伐。大数据时代的到来更使我们图书馆人感到了紧迫感。
一、图书馆应用大数据面临的几个问题
1.来源及获取问题
图书馆传统业务软件内的数据。主要是数据库里的结构化数据,包括书目数据:读者的身份信息:借还书的记录:延时记录:资金管理等。这类数据虽然不太符合大数据的特征,但可以融入与其他大数据的分析中,是图书馆大数据分析环节中的重要部分,这类数据也包括广泛使用的条形码和逐渐增多的二维条形码数据。互联网数据包括门户网站、社交网络、微博、微信。使读者主动参与到图书馆的知识服务中,在与读者的交互过程中,会产生大量数据,这些数据记录了读者的信息需求、习惯爱好等个性化信息。文献数据是各类数字化资源的总称,随着数字图书馆进程的不断加快,这类数据正呈现爆发式增长,是图书馆大数据的组成部分。但是这类数据,由于来源广泛,存在数据格式不兼容或不能离开供应商的软件读取等问题,需要数据供应商在一定的条件下,提供通用格式的数据,以解决数据互操作的问题。
2.存储问题
海量的数据资源对存储系统提出了新的挑战,要求存储系统具备足够的存储空间:灵活的可扩展性和较低的使用成本,图书馆目前主要有三种存储架构,第一种 DAS 方式,是服务器直接连接存储设备,第二种 NAS 方式,是通过网络方式连接存储,第三种 SAN,是通过专用的存储网络连接存储,以实现集中存储集中管理,但三种方式都存在可扩展性差的问题,难以适应海量数据的存储要求,对大数据而言,云存储是较为理想的方式,云存储系统具有很强的可扩展性,它采用并行扩容方式,当容量不够时,只需增加具有一定容量的服务器,而且容量扩展后,性能不会随之下降。
二、图书馆大数据的应用研究
图书馆的应用研究,应建立在业务需求的基础上,致力于提高服务体系的组织水平,促进图书馆事业与制度建设的创新发展,大数据在图书馆中的应用将主要围绕构建新型知识服务体系和智能化管理上。
1.构建新型知识服务体系的应用利用大数据分析技术,能够揭示数据背后隐藏的读者行为和信息需求,有利于改进图书馆的服务,优化整合图书馆的资源,建立新型知识服务体系,大数据的应用主要包括:
1.1对读者的信息和借阅行为的分析,主要包含:①分析文献类型与读者的性别:年龄:学历:专业的关系。②分析各类文献的利用情况,进行文献类别的借阅率排行,及时补充借阅率高的图书,下架过时文献,为调整借阅文献的品种和采访提供科学依据和预测信息,以优化馆藏结构。③个性化服务,分析读者的活跃度:阅读喜好:借阅方式:信息需求:行为习惯等数据,图书馆可以有的放矢地向用户提供符合其个性化需求的服务,如新书推荐:同类书推荐:信息需求推送:个性化的图书借阅:网上个性化门户等。
1.2社交网络交互数据的分析使读者主动参与到图书馆的知识服务中,通过数据分析可以发现读者的信息需求:读者的研究课题等,可以有针对性地向其推荐所需要的图书:课题的论文资料:研究报告:专利文献等。
1.3图书馆信息资源的整合。面对大量的信息,图书馆通过大数据处理,从各类资源中整合有用的知识和关联关系。通过数据的加工整理,探索以数据为基础的知识发现分析和数据的增值服务。
1.4建立一个全新的知识服务导航机制,建立用户知识需求预测导航:多维数据资源的组织和分析导航:读者信息行为分析导航:数据资源和学术资源的服务导航等。
1.5知识服务的智能辅助决策,根据读者的借阅数据,建立图书馆馆藏资源的调整和预测机制,为图书馆管理增加必要的手段。
三、智能化管理方面的应用
1.图书馆对大数据的应用研究还包括建立大数据分析的可视化模型,如借阅分析模型:统计分析模型:预测模型:风险评估模型等,可视化将成为未大数据分析的重要方式。
2.圖书馆物业管理的智能分析和辅助决策,各类传感器将普遍应用于未来的智慧型图书馆中,通过对传感器数据的多维度分析,实现物业管理的智能化。
3.阅览室阅读数据的统计预测。目前图书馆阅览室一般无法提供读者阅读书籍的数据。通过在一组书架中增加RFID 识别设备,当读者取书阅读时即可将数据传至服务器中,经过数据分析和挖掘可以对读者的阅读进行统计和预测。根据书籍的阅读率及时增加热门图书,剔除冷门图书,有利于更好地调整阅览室的文献资源布局。
结语
图书馆目前正在面临着新技术、新思想、新服务、新用户需求的全面冲击。未来图书馆如果定位,数字图书馆向何处发展,都亟待解决。随着网络大数据服务的崛起,图书馆面临着越来越大的责任。如果不转变思路,未来就会被互联网服务取而代之。如何从图书馆掌握的大数据中提取到可用的资源、分析用户的阅读习惯,是图书馆未来转型为“以用户需求为主导”的模型的主要一环。
参考文献:
[1]容春琳.公共图书馆应用大数据的策略研究[J].图书馆建设,2013(7):91-95.
[2]陈明奇.姜禾,张娟,廖方宇.大数据时代的美国信息网络安全新战略分析[C].第27次全国计算机安全学术交流论文集,2012,(8):42-45.
[3]陈茫.周力青,吕艳娥.大数据时代下的图书馆移动服务创新研究[L].图书与情报,2014(1):171-121
[4]李白杨.张心源.数字图书馆建设中大数据问题初探[J].情报科学.2013(11) 26-29.