张邦利
摘 要 大数据开启了时代的重大转型,引发了人们对数据价值的重新认识,也使得对解决问题思维从追求因果关系向更看重关联关系方向转移。不再热衷于追求精确度,不再依赖于随机采样。大数据也在改变着图书馆信息服务的方式,成为提升信息服务的创新源泉。
关键词 大数据思维 图书馆 信息服务
中图分类号:G250.7 文献标识码:A DOI:10.16400/j.cnki.kjdkz.2016.05.090
Abstract Big data opens an era of major transformation, led to a re understanding of the value of the data, but also makes the problem of thinking from the pursuit of causal relationship to a more important relationship between the direction of the transfer. No longer interested in the pursuit of accuracy, no longer rely on random sampling. Big data is also changing the way of library information services, information services to become a source of innovation.
Key words thinking of big data; library; information service
0 引言
大数据的到来深刻地改变着人们的工作、生活和思维方式,各行各业对数据的依赖有增无减,数据即资源,数据即财富这一理念已逐渐为社会所认同。以统计数据为依据的定量分析逐步取以分析者的直觉经验作出判断的定性分析方法,随着手机终端的普及,每个个体人都可以把自己的生活、所见所得变成数据,产业互联、人体互联导致更大量级的数据爆炸。数据也变得资产化,被当作财富来采集、存储和交易,这就是“数字化生存”。伴随图书馆的信息收集和处理水平的不断提高,信息服务无疑已成为目前图书馆公共服务的重要内容,通过大数据的思维来指导图书馆信息服务工作中的数据采集、整理、存储与使用,是图书馆是图书馆发展必须重视的一个问题。
1 大数据和大数据思维相关概述
1.1 大数据
“大数据”一词,早在20世纪80年代就已出现,但那时“大数据”仅仅是作为数据挖掘技术中的对“海量数据”的一种表述。2011年5月,麦肯锡全球研究院首次提出“大数据”概念,发布了一份关于“大数据”的详细报告。报告将大数据描述成为“无法在一定时间内使用传统数据库软件工具对其内容进行获取、管理和处理的数据集合”。而且指出,数据正在逐渐朝每个行业、业务职能领域渗透,成为不可忽视的生产要素,大数据作为分析的另一种表述形式,目前已成从数据中萃取知识,并将知识转化为提升商业竞争优势的智能活动。2012年1月的世界达沃斯经济论坛上,“大数据”是主题之一。时至今日,大数据的内涵变得更为宽泛,首先,大数据的“大”既体现在数量上,也体现在其组成分布、数据结构上;其次,基于“云计算和云存储”、“物联网”等新兴的技术和服务又促使数据的种类和规模正以前所未有的速度增长。大数据具有多“4V”特征,即大量(Volume)、高速(Velocity)、多样(Variety)、价值(Value)。
1.2 大数据思维
大数据的出现使得人们分析信息时思维发生了转变。在大数据时代,人们分析信息面临着三个转变,第一是要分析更多的数据,不再依赖于随机采样。当我们有足够的数据处理和存储能力,而且可以获得海量数据的时候,随机采样就没有多大的意义了。第二是,不再热衷于追求精确度。针对小数据量和特定事情,追求精确性依然是可行的,随着数据的增多,我们就不用再对某个现象一味追求细枝末节,而只需要把握好或判断出基本发展方向。第三是从导找因果关系转而关注相关关系,将专注力放在相关关系的探索上,只要发现两个或若干个现象之前的相关性,就可以创造某种经济或社会效益。不一定需要知道事情产生的起因或原因,但通过事件触发器提醒让我们知道这件事情正在发生。即大数据告诉我们“是什么”,而不是“为什么”。
1.3 大数据思维的几个重要原理
第一是数据核心原理。在大数据环境下,数据比流程更重要。可以从数据库和记录数据库中搜索出你是谁,你需要什么,从而推荐给你需要的信息,用数据核心思维方式去思考问题并解决问题。
第二是数据价值原理。数据并不完全是越多越好,重要的是通过分析实实在在的数据得出有价值的东西,挖掘出的价值含量越高更能凸显大量数据的重要性。如今,数据已经成为了一种商业资本,思维转变了,数据就能被巧妙地用来激发新产品和新型服务。通过对数据的处理和分析,整理出用户的消费倾向、想法、喜好,个性化差异等情况,然后进行分类记载,既而又可以进行分类指导。
第三是全样本原理。传统采样的目的就是为了用最少的数据获得更多的信息,但采样分析不能捕捉细节,而且,在采样分析的时候,有一些信息会丢失掉了。信息时代,大型数据库管理系统中存储的数据库越来越全面,因为大数据包含了全部的信息数据,通过使用所有的数据,可以发现在大量数据中淹没掉的情况。全数据的样本思维方式,我们就能够从不同的角度,更细致地观察、思考和研究问题的方方面面。
第四是相关性原理。与传统的因果思维相比,相关性更加强调两个数据值之间的数理关系。一个数据值增加,另一个数据值可能会随之增加,也可能不会发生变化。相关关系没有绝对,只有可能性。比如,不是图书馆网站上推荐的每本书都是读者想要的书。每一本书的信息、读者的每一次检索都可以记录为数据,我们对大数据进行相关关系分析,从而知道哪些检索词条是最能吸引读者的,哪个时间段是读者最愿意呆在图书馆看书的。当然,相关性不是不要因果关系,因果关系还是基础,通过找出各类数据之间的相互关系也能解决日常管理工作中的难点和瓶颈问题,通过找出以上关联物并监控它,就能预测下一步的异常情况。
2 大数据思维与图书馆信息化服务
通常情况下,图书馆信息服务工作包含四个方面的内容,一是借阅活动,即常见的书籍、报刊借阅服务。二是信息咨询服务,向读者提供题录、书目等主题信息。三是信息检索服务,通过文献信息网络,提供联机检查服务。四是专利检索与开发服务。随着图书馆信息服务应用范围的不断扩大,图书馆各个系统的信息数据库内容不断丰富,数据变得越来越复杂。笔者认为,这些数据既包含现有的图书馆各环节业务产生的数据,存储于数据库中,又包含了从客户端读取的用户ID、浏览过的网页、停留的时间等数据,也包含了从其他部门共享来的数据。对图书馆工作人员而言,如何在已有的数据获取、存储方式进行创新管理?在分析和决策的工作流程中加入大数据的支持?如何利用大数据帮助信息服务工作?这些问题的解决需要把信息技术思维转移到大数据思维上来。
2.1 整体性思维改变图书馆数据资源采集模式,尽可能全面采集数据
图书馆的传统信息资源,通常包含图书馆管理人员和读者用户的基本情况,购买的图书和文献数据库,自建的音频、视频、专著等数字资源等,这些数字资源组成了图书馆信息服务的资源基础。这些资源数据的特点是结构完整,格式规范,能够为读者提供查询、检索、下载等信息服务。现在,大型数据库管理系统广泛使用在各行各业,图书馆也无例外,馆内各个电脑终端、扫描枪、触摸屏、摄像头等捕捉到的数据最终都会很快地汇入图书馆的数据库中。比如,读者在图书馆电脑终端的操作轨迹,包括逐条的检索记录、借阅时间、借阅规律等都会产生出大量的信息数据,应该尽可能多地收集这些数据。在实际的信息服务工作中,读者的行为数据还缺乏全面性、整体性和关联性,如记录有读者的检索词,下载文献的主题,但没有记录读者的检索时长,记录有读者的进馆次数、进馆时间,但没有记录读者的离馆时间,从而缺少读者的在馆时间。这些数据与用户的行为习惯密切相关,虽然价值不大,但如果能全面收集起来,则能帮助分析读者的偏好,帮助图书馆提供最有用的信息服务。
2.2 关联思维为信息服务提供新的解决路径,分析挖掘读者的行为轨迹
图书馆的开放性决定了图书馆的信息服务是面向读者的,以读者参与的各类主题来建立“数据仓库”,在仓库中再建立不同的“房间”,每个房间存储不同的记录。比如读者的基本信息、访问记录、借阅记录、检索历史、查询咨询等。图书馆信息服务一方面要对读者的不同信息需求加以分析研究,分析不同读者的“行为轨迹”,如同在网购时经常会弹出的“猜你会喜欢”、“浏览了该商品的人还浏览了以下商品”等信息。另一方面也需要根据每个业务流程收集到的大量的、完整的读者借阅记录、检索记录等数据,挖掘读者的行为特征,对具有相关兴趣特征的读者群体进行分类管理,形成专门的统计分析结果,向读者推荐相关的专题,既提高了资源的利用率,也提高了读者满意度,达到真正吸引读者的目的。关联思维需要图书馆工作人员根据特定的问题,考虑到位,特别是在优化图书馆某一个工作流程时,由于各个数据都有着内在联系,图书部门之间的资料数据也存在着协调共享,如果不注意其中的关联关系,就会出现顾此失彼、数据紊乱的问题。
2.3 智能思维丰富图书馆个性服务的内涵,开展主动服务
大数据应用技术是图书馆未来构建创新服务的动力引擎,是未来几年内图书领域信息服务研究的重要课题。新型知识智能服务引擎包括资源及学术搜索引擎、资源及服务推荐引擎、用户及资源行为智能分析引擎、用户知识需求预测引擎、及多维度信息资源获取、组织、分析及决策引擎等。例如,美国Hiptype公司就充分利用个性化分析系统,对电子书读者的身份和阅读习惯进行智能分析,继而帮忙作者和出版商得到详细的数据从而更懂读者。
利用现在的数据库技术,图书馆可以重点对读者用户的各种行为数据进行复杂的数据处理、统计和分析。如通过对所有学生借阅记录的记载数据,尝试统计每月学生的借阅频率,检索的关键词,分析并预测出不同月份学生的需求,从而在下一年的不同月份合理安排借阅书目,主动提供索引指南帮助学生克服因信息分散而造成的检索困难,提高信息服务的时效性和针对性。
利用数据信息,图书馆开展有针对性地主动服务来解决读者的实际问题。还可以搭建微信公众号平台向用户定期推送内容丰富、形式多样的个性化信息,保持即时的互动与交流,读者向图书馆反馈新书的阅读意见与建议;还可以利用图书馆网站发布公告和动态,提供各类数字资源的下载和查阅;图书馆可以根据读者不同的信息需求,制定不一样的信息服务策略,优化不同的业务环节,开展不同的信息服务。可在图书馆网站上设置相关的栏目,放置视频或幻灯片,方便读者更快无差错的检索。图书馆可适时开展一些诸如咨询参考、热门学科跟踪等相关服务,考虑为读者精准推送相关联信息和在未来可提供帮助的潜在资源。
3 结语
随着图书馆不断优化信息服务的水平,为各类读者提供越来越人性化的个性服务,大数据的影响也将越来越深入到图书馆日常的管理工作中,大数据思维也将潜移默化地改变着图书馆管理人员的工作思维方式,引导其不断创新管理,优化流程,为读者提供更多人性化和个性化的服务。
参考文献
[1] 大数据时代的思维变革[J].重庆理工大学学报(社会科学),2014.8.
[2] 蔡莉静,陈曹维.现代图书馆信息服务[M].北京:海洋出版社,2006:47.
[3] 樊伟红,李晨晖.图书馆需要怎样的“大数据”[J].图书馆杂志,2012.11.