袁彦 湖南工艺美术职业学院
引言:目前社会上的企业都在积极的将大数据应用在各个方面,因这是一个用数据说话的时代,在这种环境下,要学会使用数据思维,而作为公共图书馆,表面上是一个服务行业,但是实际上其中可以收集的数据资源十分的丰富,在大数据的支持作用下,能够对整个图书馆的情况做到细致入微的了解,这样有助于分析图书馆读者的个人喜好和行为偏好,并及时合理地调整图书馆的相关决策,不断提升服务效率。
目前大数据已经成为了社会上的热门话题,但是在图书馆的管理领域中很多人觉得大数据还很遥远,因此在实践中并没有开始围绕基础数据展开一系列的挖掘工作。需要注意的是,尽管很多数据虽然获取比较方便,并且内容比较简单,但是在图书馆的各项工作中,这些数据很有可能发挥重要的作用。到目前为止这些数据还没有应用在图书馆的工作中。图书馆对于大数据的认识只是处于初级阶段,在2013年,国内的一些图书馆开始把部分的业务服务数据公布在社会上的一些平台,最先采取有力措施的是浙江省图书馆,它率先举办了“我的阅读2012”这一活动,这项活动的内容包括所有参与这项活动的读者过去一年的阅读账单,这一举措得到了广泛的响应。通过这些数据,可以得知浙江图书馆注册读者的数量,平均每人借阅多少册书,哪位读者借阅量最大,哪本书被借阅的次数最多等等,与之殊途同归的是,厦门图书馆在微信公众号上增加了阅读账单的功能,当读者绑定了账号之后,就能够详细的了解自己在2014年的全年借阅量。但是这些数据缺乏有效的整合,各地区的图书馆各自为政,管内的业务系统也并不一致,在数据整合方面面临一定的挑战。
在目前的发展阶段中,图书馆拥有的数据并不少,但是大数据分析需要更全的数据,特别是采用绩效管理模式的图书馆,需要的数据源更加的多种多样,因此要梳理馆内的内部数据,更要对管内的数据加以分析,进行有目的的查缺补漏,并且还要筛选和剔除重复的数据,并制成完备的数据报表,这种报表的特点是清晰明了,并且作为对比和参照,一旦数据有异常情况,也能够及时地发现和解决。这样才能保证生成的报表具有一定的参考意义。以一些使用频率较高的文献为例,需要在数据系统建设伊始就做好相关的统计工作,比如根据不同的数据字段制成统一的数据表,运用命令调用确定各种数据字段的内容。在东莞的图书馆,通过调用后台的日志,借助统计方法,可以对过去一年图书馆的文献借阅量进行统计和分析,并根据不同文献的借阅次数进行排序,可以得出整体的借阅量。在调查结果中显示成人阅读的内容除了小说还有家庭教育,另外还有个人心理学、人生观与人生哲学、图形图像识别和证券市场。对于这些数据,图书馆的利用情况不是很好,并没有真正的发挥数据信息的价值。
在使用数据产品时,要发挥数据产品重要优势,提高决策的准确性,并且使决策的价值最大化。为了达到上述目的,需要应对以下问题:第一,必须分清哪些数据对读者有价值,同时区分这些价值的内涵和类型;第二,必须学会如何合理地搜集和获取数据。一般而言,从整体角度看,图书馆的数据种类包括用户的行为、文献的服务等,那么对这些数据种类进行细化,可以形成不同的数据产品,比如对用户的行为数据进行分析和总结,那么就可以采取按照不同时间段进馆的人数、读者的文化水平以及借阅情况等统计的方式。至于文献服务方面的数据,更是类型不一,比如文献的种类、年份、出版社、作家等。这些独一无二的数据不仅能够帮助图书馆完善自身建设,同时还可以深入挖掘,并输出到政府部门,为政府的管理和服务提供一定的参考。利用这些数据资源与资源、文献提供商进行商讨,帮助提供商拓宽服务的范围、增加服务的方式、实现服务模式的创新。总之要积极的将这些创新的服务模式引入到社会的群体中,将数据资源信息作为基础,与之开展对接合作。
首先,大数据的目的和定位必须清晰,因为其能够为图书馆的建设和服务提供依据,并且通过源源不断地提供数据,完成相应的服务。其次,需要知道图书馆大数据是一种高效的科学工具,鉴于图书馆管理模式层级较多,可以通过使用对应的数据,对各个层级进行分析,从而使结果更有针对性。最后从管理层到一线的员工要清楚的掌握数据的产生源,也要清楚的明白数据的结果要用在哪里,另外他们也要对自己负责的内容做到清楚掌握,结合业务特点和运营情况。可以根据类型比较特殊的数据,对相关的用户群进行细分,分析和总结固定用户群的规律和特点。也可以根据用户的特征,主动进行数据的查询,将各个数据更好地串联起来,发挥不同种类数据的优势,而且这样可以使得服务更加人性化和个性化。对于数据的结果,如果获得了数据的结果,还需要进一步的认证,之后根据数据的最终结果,采购相应的资源,也可以在这一过程中推广服务。但是需要注意的是,对数据的统计和分析不能单方面进行,还要与之前的数据进行对比,这样才能找到不足之处,并且不断完善和改进,从而确保数据的科学性,丰富数据的价值。同时还需要做好数据的管理工作,因为在统计数据的过程中,存在一些数据并不是由图书馆统计的,也不是由图书馆进行处理的,比如数字资源在线使用数据,因此合作的双方加强管理要考虑到数据的安全,考虑到用户的安全隐私,考虑到数据的可信度,在数据的使用方面也要多加防范。
使用大数据并不一定需要更新或者是替换技术平台,结合我国经济现状,图书馆方面不适合在技术平台方面做过多的资金投入,所以需要利用现有的技术平台,结合相关业务,进行局部的改进和创新,达到随时能够进行数据统计的目的。比如要将大型的数据分散到月、周、日上,在统计之后进行汇总。以interhb为例,在很多的图书馆中都采用了这一系统,此系统在数据库表中包含了很多较为完整的业务数据信息,在调用时只要以需求为依据即可[3]。另外,大数据的统计工作需要分散进行,不能过于依赖图书馆,也就是说要丰富统计的渠道,比如利用一些信誉度良好的机构、网站或者是软件进行数据的统计,这样能够提升统计的效率,并且分担图书馆的压力,这在一定程度上说明借助第三方的力量同样可以得到有价值的数据。在大多数的情况下,大数据项目并不需要建设Hadoop系统,站在技术层面的角度,已经能够提供成本较低的大数据处理工具,也能提供用于存储大数据的云端系统。有些系统与APP有着一定的相似之处,图书馆要根据自己的特点和需求,合理选择工具,保证工具发挥最大效益。
总结:综上所述,在大数据的发展趋势下,国内的公共图书馆必须要抓住机遇,努力让自身的管理和业务获得进一步的发展。要加强利用第三方平台的优势,要不断创新管理观念,借助先进的科技,结合实际情况,采取行之有效的方法,让图书馆的服务内容更加的丰富,让图书馆的服务形式更加多样化。