用大数据提高高校图书管理水平

2021-03-08 07:00李继萍晋中学院山西晋中030600
文化产业 2021年15期
关键词:馆藏图书图书馆

李继萍 晋中学院 山西 晋中 030600

在互联网高速发展的今天,大数据已在日常生产生活的各个方面广泛应用。在高校图书管理中,同样会产生大量的数据,包括书籍的名称、位置、数量、状态、读者、借阅等数据。如何利用大量现成的数据,实现对各种信息的高效管理,提升高校图书管理的工作效率,就成为管理者必须思考的问题。大数据收集多样、全面、海量的数据,能够快捷、多元化的呈现出来,具有很高的利用价值。

一、大数据的概念和特点

大数据的具体概念,现在还没有统一的认定。在《大数据时代》一书中,作者提出:大数据是不采用抽样调查这样的捷径来获得数据,而是采用全体数据的方法。常见的定义认为,大数据不仅包含海量的数据,在数据的时间、度等内容维度上也是超越了海量数据,即包括结构化的数据,也包括非结构化的数据,如声音,图像等。

大数据的特点是数据体量大、种类繁多、处理速度快、以及价值密度低的4V特点。

第一,数据体量大。现在大数据、在各类设备不间断的采集下、数据非常庞大。

第二,数据种类繁多。图书馆大数据平台连接了人、机、物。数据包括了静态数据如各类图书数据的属性,读者的个人资料等。动态实时数据如读书的借阅情况,读者的行为数据等,文本数据,时间序列数据等结构化、半结构和非结构化数据。同时读书馆数据有人与系统交互查询,咨询产生的交互数据。

第三,价值密度低。比如对读者入馆阅览情况的视频监控,有用的数据可能只有一两秒。

第四,处理速度快。大数据的处理,通常在几分之一秒内进行分析,以支持决策制定。在性能要求方面,对实时在线数据的处理要远高于离线数据。

二、大数据的处理技术

只有经过专业处理的大数据,才能发挥它在预测、决策、洞察和流程优化等方面的价值。

第一,云计算技术。大数据常常与云计算和大数据分析技术联系在一起。目前来说,云计算技术是大数据存储和处理的重要组成部分,这是传统的数据管理技术无法实现的。大数据以分布式处理等手段存储在平台上,云计算的核心是计算能力,两者的结合实现了对数据的存储和处理,让海量的数据的价值得以实现。

第二,数据传输及存储技术。产生的海量数据传输及存贮,会给图书馆系统平台带来极大的负担,因此可以通过数据的压缩可以减少数据量,提升存储效率。常用的数据压缩技术有Lempel—Ziv,是最流行的无损存储算法。在数据存储方面,通常采用分布式文件系统,如Hadhoop的HDFS等。对于实时性数据要求高的场所,可以搭建多级存储系统,以满足对数据的分析和计算。

第三,数据挖掘技术。图书馆管理中常用的挖掘技术有统计技术。即根据给定的数据集合,假设一个概率或分布模型,在采用相应的方法挖掘需求的数据。统计技术可以用来统计图书的借阅情况、读者的阅读偏好、场馆的使用情况等。概念描述也是一个适合图书馆使用的挖掘技术,用于描述某类对象的内涵与概括特征,适用于图书馆对读者进行画像。

三、大数据视野下的图书馆业务

(一)图书馆天然具有大数据的特征

首先,图书馆的数据种类非常多。图书馆既有大量的结构化信息,如馆藏文献中的纸质图书、光盘资源、电子资源,也有非结构化信息,如读者信息,采购信息、场馆信息、人员信息等。这些数据的特征如编码方式、格式、应用特征等都可能存在不同,形成大量的异构数据。

第二,持续产生大量数据,包括图书的借阅信息,读者的借阅行为,场所的使用情况等。

第三,信息技术的使用,个性化、学科化越来越专业,更多数字化图书的编辑出版发行,阅览途径的多样化,读者对服务的要求也越来越高。图书馆必须转变服务的策略,要对大量数据进行分析和挖掘。

第四,图书馆开始提供更多个性化的服务,如24小时服务,网络服务等。

第五,对大量的图书信息、读者信息、读者行为等进行统计和挖掘,发现新的服务方向。

(二)大数据的来源

数据来源主要有以下几个方面。

第一,将过去已经存在的、以非数字化形式存贮的数据进行数据化处理,如馆藏图书、期刊、报纸、会议资料、借阅记录等。

第二,采购的电子版图书。

第三,读者个人信息、图书借阅情况、查询情况等。

第四,传感器、监控系统、人脸识别系统收集到的信息。

第五,与读者的交互信息。

(三)大数据的挖掘和使用

大数据的特性决定了必须对大数据进行有效的挖掘、整理、统计、分析,才能把数据用于优化业务、精准服务、文献建设和决策支持。

第一,对读者行为数据的挖掘。分析读者数据是为了给广大师生提供更精准化的服务。来源于读者的电子资源使用数据、管理系统的运行数据、科研数据、读者的借阅信息、借阅频次、借阅偏好等网络交互行为等,都与读者的行为有关。通过深入挖掘和整理这些数据,形成统计或分析结果,来优化业务流程,预测读者的行为并推行精准化的服务。

比如在图书馆人数比较多的高峰时段,可以安排培训资源课程,宣传图书馆数字资源。根据阅览室的读者类型,开展定向资源的推送。挖掘读书的个人画像,引导读者的阅读行为,采取科学的文献保障政策。定期利用大数据生成读者个人数据报告,展示读者在图书馆的借阅、自习、书单等记录,让读者能够清晰的了解到自己使用图书资源的情况。对读者的入馆行为进行分析,了解读者的行为规律,遇到人流高的时间段,提前做好预警。

第二,对图书馆馆藏资源的使用情况和采购决策进行评估和优化。图书馆有大量的馆藏资源文献,在专业性和信息收集方面做得很好,同时对图书、期刊、数字资源的需求也很高。通过读者对资源的利用情况、不同文献的借阅比率,对馆藏图书进行评价,可以了解馆藏的结构,文献的保障水平等。这样为未来图书馆的图书采购、图书结构的调整、文献资源的剔旧等进行优化,使图书馆的各类馆藏资源布局合理,提高文献的利用率,提高各部门的决策效率和响应速度。

四、大数据管理存在的难点

大数据的应用越来越广泛,随着物联网的普及,图书馆的每一本书、每一个读者、每一个行动都被赋予了不同的编码,需要大量的设备去识别、记录、上传这些数据到平台。这就需要对现有的图书馆进行改造或新建,增加必要的设备。

数据安全也是在大数据的使用中必须重点关注的。可以建立防火墙,定期对管理系统进行升级,要做到实时监控,及时修补系统漏洞,防止机密数据被窃取或遭受恶意攻击。同时为了保护读者的个人敏感信息,必须考虑读者数据的保护、开放和共享的问题,谨慎的采集和使用数据。

大数据已经覆盖到生活的方方面面,高校图书馆也逐步在信息化和网络化,在高校图书馆的管理和服务中,有效使用大数据显得尤为重要。在文章中,讨论了大数据的特点、处理技术、采集和挖掘使用。高校图书馆应该积极使用大数据,对数据进行挖掘和分析;为读者提供精准化和个性化的服务,把工作的重点从以“资源”为中心向以“服务”为中心转变,提升服务水平,提高管理水平。

猜你喜欢
馆藏图书图书馆
馆藏
图书推荐
博物馆的生存之道:馆藏能否变卖?
欢迎来到图书借阅角
知还印馆藏印选——古印篇
图书馆
班里有个图书角
介绍两件馆藏青铜器
去图书馆