浅谈大数据时代背景下的高校图书馆数据监护研究

2020-07-13 09:40熊涛
卷宗 2020年12期
关键词:高校图书馆大数据

熊涛

摘 要:在大数据时代中,数据已成为最重要的资源。高校图书馆开展数据监护工作,实现高效管理和妥善保存意义重大。本文对高校图书馆的主要数据做了简单分类,并介绍了高校图书馆数据的主要内容,最后分析了高校图书馆进行数据监护的重要性,为今后高校图书馆开展数据监护工作打下理论基础。

关键词:大数据;高校图书馆;数据监护

1 高校图书馆数据分类

大数据可根据其组成结构不同分为结构化数据、半结构化数据和非结构化数据这三种类型。其中能够用二维表结构来逻辑表示的数据称为结构化数据,否则称为非结构化数据;而半结构化数据是一种数据库集成的数据模型,具有一定的结构性,但是其结构性不是统一的。大数据的最小单位为bit,依据顺序从小到大还有Byte、kB、MB、GB、TB、PB等单位,1kB=1024Byte,1MB=1024kB,以此类推。图书馆的大数据是复杂多样的,以上3种类型的数据都有,其中以结构化数据为主,如果按照这种方式对图书馆大数据进行分类并不能较好地表达图书馆的数据。根据图书馆的工作特点,应该将图书馆的大数据分为基础数据、用户行为数据和其他数据[1]。

1.1 基础数据

基础数据包括图书馆基本数据、读者数据、纸质资源数据、电子资源数据等。图书馆基本数据包括图书馆人员、图书馆资产、办公等方面数据。读者数据为图书馆借阅系统中的读者基本情况、图书馆的微信微博用户数据和图书馆座位预约系统数据等用户数据。以上几类数据为结构化的,量不大,为MB级别,增长速度缓慢,易于管理。纸质资源数据包括馆藏书目信息、期刊目录信息、报纸信息等,此类数据为结构化数据,量比较大,为GB级别,增长速度一般,每年以相差不多的速度增长。电子资源数据包括图书馆购买的各种电子资源数据、特色资源数据和光盘数据等。电子资源数据为结构化数据,量非常大,为PB级别,增长速度较快,几乎每时每刻都在变化,由于目前大部分高校购买的电子资源为远程镜像,所以不易管理,也不易统计。

1.2 用户行为数据

用户行为数据包括纸质资源利用情况、电子资源利用情况、微信利用情况、图书馆主页访问情况、门禁数据、空间利用情况、VPN远程访问数据等数据。纸质资源利用情况数据包括读者借阅信息和图书利用情况数据等。电子资源利用情况数据包括读者访问信息、检索信息、浏览下载信息、文献传递信息等。空间利用情况数据包括自习室座位预约系统利用数据、研修空间和研讨空间利用数据等。VPN远程访问数据包括用户账号信息、访问途径、访问内容、下载流量信息等。以上4类信息数据量较大,为GB级别,时间长可达到TB级别;数据结构较复杂,3种类型的数据都有,有在本地的,也有在异地的,不易管理。电子资源利用情况不易获取,增长速度非常快。微信利用情况、图书馆主页访问情况和门禁数据的数据级别为GB级,类型为结构化数据,增长速度缓慢,易于管理。

1.3 其他数据

其他数据包括学科服务、阅读推广服务、咨询服务、讲座培训等方面的数据。学科服务数据包括服务专业情况、服务对象数据、学科服务绩效数据等。阅读推广服务数据包括阅读推广组织数据、参与群体信息和阅读推广效果信息等。咨询服务为解答读者相关问题的回复,其數据包括咨询者信息、问题信息和解答信息等。讲座培训数据包括讲座内容信息、参与者信息和讲座培训效果等数据。其他数据普遍具有数据量小(MB级别)、分布广泛、获取难度较大的特点,大部分为半结构化和非结构化数据,需要对数据进行深加工才能加以利用。

2 高校图书馆实施数据监护的重要性

2.1 有效促进数字资源共享

建立健全高校图书馆大数据的监护管理工作体制,可以有效促进数据资源共享,且防止数据丢失。对于要分享给他人的科研数据来说,可以省去作者本身对数据的管理监护,既节省了精力又节省了财力,只要管理得当,数据可以永久性保存,不会丢失。而对于其他的科研人员,可以通过高校图书馆的平台搜索自己想要的信息,从已有的数据信息中查到相关的数据,给自己的工作以启发,也很好地避免了重复性工作的出现。当前科研人员交流的内容主要是科研成果,而研究的第一手原始数据资料尚没有合适的交流渠道。在当前数字化背景下,科研工作者的各项科研活动都可以通过计算机完成,包括实验数据、调查记录等,这就形成了大量的电子数据,为网络化共享提供了可行性。而且如果研究数据丢失将会导致科研成果不完整,降低科研价值。图书馆凭借高稳定性和可信度优势,可以建立一个由专人负责的长期运作的数据平台,用以完整地收藏此类电子数据,符合数字化时代的信息需求。

2.2 为读者寻找信息提供了便捷

图书馆对采集到的各类服务器监测的历史数据和读者的阅读行为、社会关系、个体特征数据进行整理、分析和决策,以此来准确预测和分析读者的阅读需求,监控读者阅读活动的舆情,提升读者行为安全和质量管理水平,为图书馆改革服务模式,创新服务举措提供精准的数据决策支持,切实提升读者服务水平。为此,图书馆应重点关注基于物联网的大数据采集与管理平台,加强以读者服务为中心的数据感知层、平台层和应用层的数据监护,确保基于大数据决策的准确性、科学性和前瞻性。除了数据共享方面的重要性,通过数据监护管理的整理分析及更新,高校图书馆监护管理系统能为读者快速地寻找到想要的信息提供了便捷。

2.3 可以大大的促进图书馆自身的发展

随着读者需求和用户QS标准的不断提高,以往传统的数字资源保存方法已不能满足大数据时代的需求。现代图书馆大数据管理除了要保证数据资源的可用性、安全性、经济性和易控性,还需要根据数据生命周期的规律,依据最新的大数据监护技术对数据资源进行存储和管理,并不断地进行完善和优化[2]。高校图书馆大数据监护管理系统的运行大大促进了图书馆自身的发展。随着信息服务领域竞争的日益激烈,高校图书馆要想在竞争中屹立不倒,充分发挥自身的价值,就要有自己的独特之处。大数据监护管理系统的发展运行,将科研数据有效融合到高校图书馆管理之中,既方便了读者对科研信息的浏览查阅,也充分发挥了高校图书馆的价值,更有利于自身发展。

参考文献

[1]袁梁.大数据时代高校图书馆个性化服务研究[J].图书情报导刊,2018,3(10):19-22.

[2]李成.高校图书馆大数据监护系统的研究[J].新课程研究(中旬刊),2016(08):102-103.

猜你喜欢
高校图书馆大数据
大数据环境下基于移动客户端的传统媒体转型思路