数据挖掘在高校图书馆服务中的应用探究

2021-09-10 19:24李诏然

大学·社会科学 2021年2期

李诏然

摘要：随着时代的发展，社会已然进入大数据和云计算时代。人们可以通过数据的收集、分析和处理，挖掘出数据背后的价值，进而利用数据的价值去创造更大的价值，这对高校图书馆服务来说也是一样的。高校图书馆可通过对读者数据的挖掘，再通过有效的算法分析处理，判断出读者兴趣以及读者与图书资源的联系，进行合理的资源安排，并且给读者提供个性化的服务。本文首先分析数据时代的内涵以及高校图书馆数据挖掘的相关算法，其次分析数据挖掘在高校图书馆服务中的应用途径，以期将图书馆服务的潜力彻底释放，创造出更多的价值。

关键词：数据挖掘；高校图书馆服务；应用

中图分类号：G251文献标识码：A文章编号：1673-7164（2021）05-0127-02

近年来，高校图书馆的图书资源利用率不断下降。针对这种现象，高校要不断挖掘高校图书馆的服务数据，从这些数据中挖掘出潜在的价值，更好地进行图书资源采购、编目等，为学生提供个性化的图书资源服务，顺应时代的变化，提高图书资源的利用率，更好地为高校学生服务，为社会培育出更优秀的人才。

一、数据挖掘

（一）挖掘数据的内涵

在当前的大数据时代，人们的衣食住行等各方面行为都被数据化改造，“挖掘数据”是指对人们的行为数据进行收集、转换分析和模型化处理，挖掘出数据背后的价值，从而为图书馆服务的各项决策提供数据支持，大数据“4V”特征包括数据体量大（Volume）、数据类型繁多（Variety）、价值密度低（Value）、利用速度快（Velocity）。

（二）挖掘数据的过程

挖掘数据可以从采集与存储、计算与处理、智能运营三方面分析。首先是采集和存储，其中最关键的就是“学生”与“图书”两个数据主体，高校图书馆利用自动化图书系统中的大量借阅业务数据，能够轻松采集到学生的借阅数据，再将其存储在云端；

其次是计算与处理，需要运用到精细的算法，而高校图书馆可以利用开源的云计算框架或软件对学生借阅数据进行处理，例如Hadoop、Mapreduce、Spark、Pentaho BI等开源框架，也可与社会第三方专业云计算企业寻求合作，需要根据实际情况而定；最后是智能运营，简单来说就是根据挖掘的数据价值做好图书馆各项事宜的规划，从而为图书馆服务的各项决策提供数据支持。

二、图书馆数据挖掘的常见算法

图书馆对学生借阅数据的收集较好处理，而如何从杂乱且繁多的数据中找出有效的信息则是重点问题，要考虑到方方面面的因素。高校图书馆数据挖掘的算法有很多，通常包括以下几类：

（一）关联规则

两个或多个数据具有关联性就是关联规则，关联分析即找出数据中的关联性，例如一名临床医学的学生借阅了《解剖学图谱》和《细胞生物学》，这有可能只是小概率事件，而很多名临床医学的学生借阅了这两本书，说明这两本书具有关联性。分析两本书的关联性，就能够为下一位临床医学生进行推荐。

（二）分类算法

学生的借阅数据多样且烦琐，高校可通过对借阅样本数据库的多种行为数据进行细致的划分，等于按照标签进行分层次、分类别的划分，通过划分找到学生精细的借阅需求和借阅特征的信息，后期可以根据学生的借阅需求进行科学采购，也可以对借阅特征進行图书资源的高效化存档[1]。

（三）聚类算法

聚类算法也叫群分析，即以“学生”这一数据来源为主体，将借阅数据库中划分出不同的借阅群体，通过相对应的数据分析，概括出每一类借阅群体的借阅模式或者借阅习惯，是挖掘算法中的重要类别之一。

（四）时间序列法

高校图书馆可将若干的借阅数据资料按时间序列排列成数据序列，在众多数据的集合下，其变化趋势和相互关系较为明显，可以利用过去的变动趋势预测未来，不过受到偶然因素的影响也很大，要尽可能消除偶然因素影响，常用算术平均、加权平均和指数平均等来减少偶然因素。

三、数据挖掘在高校图书馆中的应用途径

（一）加强图书馆规划。互联网时代下，对读者信息、图书条码进行扫描，其借阅信息会立刻汇集到后台海量数据库中。通过对数据的分析，可以加强图书馆的规划，例如将借阅量大的图书类别放在易于查找的楼层和书架上，为学生提供更好的服务。图书馆可将两本具有关联性的图书放在一起，将全部图书进行最优化的规划安排，或许看起来很乱，利用起来却更加有效；或通过数据挖掘发现馆藏中破损、编目不正确、索引关键词有误的图书，对其适当调整，充分发挥图书价值。

（二）根据需求合理采购

以往图书馆的图书采购是粗放型的，由采购人员决定采购的类型和数量，而在互联网时代下，高校图书馆采购则是根据需求而定，根据学生的借阅图书数据，采购借阅需求高、借阅次数多的图书，再结合实际馆藏决定采购的类型，分清哪些是必需的，哪些是可以稍后补充的，采购人员在做好充分预算，做好计划，拓宽采购渠道后，才能做到择优采购，提升采购质量。例如，通过对图书资源流通的记录，一类图书明明很多，但借阅的人数还是很多，借阅流通很快，就需要相关人员再扩增采购量[2]。

（三）做好图书馆人事安排

图书馆借阅数据是海量的，学生到图书馆借阅的数据也是有规律的，应根据对图书借阅时间序列算法的分析，找出学生图书馆借阅的时间规律，精确到每一天、每一周、每一月，确定最优的开馆闭馆时间，修整时间和人事安排等。图书馆工作繁多且细碎，管理人员短缺是常见的现象，将图书馆的人事安排精细划分，并且提供相应的勤工俭学岗位，在图书馆借阅高峰期，设置勤工俭学岗位，多配置几位勤工俭学的学生，减轻新工作人员的负担[3]。

（四）数据挖掘催动人工智能落地

图书馆可利用数据挖掘，加强对人工智能的开发，让人工智能代替传统人力，进行一些简单的编目、新书通报、图书归整、引导、图书查询、简单交互咨询等工作，为高校学生提供更好的服务。

例如，2017年5月，由南京大学计算机科学与技术系、计算机软件新技术国家重点实验室陈力军教授课题组研发的智慧图书馆二期（智能机器人）在南京大学杜厦图书馆正式发布，名为“图宝”的机器人融合了超高频RFID、互联网、物联网、人工智能等技术，可对整个图书馆藏书进行自动化盘点，检查是否存在错架图书、藏书和丢失等现象，实时更新图书位置信息，并可以和人简单交流，做出指示，与图书馆系统形成无缝对接，成为智慧化的资深机器人馆员。

（五）提供个性化服务

高校图书馆的图书资源服务，最终对象是高校学生和教师，因此引导读者借阅，为读者提供更好的借阅服务才是根本。

对此，图书馆可以将所有的借阅数据汇总，根据不同专业群体进行大致划分，根据图书借阅的规律性，给学生和教师推荐相应的读物，实现个性化服务，进而加大图书资源的可利用率。这会让高校图书馆的服务变得更具质量，满足大多数人的需求[4]。

（六）将数据挖掘作用在身份验证和支付上

高校引入各类图书或文献索引，投入了大量的经费，低价有偿提供图书借阅服务，才能促进图书馆可持续发展。对数据的挖掘也可以作用在身份验证和支付等多方面，例如在借书、还书、查阅等环节应用身份验证技术，提升效率，以方便读者。例如2017年4月11日，浙江理工大学宣布将百度云人脸识别等技术应用到图书馆管理中，读者进行人脸识别，查阅图书情况，查自己名下的借阅请款、支付情况、借阅身份等，更加方便快捷。

四、数据挖掘技术支持下未来高校图书馆空间建设趋势

首先，高校图书馆需要合理增值智能化设施设备，除了配备传统工作设备以及各种数字制作工具之外，还可以在空间中配置智能机器人以及数据管理与分析系统、室内定位系统等，提供更好的感知体验[5]。其次，高校图书馆需要合理利用数据挖掘为用户推送智慧精准的服务。移动端的推送内容应该为用户提供更精准以及智慧的信息服务，从而满足用户的复杂需求。最后，在数据挖掘技术下，高校图书馆的服务必然会越来越精细化，对馆员的要求也更高，所以未来高校图书馆还需要培养高素养的智慧馆员。他们除了要具备基本的素质技能要求外，还应该掌握更多先进的技术。

從高校图书馆空间的发展趋势来看，在未来，其物理空间质量会越来越高，而虚拟空间是一个关键点，在未来这项功能会越来越强大[6]。而图书馆的服务也会不断转型，变得更加智能。在未来，智慧空间将是图书馆空间发展的新类型，也是最终的建设趋势。

五、结语

综上所述，在互联网时代下，高校图书馆需主动转变服务模式，利用海量资源优势，注重技术与服务的深度融合，挖掘数据，找出数据背后的价值，让数据在图书馆规划、采购以及提供个性化服务等方面发挥作用，提升图书馆的价值，为学生提供更好的图书借阅服务，助力高校“双一流”建设。

参考文献：

[1]柳益君，何胜，冯新翎，等.大数据挖掘在高校图书馆个性化服务中应用研究[J].图书馆工作与研究，2017，1（05）：23-29.

[2]张佳琴.数据挖掘在高校图书馆个性化服务中的应用[J].漯河职业技术学院学报，2013，12（06）：188-189.

[3]于永清.数据挖掘在高校图书馆读者服务中的应用[J].佳木斯大学社会科学学报，2008，26（02）：176-177.

[4]黄丽娟.数据挖掘在高校图书馆个性化服务中应用探讨[J].吉林广播电视大学学报，2019（11）：106-107.

[5]宋爱香，胡西民，李丹莎.基于聚类与GRNN算法的图书馆读者借阅行为分析[J].电子设计工程，2020，28（11）：1-4.

[6]罗昊.数据挖掘下的高校图书馆信息资源管理探讨[J].食品研究与开发，2020，41（08）：2.

（荐稿人：樊桂兰，河北工业职业技术学院科长，副研究馆员）（责任编辑：邹宇铭）