李小玺 李学
摘 要:顺应时代的发展,遵循高校改革方案,促进高职院校图书馆的发展建设工作迫在眉睫。通过对数据的收集、整理和分析发现,图书使用率低、图书资源浪费是高职院校普遍存在的问题。将数据挖掘技术和图书馆管理有效结合,从数据收集、整理、分析、处理、挖掘、实施等方面来解决这一难题。
关键词:高职院校;图书馆;数据挖掘
相比于高等院校的智慧图书馆、移动图书馆,高职院校图书馆的发展受到较大阻力。办学性质在某种程度上制约了图书馆的发展,在资金、设备、技术等方面尤为明显。本次研究,无论设备支持还是技术支持几乎都是零成本。基本上解决了图书使用率低、图书资源严重浪费的问题,使得图书馆这一典型的服务性场所能为广大师生提供更优质的服务。
1 高职院校图书馆现状分析
通过对同类院校的走访和调查以及网上开展的问卷结果的分析,发现高职院校图书馆中普遍存在如下问题:(1)图书使用率低,图书资源严重浪费。一些冷门图书甚至无人借阅。(2)图书馆藏书目标不明确,经常出现购置新书无人借閱的情况。缺少对读者的借阅需求分析,从而造成资金浪费。(3)馆藏分布不合理。很难找到甚至找不到读者需要的图书,导致地理分布边缘化的图书长期无人借阅。(4)图书管理人员的工作模式欠佳,严重影响工作效率。
2 数据挖掘技术简介
数据挖掘,一般是指从大量的数据中自动搜索隐藏于其中的、有特殊关系的信息的过程。数据挖掘技术帮助人们从数据的海洋中提炼出有价值的知识和规则,以从不同的角度、方面、侧重点去研究和分析,使数据得到更为充分的利用。数据挖掘技术改变了原有的信息管理模式,不再局限于信息的采集、整理、存储等工作,转而升级为更高层次和更加复杂的信息整合、数据处理、知识提取等工作。
3 数据挖掘在高职院校图书馆中的应用
3.1 研究设计
通过对数据挖掘技术的研究和使用,找到其在图书馆中的主要应用方向。(1)数据分析:对读者的借阅历史记录进行分析与研究,挑选出数据挖掘工作所必要的数据,进行数据加工和处理,使之成为能够进行数据挖掘的数据源。(2)数据挖掘:选择聚类算法中的K-MEANS算法对读者进行数据分析。将读者细化分为多个相似的读者群。在群内运用关联规则算法中的APRIORI算法对数据进行数据挖掘。然后分析结果,为向读者推荐图书做好准备。(3)功能实现:利用ASP,Java,SQL等技术,在原有图书管理系统中加入图书荐购功能模块,方便收集用户推荐书目。利用网页的发布功能,将数据挖掘的结果(热门图书排行榜、关联图书一览表、专家推荐功能书目单)公布在学校图书馆的网站上,方便广大师生查阅图书资料。(4)图书分类:根据中图法图书分类,对图书大类进行关联分析。对于读者借阅的书目,根据中图法分类提取大类的索书号,然后通过关联分析,找到隐藏在大类之间的关联关系,根据关系来调整图书的上架、排架、下架和采购工作。
3.2 过程实施
挖掘工具:数据挖掘属于典型的面向数据的分析与管理技术,能够为决策提供必要的数据支持。本次研究采用SPSS MODELER数据挖掘工具完成应用开发,其算法比较先进,具有过程直观、功能强大的优势,能够充分满足系统开发过程中用户的个性化需求,并能够显著提升系统开发的效率并缩短开发周期。
数据选取:本次研究将本校图书管理系统中的读者借阅记录信息作为数据源进行数据挖掘,具体数据为2018年1月—2018年12月的读者借还书记录。进入图书管理系统后,选择相应的时间段进行查询,结果显示近一年的读者借阅记录,通过系统自带的导出功能将原始数据导出为Excel表格,方便后续使用。
数据预处理:空白数据会对数据挖掘结果的准确性产生较大的影响,需要查找图书数据库将必要信息补全,或者通过将无法填充的数据删除等方式来保证分析的准确性。一天内多次借还相同书目则会产生重复数据,对挖掘结果造成不利影响。因此,在挖掘前要识别并删除冗余、重复的数据,减小数据规模,提高数据的清晰度。
挖掘分析:本次研究预计采用聚类分析和关联规则分析进行数据挖掘。通过聚类分析将读者分成几个群,同一群中读者有相似的爱好。通过观察相同读者群内读者的节约行为,准确了解读者的阅读喜好,从而有针对性地开展个性化服务。使用关联规则挖掘的目的是分析用户之间图书借阅的内在关联关系,主要采用索书号和分类号开展研究工作。
4 研究价值
(1)提供有效教育的功能。图书馆是学生获取知识的最佳场所,可以运用数据挖掘技术智能推荐读者所需书籍。相比于以前读者自己检索或管理人员人工推荐的方法,更加准确和高效。(2)优化馆藏建设的功能。通过关联数据分析,发现图书之间的潜在联系,对图书的排架、整理、上架等工作提出科学的指导意见。(3)推荐图书购置的功能。可以采用数据挖掘技术中的遗传算法,利用种群进化来主动寻优,根据不同领域热度给出不同的权重,为采购方案的制定给出科学的指导意见,有效利用购书经费。(4)新启动的功能。推荐系统的核心问题在于新用户启动和新书启动。解决新用户启动的问题:读者登录后,系统根据读者的个人信息(系部、专业),显示当前图书使用率排行榜,同时读者可以查看一定时期内的热门图书排行榜,有助于学生选择图书。解决新书启动的问题:利用读者的图书荐购信息对新书进行关联挖掘,找到新到图书与读者之间的关联规则,然后向读者进行推荐。
5 结语
图书馆作为我国的传统服务行业,不仅肩负着为广大读者提供信息资源的重要使命,还肩负着保护人类文化遗产的重要责任。高职院校图书馆要想更好地为广大师生提供服务,必须利用现代化的信息技术,对服务管理工作进行创新,加快图书馆资源的数字化建设。
[参考文献]
[1]严春来.大数据环境下数据挖掘在高校图书馆中的应用研究[J].网络安全技术与应用,2017(3):113.