刘勇梅
(吕梁教育学院 山西 吕梁 033000)
在信息时代中,信息日益膨胀,图书馆访问者检索出的信息有所出入,无法有效利用图书资源,在一定程度上影响了图书资源管理与决策的科学性,不利于图书馆的发展。数据挖掘技术是数据库、统计学、人工智能为一体的技术,可全面、深入分析大规模数据,并准确挖掘出潜在的、有价值的信息[1]。在图书馆管理中引入数据挖掘技术,可真正掌握读者兴趣与需求,积极整合图书资源,科学调整图书馆藏书,以此来提高图书服务质量。
数据挖掘实质上是一个发现知识的过程。一般而言,数据挖掘是统计、数据库、模糊数学、神经网络等学科为一体的技术,从不完善、模糊、大规模的随机数据中准确识别有价值、有潜能的数据处理过程[2]。其主要特征表现为如下几点。
数据的分类,则是细致、准确地分析数据库中的各数据,并对不同类别进行准确描述,或者确定分类模型,或者对分类规则进行明确,然后根据分类规则分类与记录其他类型。同时,积极预测已经分类的模型,并结合实际情况,深入剖析相关数据及相关特点,并基于这些所获取的数据信息对新收集的数据进行深入分析[3]。
对于数据挖掘而言,关联规则是重点技术[4]。在数据库寻求的过程中,各数据项目中必然存在一定的关联规则。对数据关联进行分析,可找到大多数数据间的密切关系。挖掘频繁出现的数据,以此来提升关联规则挖掘的速度与质量。另外,数据管理分析的重点在于寻找到各数据中所隐藏的关联情况,经过对消费者购买的不同商品,联系分析出消费者购买习惯,进而为零售商营销方案提供可靠数据。
对于数据分析而言,聚类是重要分析工具,综合分析大规模的数据点,促使数据的类别之间尽量地相似,不同类别的数据则进行有效区分[5]。因此,数据的聚类过程是一种无监督分类,这便说明了聚类实质上是把某一个基于某相似性的特殊性进行类别划分,然而聚类未如实记录分类,也不了解具体分类情况,根据差异性的差别,对其分为独特的积累,并合理确定本身实际归属。
预测,则是基于没有个体对象自身属性的观察值,准确地预测对象属性将来的素质。在各种较大数据库中,数据挖掘能够积极寻求信息。例如积极预测市场,数据挖掘以前的各种数据,对以后的投资提供可靠的数据支撑。
现代社会中,图书收藏量持续增长,图书馆管理规模日益扩大,因此图书管理中的数据呈现出如下特征:(1)信息隐晦性,也被叫做潜在性。图书馆在管理过程中出现了大规模的数据,应对这些信息进行有效组织,而且应挖掘其中所蕴含的价值,对此需借助一定的手段才可获取有价值的数据信息。(2)关联性:对于图书而言,借阅与查询是信息产生的主要环节,且相关信息之间存在千丝万缕的关系。(3)海量性:随着图书馆经营时间的增长及馆藏量的增加,图书管理过程中必然产生了大量的数据,海量趋势日益明显[6]。
近年来图书馆发展中推出了多项管理业务,然而服务上有一定的局限性,大多是简单让读者获得图书方面的咨询,并提供图书的借阅与归还等内容,根据信息实施管理,不具有主动性,也未为读者提供个性化服务。所以,为了能够实现智能化图书管理,管理者应积极摒弃传统服务理念,要提高对读者实际需求的重视程度,从以前简单的检索信息方面进行创新,让图书馆的服务更加多元化。从图书日常管理中工作来看,检索与借阅图书的各个环节中产生大规模的数据。要想对读者阅读习惯及爱好等情况进行准确把握,只是分析这些信息还是不够的的。针对这种情况,图书管理业务的开展要与数据挖掘技术相结合,加大对数据的深层次挖掘力度,这样图书馆才能全面掌握读者的需求与爱好,便于有针对性地开展服务,让读者需求得到满足。
3.2.1 借阅行为模式与读者群分析
(1)孤立点分析:从读者群实际情况出发,关注其借阅特点与个性化需求,对借阅历史进行研究,评价图书的受欢迎度[7];(2)聚类统计:从读者情况、借阅记录数据等出发,确定读者借阅行为和群体特点,发挥聚类数据的作用,进一步挖掘其行为规则和模式。(3)叙述统计:对读者、图书借阅率等进行分析,准确划分读者群体,为推出相关业务服务创造条件。
3.2.2 个性化服务工作
(1)关联规则分析:对相关信息之间的关联进行深入分析,归纳总结出读者借阅习惯,判断读者实际需求,有利于从各种读者群体特点出发,保证图书服务更具针对性[8]。(2)时间序列分析:全面掌握读者各种图书借阅的时间、顺序等信息,这样有利于了解其图书借阅习惯,便于在适当时间精准推介相应图书。此外,在时间分析后,也便于对图书的安排更具科学合理。
3.2.3 文献排架管理方面
为提高图书管理水平,需要提高对文献排架的重视程度。以数据挖掘技术为支撑,透过一系列数据了解图书借阅、群体阅读及受欢迎的图书等情况,从而对图书资源进行整和,确保图书资源充分发挥自身价值。
立足于图书管理过程中所产生的各种数据,确定挖掘对象为借阅行为分析、个性化服务分析和文献排架分析,如图1为图书管理数据挖掘层次结构[9]。对于图书管理而言,数据挖掘可分为三个层次结构:(1)第一层是数据预处理模块层:以图书管理数据库为对象,开展转换与集成处理各数据,在数据处理结束后必须尽快保存,丰富图书管理数据挖掘库;(2)第二层是管理规则挖掘算法模块层:将数据库确定下来,按照一定挖掘算法对图书管理中形成的数据进行挖掘;(3)第三层是模型可视分析模块层:图书管理可视化操作界面,主要分为图书借阅行为分析、图书管理个性化服务分析和文献排架分析等内容,需要采取深层次挖掘措施。将图书管理挖掘任务的具体参数确定下来,挖掘结束后进行数据处理,在输出过程中必须满足科室模式规则的要求,如图1。
图1 图书管理中数据挖掘的层次结构图
在信息化时代中,数据挖掘技术在组织、分析、统计与深入挖掘信息数据等方面发挥着不可替代的作用。为了能够积极适应信息时代背景,图书馆领导及职员应真正意识到数据挖掘技术的重要价值,主动学习与利用数据挖掘技术,尽快成长为信息管理专家,加快图书馆信息化建设进程,为广大读者提供个性化、优质的服务。