数据挖掘在图书馆管理中的作用

2019-02-28 01:40张素慧
科学与财富 2019年2期
关键词:图书馆管理重要作用数据挖掘

张素慧

摘 要:本文通过深入了解图书馆领域相关知识以及对数据挖掘技术的学习研究,详细分析了图书馆管理应用数据挖掘技术的方法及重要性。

关键词:数据挖掘;图书馆管理;重要作用

随着数据挖掘技术的不断成熟,数据挖掘被应用到很多领域,无论是营销、财务、管理、制造业、通讯还是数据收集等方面,只要具有分析价值,并有分析需求的数据库,就可以利用数据挖掘工具进行有目的的挖掘分析,从少量数据库中获得先前不知但具有价值的信息,并利用这些信息对单位或企业的情况进行反应,从而为进行管理决策提供依据。

对图书馆而言,通过数据挖掘进行图书馆管理是颇具意义的工作,利用数据挖掘技术可以帮助图书馆分析读者群的需求趋势,并预测未来需求的发展方向,更有效的完成图书馆管理的相关工作。

一.数据挖掘技术概述

1、数据挖掘的定义及含义

数据挖掘就是从大量的、不完全的、不确定的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。

2、数据挖掘基本功能

数据挖掘任务一般可分成描述和预测两类。描述性挖掘任务,是刻画数据库中数据的一般特性;预测性任务则在当前数据上进行推断,进行预测。一般通过如下一些功能来实现:

概念描述:就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。

关联分析:主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件,其主要依据是应该符合一定的统计意义的相关事件发生的概率和条件概率。关联分析的目的是找出数据库中隐藏的关联网。

分类分析:就是通过分析样本数据库中的数据,为每个类别做出准确的描述,或建立分析型或挖掘出分类规则,然后用这个分类规则对其它数据进行分类。预测是使用历史资料去推测估计未来的数值以及趋势,根据样本的已知特征估算某个连续类型的变量的取值的过程。

3、数据挖掘基本过程和主要步骤

在开始数据挖掘之前,首先最重要的就是了解数据和业务问题,明确要去度量或预测什么,缺少对业务的了解,就不可能明确要解决的问题,也就不能为数据挖掘准备数据,导致最终很难正确的解释所得的结果。

数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。

数据的预处理:研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。

数据的转换:将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。

数据挖掘:对所得到的经过转换的数据进行挖掘,除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。

结果分析:解释并评估结果。使用的分析方法一般应作数据挖掘操作而定,会用到可视化技术。

二、数据挖掘技术在图书馆管理中的应用

1、数据挖掘应用于图书馆管理的优势

现在困扰图书馆管理的主要问题是:怎样真正满足读者需求,怎样有效收集读者反馈信息?怎样根据读者需要提高管理效能?对于以上疑难问题,数据挖掘技术是一个行之有效的工具。

数据挖掘与传统的数据分析(查询、报表、联机应用分析)的本质区别是,数据挖掘是在没有明确假设的前提下去挖掘信息、发现规律,数据挖掘具有预测性、有效性和实用性三个特征。

预测性:通常数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,缺乏挖掘隐藏知识的手段,数据挖掘技术不仅能对过去的数据进行查询和遍历,而且能够找出历史数据之间的潜在联系,更加全面系统分析读者阅读行为规律,并预测其未来的需求信息,从而促进信息的传递。

有效性:数据挖掘不是为了替代传统的统计分析技术,相反,它是统计分析方法学的延伸和扩展。大多数统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者要求很高。随着计算机能力的不断增强,我们有可能利用计算机只通过相对简单和固定的方法完成同样的功能。比如,利用神经元网络和决策树,在足够多的数据和足够强的计算能力下,几乎不用人的关照,计算机就能实现许多有价值的功能。

实用性:现在数据挖掘在图书馆管理应用中已经可以马上投入使用,因为对这种技术进行支持的三种基础技术已经发展成熟。这三大基础技术是,海量数据搜集,强大的多处理器计算机和数据挖据算法。今天,这些成熟的技术,加上高性能的关系数据库引擎以及广泛的数据集成,让数据挖掘技术在当前的数据仓库环境中进入了实用阶

2、数据挖掘解决的典型问题

图书馆需要搜集和处理大量的数据,对这些数据进行分析,发现其数据模式及特征,然后可能发现读者群的兴趣与需求,并且,根据新观点,读者的需求会随时间而变化。

数据挖掘可以分两大类:预测性数据挖掘和描述性数据挖掘。

預测性数据挖掘是进行数据分析,建立一个或一组数据模型,并且根据模型产生关于数据的预测,挖掘的信息越是出乎意料,就可能越有价值。

描述性数据挖掘是以概要的方式对数据信息进行描述,提供数据的有意义的一般性质。包括:异常检测、聚集等多种数据挖掘方法。

预测类数据挖掘及描述类数据挖掘所能解决的典型管理问题包括:读者群体划分、文化背景分析以及读者流失性分析、读者需求及读者满意度评估等。

3、数据挖掘应用于图书馆管理的领域

对读者关系进行管理:对于图书馆来说,读者是至关重要的资源,应当高度重视对读者关系的建立、维持和培育,实施读者战略,以建立长期稳定的供需关系。因此,建立高效的图书馆管理系统,可以使图书馆更好地了解读者要求,评估需求价值,从而为读者提供个性化优质服务,提高读者满意度,建立信任感。

需求评估与管理决策:图书馆管理基于数据挖掘应用的趋势,在于建立需求评估模型和进行管理决策。科学全面的需求评估是建立在大量基础数据的融合基础之上的,随着金融领域、企业、政府纷纷建立统一数据平台,基础数据的融合将逐步实现。随着数据大集中的逐步深入,我们的结构化的数据和非结构化的数据,搭建起来的这一个统一的数据平台,为数据挖掘在读者群需求评估中的应用打下了一个坚实的基础。利用数据挖掘相关工具如神经网络算法和决策树方法建立评价模型和决策模型,并可以根据不断变化的外部数据对模型进行动态的修正。因此,数据挖掘技术可以支持阅读需求评级朝着多元细化的方向发展。

参考文献:

[1]谢邦昌等.数据采掘入门及应用[M].中国统计出版社,2001

[2]陈楠.基于数据仓库与数据挖掘技术的决策支持系统[J].计算机时代,1998

[3]薛华成.管理信息系统[M].清华大学出版社,1998

[4]陈晓红等著.信息系统教程[M].清华大学出版社,2003

[5]黄梯云等.管理信息系统[M].高等教育出版社,2000

猜你喜欢
图书馆管理重要作用数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
浅议读者协会参与高职院校图书馆管理工作
柔性管理及其在图书馆管理中的核心应用
基于知识管理的高校图书馆管理创新
浅谈舞蹈表演的身体表现力
浅谈品牌服装设计在营销中的重要作用
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究