关联规则挖掘在图书馆生态化建设中的应用

2014-04-29 00:44:03宋丽萍
阜阳职业技术学院学报 2014年2期
关键词:Apriori算法关联规则数据挖掘

宋丽萍

摘 要:在高校图书馆进行生态化、数字化建设的今天,提高图书馆的个性化服务质量已成为迫切需要。本文介绍了关联规则的基本原理, 阐述了关联规则挖掘分析的过程及结果, 论述了关联规则分析结果在图书馆工作中的应用,以此可以为读者提供准确的服务,促进图书馆的生态化建设。

关键词:图书馆;数据挖掘;关联规则;Apriori算法

中图分类号:C289 文献标识码:A 文章编号:1672-4437(2014)02-0025-03

目前高校图书馆普遍采用图书管理自动化系统,每天都会产生大量的图书流通数据,图书馆数据库里积累了大量的读者对图书资源的历史访问数据,这些数据主要用于图书馆的日常管理,其实在这些数据背后隐藏着许多重要的信息。但是,由于目前的图书馆管理系统缺乏数据的集成和分析能力,无法发现这些数据中存在的关系和规则。也就很难根据读者的需求开展个性化服务,如何运用数据挖掘技术从图书馆数据中挖掘出有价值的信息,已成为数据挖掘应用的一个重要领域,也是数字化、生态化图书馆建设中一项非常重要的研究内容。

一、关联规则

关联规则是美国IBM Almaden Research Center的Rabesh Agrawal等人在1993年的SIGMOG会议上提出的,反映一个事物与其他事物之间的相互依赖性或相互关联性,从而达到认识事物客观规律的技术方法。如果两个或者多个事物之间存在一定的关联规则,那么其中一个事物就能够通过其他事物预测到[1]。

四、结束语

数据挖掘技术目前已经成功地应用于各个领域,但大部分集中在金融、商业等赢利性领域中,在高校、政府等一些非赢利性机构中应用较少,本文对图书馆的读者借阅信息进行关联规则挖掘,采用了关联规则中最具有影响力的Apriori算法,目的是从大量的读者借阅信息中得到各个学科之间的相关信息,以帮助优化图书馆藏书的布局。促进生态图书馆的建设,但由于Apriori算法在每次寻找频繁项集时,都需要扫描数据库一次,因此随着数据量的增大,寻找频繁项集的时间也就越长,尤其在高校学生逐年增长,图书馆数据库呈指数增长的情况下,系统的效率就会受到影响。因此,在今后的工作中,我会采取其他的方法对Apriori算法加以改进,以便提高系统的效率。

————————

参考文献:

[1] 李雄飞,李军.数据挖掘与知识发现[M]. 北京:高等教育出版社,2003, 2:126-145.

[2] 李爱凤. 基于数据挖掘技术的课程相关性模式研究与实现[D]. 华南师范大学, 2006.

[3] Agrawal R,Imielinski T,Swami A.Mining associat -ion rules between ets of it- ems in large database[J].IEEE Transactions on Knowledge and ata Engineering,1996,8(6):962- 969.

[4] 魏育辉,潘洁.图书流通数据的关联挖掘量化分析[J].现代情报,2005,(11): 69

猜你喜欢
Apriori算法关联规则数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于云平台MapReduce的Apriori算法研究
关联规则,数据分析的一把利器
数据挖掘在高校课堂教学质量评价体系中的应用
关联规则挖掘Apriori算法的一种改进
中国市场(2016年36期)2016-10-19 04:10:44
基于关联规则的计算机入侵检测方法
一种基于Hadoop的大数据挖掘云服务及应用