数据挖掘技术在高校图书馆管理中的应用探讨

2018-09-03 03:47王承忠
智富时代 2018年7期
关键词:聚类分析数据挖掘

王承忠

【摘 要】对于高校而言,图书馆不仅是学生和教师阅读、查阅各类文献资料的地方,同时也承担着学校教学和科研服务的重要任务。数据挖掘技术对数据信息的深加工作用在传统图书馆向数字化图书馆的转型过程中发挥了重要作用,其不仅可提高高校图书馆的服务质量,同时还可促进资源配置利用率的提高,于图书馆自身管理的完善也十分有利。

【关键词】数据挖掘;聚类分析;读者群体;借阅排名

一、数据挖掘技术概述

数据挖掘是从特定形式的数据集中提炼知识的过程,其在各行各业中均取得了良好的应用效果,且已然成为了国内外的研究热点。目前常用的挖掘技术有数据挖掘、Web数据挖掘、文本挖掘这三个类型。

(一)数据挖掘

面向数值数据的挖掘技术称之为数据挖掘,关联分析、聚类分析、分类、预测、时序模式和偏差分析等称之为数据挖掘。数据挖掘技术的水平对所发现知识的质量有着最直接的影响,目前应用较广泛的数据挖掘方法有关联分析法,人工神经元网络、决策树和遗传算法等,对这些方法的研究主要集中在算法与其具体应用等领域。

(二)Web数据挖掘

Web数据挖掘的主要对象是包括Web页面内容、页面之间结构、用户访问信息、商务交易信息等在内的各种Web数据,人们借助这一技术可短不仅可从万维网中有效提取知识,还可改进站点设计,为电子商务的更好开展提供服务。

(三)文本数据挖掘

文本数据的挖掘对象主要是文本信息,主要工作内容包括特征提取、文本摘要、文本分类与聚类、概念操作以及探索新数据分析等,具体技术手段则有词频反文献频率向量表示法、词串表示法以及贝叶斯分类算法、词集合算法和文本聚类算法、K-最近邻参照分类算法等。

二、数据挖掘技术的应用对高校图书馆的意义

扩招使得高校生源不断扩大,高校图书馆的读者数量也日益庞大。与此同时,高校图书馆的借阅记录以及馆藏数据的存储积累均呈不断增加的发展趋势。然而,这些海量数据的质量鱼龙混杂,不仅包含对管理者与决策者真正有价值的信息,同时也有不少落后的、无用的、错误的信息,因此数据分析和挖掘工作十分重要。

(一)数据挖掘可提高高校图书馆的决策能力

借助数据挖掘技术,高校图书馆管理者可对挖掘出的有用数据信息进行进一步分析与研究,进而可促进自身决策能力的提高。例如,我们可利用数据挖掘技术来分析图书借阅情况,进而可探究出读者的读书喜好和借阅习惯,并在此基础上总结出读者的借阅规律,如此即可为日后的图书馆管理工作提供有效的依据。

(二)数据挖掘可为图书采购工作提供指导性意见

通过数据挖掘技术分析读者的喜好,我们可对图书馆的下一步采购工作进行科学预测,图书采购行为将更加科学合理。传统图书馆管理中,采购人员都是通过主观判断来决定采购什么类型的图书,这无疑不利于图书馆的运行与发展。

(三)数据挖掘可为读者提供更为个性化的服务

不同的读者有不同的阅读需求,这要求高校图书馆为其提供不同的阅读服务。数据挖掘技术可通过数据分析设置不同的服务标准,进而可为读者提供更为个性化的服务。这样一来,高校图书馆的服务质量得以提升,读者的阅读兴趣也更为浓厚。

三、数据挖掘技术在高校图书馆管理中的应用设计

基于上述章节对数据挖掘技术应用对高校图书馆意义的分析,我们应进一步重视数据挖掘技术在高校图书馆管理中的应用。本章节笔者将重点介绍基于数据挖掘技术的高校图书馆管理系统设计。

(一)信息系统总体框架

高校图书馆管理系统在应用数据挖掘技术时,可以高校图书馆的网站系统为基础。从北邮、银博等现有的图书管理系统来看,基本都采用三层结构体系设计,即用户界面层、业务逻辑层与数据访问层。由一系列交互页面组成的用户界面层的主要功能在于帮助用户实现对图书馆网站的访问以及帮助管理者获取访问者的实际需求信息。我们常用的用户注册与登录、图书资源搜索与预定、图书智能推荐等等模块均属于业务逻辑层的内容,其主要功能在于实现应用程序的业务功能。数据访问则不仅可提供外部数据库的访问服务,同时还具备查询、插入、删除和修改数据库中各类型数据的作用。

(二)图书馆管理数据仓库设计

数据库是信息管理系统实现数据挖掘功能的基础,因此其设计在高校图书馆信息管理系统中至关重要。注册认证库与图书馆信息库共同组成了高校图书馆数据库,而图书馆信息库又包括图书信息、读者信息、图书借阅历史列表、出版信息实体以及管理员采购图书清单、用户图书预定需求单和新购图书单等内容。因此,高校图书馆数据库里的数据十分庞杂。为提高图书馆管理系统的数据能力,所有SQL的调用都应使用存储过程来完成,使用参数进行数据传递可为系统安全提供重要保障。

(三)聚类分析应用

高校图书馆管理系统中的数据挖掘模块在挖掘出有用信息后可将数據结构存储下来,这就是数据挖掘技术在高校图书馆聚类分析中的具体应用,该技术手段可为图书馆采购资金的合理分配提供科学依据。通常而言,我们在设计高校图书馆管理系统的聚类分析时需实现读者聚类与图数聚类这两个方面。所谓读者聚类,也就是依据读者的使用情况进行读者群划分;图书聚类获得有价值信息的方式则是根据图书被借阅的次数进行聚类分析。

四、数据挖掘技术对高校图书馆带来的挑战

如前文所述,数据挖掘技术的应用与发展有利于高校图书馆决策能力的提高,同时还可为图书采购提供科学依据,为读者提供更为个性化的服务。但在实际应用中,数据挖掘技术仍给高校图书馆带来了诸多挑战。

(一)从异构数据源中挖掘信息

异构数据源也就是多个不同的相关的数据源系统的集合。数据挖掘技术需从高校图书馆中繁杂的信息中挖掘出所需的信息,然后再对其进行分析与综合,经过这一系列过程方可得出真正有价值的信息与知识。互联网时代的到来使得信息技术更新速度不断加快,各种高新技术日新月异、层出不穷,这一现实背景对图书馆管理者及信息系统技术人员的专业素养提出了更高的要求,只有掌握多种新兴技术才能有效构建起具有多种数据源构成的分布式异构数据库,才能有效完成数据挖掘工作。

(二)不同表现形式的数据挖掘结果

从目前来看,高校图书馆通过数据挖掘技术所获得的数据仍具有较大的不确定性,因此数据挖掘所获得的结果类型诸多,表现形式也不尽相同。在系统应用中,用户极有可能会提出要挖掘不同信息与知识的要求,此时就需要系统技术人员从更大规模的数据集中挖掘出更多的不同形式的结果。

(三)在不同抽象层次上进行交互式挖掘

我们在从一个大规模的数据库挖掘数据前,要想预测出能挖掘什么内容的信息具有较大的难度。对此,高校图书馆信息系统的开发人员应以一个搜索过程来处理复杂的数据挖掘与查询,但为了完成数据的进一步挖掘,务必保留所有的中间结果。在进行数据挖掘时,用户可通过不断地修改自己的查询请求来动态调整此次数据挖掘的目标,以保障挖掘过程的有效推进。所以信息管理系统需从不同角度观察挖掘数据的中间结果,如此才可为用户提供灵活的观察数据。

五、结束语

信息时代,我国逐渐开始普及数字校园、数字图书馆等先进理念,基于数据挖掘技术的图书馆管理系统随之得到广泛应用。在不久的将来,数据挖掘这一新型智能信息处理技术将得到业界学者更多的重视,其具体技术与手段也将得到进一步完善与发展。

【参考文献】

[1]王玉珍.基于Web挖掘的数字图书馆个性化服务体系研究[J].情报科学,2014,32(04):96-100.

猜你喜欢
聚类分析数据挖掘
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究