探析高校图书馆数据挖掘

2013-04-29 13:13杨洋
考试周刊 2013年87期
关键词:数据信息数据挖掘图书馆

杨洋

摘 要: 数据挖掘技术在信息的利用和提取中发挥着日益重要的作用。本文介绍了数据挖掘技术的基本概念及功能,并对数据挖掘技术应用于图书馆的研究现状进行了分析,在描述数据挖掘技术的基础上,探讨了数据挖掘在数字化图书馆中的应用,旨在为图书馆在数字资源的组织和管理、服务质量的提升和服务方式的拓展等提供技术支持。

关键词: 图书馆 数据挖掘 数据信息

一、高校图书馆数据挖掘的概念及发展现状

数据挖掘是指从大量数据中提取或挖掘隐含的信息或知识,可以在任何类型的信息载体或存储中进行。数据挖掘过程可分为三个阶段:数据准备、采掘操作、结果表达和解释。目前,它已经在银行业、工程技术、医学和零售业等领域得到成功应用和空前发展,在这些领域的成功应用鼓舞着人们将数据挖掘技术应用到更多、更广泛的领域中。其中,高校图书馆就是一个很好的例子,数字图书馆是计算机可处理的、有序组织的知识集合。

随着网络上的数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的应用价值。数字图书馆可以突破文献单元的局限,以知识单元为基准进行信息挖掘和知识发现,从而发现有规律的认识。它将提供和实现资源共享,分散于不同载体、不同地域的数字化信息资源以网络化方式互相联结。除此以外,数字图书馆是多方面高新技术支持的数字信息资源系统。其使用数字技术进行信息资源的组织和管理,能够存储海量信息,用户可以通过网络获得信息服务,高效方便地查询、检索信息,并且其信息存储和用户访问不受时间及地域的限制。

高校图书馆数据挖掘应用不是简单的互联网上的图书馆主页,而是一整套面向对象的、分布式的、与平台无关的数字化资源的集合。其过程通常是自动的,用户不必提出确切的问题,从而更有利于发现隐藏的知识。我们还可以利用数据挖掘的研究成果提高信息检索的精度和效率,改善检索结果的表达,使信息检索系统提高到一个新的水平。

二、高校图书馆数据挖掘的运用

数据挖掘在高校图书馆中的运用比较广泛,以下将从资源建设、个性化服务、图书管理等方面进行简单论述。(1)数据挖掘在图书馆资源建设上的应用。使用模式挖掘、学科动态分析,结合现有馆藏信息情况,采用合适挖掘算法及时发现信息资源的漏缺,做好文献的收集订购。对大量文档集合内容进行摘要、分类、聚类、关联分析,从大量的资源中抽取潜在的有用知识。采用各种数据挖掘技术与方法,评判数字图书馆文献信息资源的利用率、有效率等,以便建设特色馆藏。(2)数据挖掘在图书馆个性化信息服务中的应用。个性化信息服务不仅需要针对不同的用户需求提供不同的服务,更重要的在于发现用户的潜在需求进行主动的信息服务。数据挖掘技术为解决此问题开辟了一条道路。(3)数据挖掘在图书馆管理上的应用。数据挖掘作为一种深层次的数据分析方法,可以从大量的用户数据中挖掘反映用户属性特征和信息行为特征的信息及规则,从而为图书馆用户资源管理提供极大的帮助。

此外,数据挖掘在数字图书馆结构上的运用,主要是从网页的组织结构和链接关系中获取知识,在此基础上对页面进行分类和聚类,或对相关网页进行分析,发现数字图书馆页面的结构和结构模式,从而对网页的质量进行评价,对检索方式进行优化。通过链接分析和掌握学科发展状况,指导网站的建设。

数据挖掘可以帮助决策者分析历史数据及当前数据,从中发现隐藏的关系和模式,进而预测未来可能发生的行为。随着数据挖掘研究的深入,需解决的问题和面临的挑战很多。如:在不同的层次上进行交互的数据挖掘;数据挖掘结果是否具有准确性和有用性;用不同形式表示数据挖掘的结果;从不能结构的数据源中挖掘信息;数据挖掘的方法和模式虽然多样,却没有统一地对模型进行描述和定义,各数据之间缺乏联系,造成各数据挖掘系统之间的封闭。

三、高校图书馆数据挖掘存在的问题及对策

作为图书馆的未来发展趋势,数字图书馆拥有海量的数字资源,如何发挥其巨大作用、避免信息过量已经成为数字图书馆发展必然要面对的问题,而数据挖掘技术在数字图书馆应用面临许多的挑战。

随着图书馆数字化程度与数字图书馆建设的不断强化,大多数图书馆纷纷引进全文中外文大型数据库,少则数个,多则数十个,提供的信息更多、更新、更广泛、更复杂。然而,目前这些数字资源尚未有统一的制作和显示规范,阅读格式和检索界面多种多样,互不兼容,使得读者需要安装多个浏览器,并且对同一个主题反复检索,效率低下。此外,图书馆的数据库系统可以高效地发挥数据的录入、查询、统计等功能,但无法从大量数据中获取数据背后隐藏的、内在的、有用的信息,发现数据中存在的关系和规则,以致无法为读者提供更方便、快捷、高效的服务。

解决高校图书馆数据挖掘存在的问题,我们应该致力于找出解决问题的对策。为了避免陷入数据丰富,但信息贫乏的局面,图书馆有必要增强对信息的处理能力及对信息资源的组织能力,尤其是对海量信息的深层次的开发,提取表面上庞杂无序的信息的内在联系供读者使用。同时,采用数据挖掘技术对这些数据进行深入分析、研究对图书馆了解读者的借阅兴趣、图书采购、信息咨询等业务都有很强的指导作用,对提高读者服务质量、资源利用率有很大的帮助。

参考文獻:

[1]谭观音,李继宏.高校图书馆期刊选订的模糊决策[J].现代情报,2011(8).

[2]李朝葵,凌云.数据挖掘及其在图书馆中的应用[J].情报杂志,2011(6).

[3]赵宏波,孟雅玲.数据挖掘在电信客户关系管理中的应用[J].电信技术,2011(2).

猜你喜欢
数据信息数据挖掘图书馆
探讨人工智能与数据挖掘发展趋势
图书馆
基于并行计算的大数据挖掘在电网中的应用
浅析数据信息在医院医疗保险管理中的应用
美国职业棒球大数据对提升中国棒球竞争力的研究
飞跃图书馆
如何做好成本核算工作
数据信息于无线传输之下的采集和控制
一种基于Hadoop的大数据挖掘云服务及应用
去图书馆