数字图书馆数据挖掘研究

2016-02-25 05:00:10王海燕长春光华学院吉林长春130033
信息记录材料 2016年6期
关键词:数据挖掘聚类特性

王海燕(长春光华学院 吉林 长春 130033)

数字图书馆数据挖掘研究

王海燕
(长春光华学院 吉林 长春 130033)

自从改革开放以来,我国经济得到了快速的发展和进步。伴随着经济的快速发展,我国在科学技术方面取得了比较显著的成就,尤其是在数字图书馆的数据挖掘方面更是取得了令人举世瞩目的成就。众所周知的是,近几年来我国渐渐的涌出了大量的数字图书馆,并且已经开始渐渐的取代传统的图书馆。数字图书馆的出现不仅仅大量的提高了整个图书馆的管理效率,而且减少了人力和物力的损耗。而在数字图书馆的日常管理过程中,数据挖掘是极其重要的一个环节,数据挖掘很好的丰富了数字图书馆的内容。但是,由于受多方面因素的约束,我国在数字图书馆的数据挖掘方面始终存在着一系列问题,进而严重的阻碍了整个数字图书馆的进一步发展。本文就目前我国数字图书馆数据挖掘做了简要的分析和探讨。

数字图书馆;数据;挖掘

1.引言

随着科技的快速发展,21世纪已经是一个数字化和科技化的时代,各种数字技术已经被广泛的应用到了各个领域中,并且也都取得了比较显著的成就。而在数字图书馆的建立和管理过程中,数字挖掘技术更是扮演了极其重要的角色,它是数字图书馆发展过程中不可或缺的一部分。与传统的图书馆相比较,数字挖掘技术的应用更好的实现了图书馆的数字化,使得图书馆大量的工作都又原来的人工操作尝变成了数字技术操作。我国政府也已经认识到了数据挖掘技术的重要性,并且在数据挖掘技术方面投入了大量的资金和精力,同时也培养了大量的高端数据挖掘技术人员。但是,与西方其他先进的发达国家相比较,我国整体的数据挖掘技术水平仍然比较低。为了尽快改变这一现状,必须要积极的引进并且学习其他国家先进的数据挖掘技术,并且应用到我国数字图书馆的日常管理过程中。

2.数据挖掘的具体概念

为了更好的将数据挖掘应用到数字图书馆中,我们必须要首先准确的了解并且掌握数据挖掘的具体概念。对于数据挖掘而言,它是一个新型的概念,是计算机科学技术的一个重要部分,主要指的就是通过利用信息技术从海量数据中准确的提取并且挖掘一些隐藏的信息,然后将这些信息应用到实际应用中,而对于一般的信息载体都可以利用数据挖掘技术来进行提取信息。数据挖掘的过程比较复杂,包括数据的准备、数据的具体采集以及数据结果的显示以及解释,因此,在利用数据挖掘技术之前,我们必须要首先掌握这几个过程。而数字图书馆主要就是利用现代新型的计算机技术和信息检索技术对图书馆里面所有的图书进行整理、保存,同时对数字信息进行收集和使用的综合智能数字信息管理与服务的中心。通过利用信息技术和计算机技术可以尽可能的满足所有读者的实际需求。

3.数据挖掘的功能特性

3.1 聚类

与其他普通的技术相比较,数据挖掘的功能特性比较显著,而且种类比较丰富,其中比较重要的一个功能特性就是聚类。聚类是比较复杂的一个功能特性,它主要指的就是利用现代计算机技术将所有的数据个体根据它们自身的特点进行归纳,然后使得所有的这些数据都可以形成一组具有独特属性的数据群组。而聚类可以分成两种类型,对于同一种类聚类的结合就是将同一种类型的数据集中在一起进行管理和保存。而不同类聚类就是将不同特性的不同数据进行同一管理。然后我们可以根据这些特性来得知同种类事物之间的共同性和不同种类事物之间所存在的差异性。

3.2 关联分析

在数据挖掘的功能特性中,关联分析是另一个比较显著的特性,它与聚类存在着比较大的差别。对于关联分析而言,它主要就是反映了数字图书馆中所收集的各种数据单元之间所存在一定关联性的具体信息。例如,对于数字图书馆中的一组数据而言,如果这一组数据中大部分的数据都存在着相互的关联性。那么我们可以根据其中一项的具体属性来了解并且掌握其他项的具体属性。

3.3 概念描述

概念描述就是对某类对象的本质进行探讨分析,并总结这类对象的相关特点,概念描述有区别描述与特征描述两种,前者描述不同类对象间的差别,后者则是描述某类对象的相同特征,最后形成一个类的特征性描述,并且只涉及这类对象中全部对象的共同特性。

4.数据挖掘在数字图书馆中的应用

我们我们建立数字图书馆的主要目的就是通过计算机技术将不同地区以及不同属性的数据信息资源进行整合,然后将这些整合资源提供给用户进行使用。数字图书馆数据挖掘可以分成三类,即结构挖掘、内容挖掘以及用户使用记录挖掘。下面就这三种类型数据挖掘的具体应用做了简要的介绍。

4.1 进行结构挖掘

在将数据挖掘应用到数字图书馆的过程中,进行结构挖掘是一个重要的应用之一,并且与其他的应用相比较,结构挖掘的操作比较简单。例如,进行结构挖掘主要就是通过计算机网页的一些具体链接和组织结构尽快的了解并且发现图书馆页面的的具体结构模式,然后根据模式的具体特征进行具体的分类和分析。利用这种方式,我们可以快速的并且准确的对数字图书馆的网络建设提供一定的积极指导,同时也可以通过这些网页的链接对我国各个学术未来的发展方向进行具体的了解和分析。最后,利用这种数据挖掘技术可以大大的节省人力和物力,提高数字图书馆管理效率。

4.2 进行内容挖掘

与结构挖掘相比较,内容挖掘的过程比较复杂,内容比较丰富。例如,对于内容挖掘而言,它主要包含了几个方面的内容。第一,组织文献数据:它主要指的就是通过利用现代信息技术对数字图书馆里面所有的文件进行整理和分类,然后对各个分类的具体内容进行充分的了解和掌握,这样用户在利用数字图书馆中的信息的时候,可以根据自己所要查找的信息分类快速的搜索相关的内容分区,同时还可以更好的确保他们所查找信息的准确性。第二就是对特征的自动提取和描述。这是一个技术性比较高的过程,在利用数据挖掘技术的过程中,我们可以利用一个具体的内容分析器从其中分析并且提取出相关的内容特征,当用户在准确的提取这些内容特征以后才能在数字图书馆中更加准确的实现自己需要查找的信息的具体定位。其三是自动采集整理专题信息。但数据挖掘终究是一种新兴的智能科技产物,它的发展还是有很多挑战与难题需要面对。

4.3 进行用户使用记录挖掘

与结构挖掘和内容挖掘相比较,进行用户使用记录挖掘也具有它独特的特征。对于用户使用记录挖掘而言,就是通过挖掘技术对用户以前在数字图书馆中的查询记录进行挖掘和记录,然后用户可以在最短的时间内再次准确的查找这些信息,这样可以大大的减少用户进行信息查询的时间,并且也提高了用户查询信息的准确性。

5.结束语

综上所述,为了更好的将数据挖掘技术应用到数字图书馆中,必须要首先准确的了解并且认识到数据挖掘的具体功能个性,然后根据数据挖掘的具体功能特性进行应用。同时,还应该不断的加大对于数据挖掘技术的资金投入力度,不断的提高我国数据挖掘技术水平。

[1]周文云.数据挖掘在数字图书馆个性化服务中的研究与应用[J].军民两用技术与产品,2012(1):56.

[2]田瑞雪.国内图书馆数据挖掘技术应用研究述评[J].科技信息,2014(1):167.

[3]付红伟,卢春,周杨.数据挖掘技术及其在数字图书馆中的应用[J].软件导刊,2013(1).

G647

A

1009-5624(2016)06-0137-02

猜你喜欢
数据挖掘聚类特性
谷稗的生物学特性和栽培技术
探讨人工智能与数据挖掘发展趋势
色彩特性
流行色(2020年9期)2020-07-16 08:08:54
进一步凸显定制安装特性的优势 Integra DRX-5.2
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
Quick Charge 4:什么是新的?
CHIP新电脑(2017年6期)2017-06-19 09:41:44
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
一种层次初始的聚类个数自适应的聚类方法研究