多媒体数据挖掘技术浅析

2018-12-25 08:08:06李凯敏齐赫苗莉海口经济学院
数码世界 2018年4期
关键词:音频数据挖掘预处理

李凯敏 齐赫 苗莉 海口经济学院

1 序言

在整个多媒体数据的研究中,多媒体数据得到了大量的涌现,因此也产生了各种各样的多媒体数据库,这些数据库的容量十分之大,内容也越来越丰富多彩,和过去的一些多媒体的数据研究相比较起来,过去的多媒体研究的侧重点在于对基本内容的一些检索和探索,这虽然在一定程度上,可以解决信息搜索和信息资源发现的问题,但是另外一方面,人们对于信息的需求程度越来越高,对于信息的处理应用方面也越来越广泛,因此这种以前的多媒体数据研究不能够很好地满足这些问题。

在多媒体数据挖掘研究的过程中,将其与传统的数据挖掘进行比较的话,我们会发现其中有几个需要我们去解决的问题,比如多媒体数据地非结构化的问题,我们应当在这些数据上进行一定的挖掘,从而获取相关的一些知识,除此以外,在多媒体数据中,其特征向量往往是数十维,有时候甚至是数百维的,那么我们对于如何对于高维矢量进行数据的挖掘,也是一项重要的问题。

2 多媒体数据挖掘的一般系统结构

2.1 多媒体数据收集

在多媒体的数据挖掘中,有很多种的系统结构,需要我们对其进行一一分析,首先就是多媒体的数据收集。一般来说,对于一些大型的多媒体的数据集,其可能会包含几十万幅的照片以及上千个小时的音视频文件等等,而对于这些文件,其媒体的结构和元数据库中的描述是相关联的,这样便可以用于可视化的表现和存取了。

2.2 预处理模块

在这种模块中,其主要是针对多媒体中的一些原始数据进行相关的预处理,并且从中提取出数据的有效特征,进而可以将特征矢量,通过元数据的这种形式记录在整个元数据库之中。而关于元数据库的话,这是一种按照挖掘的一些相关要求,进行组织起来的,一种多维的、多层次的、多媒体属性的数据库,其可以起到支持高效率多媒体挖掘的作用。

2.3 挖掘引擎

在多媒体的数据挖掘中,往往要涉及到关于挖掘引擎的相关内容,关于挖掘引擎,其包含着一组快速的挖掘算法,这其中比如分类、聚类、关联等等,在这种挖掘引擎种,系统是可以根据一些具体的应用,来对于一些挖掘算法进行选择,其可以选择一个算法,同时也可以选择多种相对应的算法,同时对于元数据库进行一定的挖掘。在元数据库中,这里面的特征矢量一般情况下来讲,其都是高维的,然而对于一些传统的数据挖掘方法来说,其一般情况下来将,都是只适用于一些比较低纬的数据,那么在这个时候,如果我们仍然使用这些方法来对于这些高纬矢量进行处理,那么将会起到一些非常不理想的效果,那么这也就是我们经常性讲到的维度灾难。那么我们为了避免这种唯独灾难,或者是克服这种维度灾难的影响,便有很多的针对高维数据引结构的一些经典的算法被提了出来。

2.4 用户接口

最后涉及到的系统就是用户接口系统了,在这种用户接口系统中,我们一般可以实现挖掘结果的可视化以及界面的解释,同时也可以实现为用户提供的相关便捷措施和系统。由于多媒体具有试听的特性以及时空的特性这两种特点,因此挖掘出来的一些模式应当用一种新的表现方式加以呈现,比如导航式的知识开展以及交互式的问题求解等等,除此以外,还有提供挖掘结果的可视化的接口。

3 多媒体挖掘的内容

3.1 图像挖掘

在多媒体数据挖掘中,比较广泛应用的就是图像挖掘的技术了,然而原始的图像是不能够被直接挖掘的,因此我们便需要对于这些原始图像进行一定的处理,在对这些图像进行预处理完成之后,再得以生成一些可以供一些高层挖掘模块使用的一些图像特征,并且通过综合处理形成一个数据库,最后便可以在形成的数据库的基础之上,完成对于一些图像的数据挖掘的相关操作。

3.2 视频挖掘

除了图像挖掘以外,视频挖掘也是其中的一个重要的内容,对于视频的挖掘一般具有两种,其一是根据视频的结构进行的预处理,这种处理模式,其原理在于针对某些视频在内容构造上的结构特性,通过一定的规则算法来将这些视频进行划分。其次是视频运动的目标识别,这种模式的原理则在于,通过从视频种对于跟踪运动目标的分割,从而提取出运动目标的一些本质上的特征以及运动上的特征,由此实现视频的挖掘。

3.3 音频挖掘

作为一种听觉媒体,音频具有很多特征,其中包括基音、音调、旋律等等,而对于音频的哇据也是重要的一个研究方向,其挖掘通常也有两种途径,其一是运用语音识别的技术,来将一段语音识别成文字,进而将音频挖掘转换成文字挖掘。其二则是直接从一段音频种提取声音特征,进而对音频实现挖掘。

4 结语

在多媒体挖掘和发展的整个过程中,我们面临了很多问题,也解决了很多问题,在目前,多媒体的挖掘技术已经取得了很大的进展,而针对不同的媒体,比如图像、视频、音频等等,我们应当采取不同的挖掘办法,那么同时,我们对于多媒体挖掘技术的深入研究,也将成为未来发展的一个重要点,同时也会为将来的多媒体发展起到重要的作用。

[1]易黎,杨长春,冯建彪.基于多媒体数据库的数据挖掘模型和方法[J].江苏工业学院学报,2010,22(01):35-39.

[2]康健辉.多媒体数据挖掘技术浅析[J].重庆科技学院学报(自然科学版),2007(04):85-88.

[3]王志锋,李殿伟.多媒体数据库的管理与数据挖掘研究[J].计算机与数字工程,2007(10):50-53+188.

猜你喜欢
音频数据挖掘预处理
探讨人工智能与数据挖掘发展趋势
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
基于预处理MUSIC算法的分布式阵列DOA估计
制导与引信(2017年3期)2017-11-02 05:16:56
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
音频分析仪中低失真音频信号的发生方法
电子制作(2017年9期)2017-04-17 03:00:46
浅谈PLC在预处理生产线自动化改造中的应用
工业设计(2016年11期)2016-04-16 02:50:19
Pro Tools音频剪辑及修正
人间(2015年8期)2016-01-09 13:12:42
一种基于Hadoop的大数据挖掘云服务及应用
络合萃取法预处理H酸废水
环境科技(2015年6期)2015-11-08 11:14:26