基于最小二乘支持向量机的电子音乐识别研究

2018-05-05 05:42周婧范凌云

现代电子技术 2018年9期

周婧范凌云

摘要：为了提高电子音乐识别精度，更快从海量电子音乐中找到用户真正需要的电子音乐，提出基于最小二乘支持向量机的电子音乐识别模型。首先收集电子音乐的数据，并采用小波分析对电子音乐数据进行去噪处理，然后提取电子音乐的特征，并对特征进行归一化处理，最后采用最小二乘支持向量机对处理后的电子音乐数据进行训练，建立电子音乐识别模型。采用具体电子音乐数据对模型的有效性进行验证，结果表明，与传统电子音乐识别模型相比，支持向量机对噪声数据具有良好的鲁棒性，可以有效识别各种类型的电子音乐，而且电子音乐的识别速度更优。

关键词：电子音乐; 短时特征; 特征向量归一化; 最小二乘支持向量机; 噪声鲁棒性; 识别速度

中图分类号： TN911?34; TP391.9 文献标识码： A 文章编号： 1004?373X（2018）09?0109?04

Abstract： In order to improve the recognition accuracy of electronic music， quickly find the electronic music needed by user in massive electronic music， an electronic music recognition model based on least square support vector machine is proposed. The electronic music data is acquired， and denoised with wavelet analysis. The characteristic of electronic music is extracted and normalized. The least square support vector machine is used to train the processed electronic music data， and establish the electronic music recognition model. The specific electronic music data is adopted to verify the effectiveness of the model. The results show that， in comparison with the traditional electronic music recognition model， the proposed model based on support vector machine has stronger robustness for noise data， can identify the various types of electronic music effectively， and its recognition speed is faster.

Keywords： electronic music; short?time feature; eigenvector normalization; least square support vector machine; noise robustness; recognition speed

0 引言

随着互联网快速的发展，近几年产生了大量的多媒体数据，电子音乐是一种最常用的多媒体数据。面对海量的电子音乐数据，如何建立理想的电子音乐识别模型，快速、准确地从中获得用户感兴趣、喜欢的电子音乐是当前面临的一个挑战[1?3]。

电子音乐识别，顾名思义就是对电子音乐进行分类，本质上是一种模式分类的过程，该过程涉及到许多方面的学科，如心理学、信号处理、模式识别等，是一个十分复杂的过程[4]。在网络中的电子音乐数据与现实生活中的数据格式不同，其有自身的特殊格式，因此，有学者提出基于内容的电子音乐识别模型，它们提取电子音乐的均值、自相关系数作为特征，然后建立电子音乐识别模型，有学者提出基于MCC的电子音乐识别模型[5?6]，将电子音乐的MCC能量作为特征对电子音乐内容进行描述，并采用欧氏距离构建电子音乐识别的分类器[7]。随后有研究人员提出将MCC、基音频率作为电子音乐识别的特征向量，通过K最近邻作为分类器，实现电子音乐识别[8]。这些电子音乐识别模型均有各自的优点和缺陷，如K最近邻分类器的工作速度快，但是电子音乐识别精度低，欧氏距离的识别速度慢[9]，近几年，出现了基于神经网络的电子音乐识别模型，该模型通过神经网络的自动、智能学习能力对电子音乐进行分类，获得了比较理想的电子音乐识别效果，但神经网络的结构比较复杂，需要同类电子音乐识别样本数量大，而且学习过程中收敛性能差，电子音乐识别的效果有待进一步改善[10?12]。

针对当前电子音乐识别无法描述电子音乐的类别，存在识别精度低等难题，为了提高电子音乐识别精度，更快地从海量电子音乐中找到用户真正需要的电子音乐，提出基于最小二乘支持向量机的电子音乐识别模型。结果表明，最小二乘支持向量机可以有效识别各种类型的电子音乐，而且电子音乐的识别速度更优。

1 小波分析和最小二乘支持向量机

1.1 小波分析

小波分析可以对一维信号进行不同分辨率的分解，将原始信号进行细化处理，这样可以去掉其中的噪声，提高信号的信噪比，便于信号的后续处理。通常情况下选择Mallat算法对信号进行分解和重构，信号分解形式可以采用式（1）进行描述：

1.2 最小二乘支持向量机

当前支持向量机的类型很多，相对于其他类型的支持向量机，最小二乘支持向量机的学习速度更快，而且基于统计学习理论和VC维理论进行建模，泛化能力优异。

2 最小二乘支持向量机的电子音乐识别模型

2.1 提取特征

电子音乐信号的能量随着时间的变化发生相应的改变，短时能量是电子音乐最常用的一种特性，噪声的平均能量低，有效的电子音乐信号能量高，而且不同音符的能量是不同的，设语音信号[{x（n）}]的短时平均能量为[En，]计算公式为：

2.2 电子音乐的分类器

电子音乐一般有很多种类型，如流行音乐、古典音乐等，而最小二乘支持向量只能设计二分类的电子音乐识别分类器，因此采用图1的方式建立电子音乐识别的多分类器。

3 仿真实验

3.1 数据来源

采用Cool Edit Pro软件采集电子音乐数据，并采用Matlab 2014软件进行仿真实验，电子音乐的类型为流行音乐、民歌、古代器乐、戏曲，它们的样本数量如表1所示。

3.2 电子音乐识别模型的具体实现过程

首先对电子音乐进行分帧处理，相邻帧有一定的重复，保持电子音乐的短时平稳，然后采用小波分析对电子音乐信息进行去噪处理，然后提取相应的特征，并采用式（19）对特征进行预处理，最后采用训练样本对最小二乘支持向量机进行学习，建立电子音乐识别的分类器。

3.3 结果与分析

选择BP神经网络进行对比实验，统计它们的电子音乐平均识别精度，如图2所示。由图2可知：

1） BP神经网络的电子音乐识别精度低，而且电子音乐的识别结果不稳定，这是因为BP神经网络容易出现过拟合的电子音乐识别结果，导致电子音乐的识别误差大。

2）相对BP神经网络，最小二乘支持向量机的电子音乐识别精度明显提高，這是因为最小二乘支持向量机的学习性能更优，建立高精度的电子音乐识别模型，有效降低了电子音乐的识别误差。

统计不同模型的电子音乐平均识别时间，结果如图3所示。对电子音乐的平均时间进行对比和分析可知，最小二乘支持向量机的电子音乐平均识别时间更短，这主要是由于通过小波分析消除了原始电子音乐信号中的噪声，加快了电子音乐特征的提取速度，并有利于最小二乘支持向量机建立电子音乐的分类，加快了电子音乐的建模速度，可以更好地满足海量电子音乐的在线检索要求。

4 结论

电子音乐识别的研究具有重要实际价值，针对当前电子音乐识别精度低等难题，提出基于最小二乘支持向量机的电子音乐识别模型，通过仿真实验可以得到如下结论：

1）通过小波分析对电子音乐数据进行去噪处理，消除了噪声对电子音乐建模过程的干扰，提高了电子音乐数据的信噪比，有利于后续的电子音乐识别建模。

2）提取多种短时特征，通过短时特征对电子音乐的类型进行描述，可以更加有效地区别电子音乐的类型。

3）采用最小二乘支持向量机对处理后的电子音乐数据进行训练，建立电子音乐识别模型，能够描述电子音乐的内容，提高了电子音乐的识别精度。

4）与其他电子音乐识别模型相比，本文的电子音乐识别模型的执行速度更快，可以在短时间内找到用户所需要的电子音乐，具有更高的实际应用价值。

5）在基于最小二乘支持向量机的电子音乐识别建模过程中，参数对最小二乘支持向量机的学习性能影响很大，这是下一步将要研究的内容。

参考文献

[1] MALLATS G. A theory for multiresolution signal decomposition： the wavelet representation [J]. IEEE transactions on pattern analysis and machine intelligence， 1989， 11（7）： 674? 693.

[2] 卢坚，陈毅松，孙正兴，等.语音/音乐自动分类中的特征分析[J].计算机辅助设计与图形学学报，2002（3）：233?237.

LU Jian， CHEN Yisong， SUN Zhengxing， et al. Characteristic analysis in automatic classification of speech/music [J]. Computer aided design and graphics， 2002（3）： 233?237.

[3] 田岚，陆小珊，白树忠.基于快速神经网络算法的非特定人语音识别[J].控制与决策，2002，17（1）：65?68.

TIAN Lan， LU Xiaoshan， BAI Shuzhong. Non?specific human speech recognition based on fast neural network algorithm [J]. Control and decision， 2002， 17（1）： 65?68.

[4] 刘海波，李辉，张琨磊.低信噪比下噪声抑制的语音活动检测[J].小型微型计算机系统，2012，33（6）：1381?1384.

LIU Haibo， LI Hui， ZHANG Kunlei. Speech activity detection of noise suppression under low SNR [J]. Minicomputer system， 2012， 33（6）： 1381?1384.

[5] 李杰，周萍，杜志然.短时TEO能量在带噪语音端点检测中的应用[J].计算机工程与应用，2013，49（12）：144?147.

LI Jie， ZHOU Ping， DU Zhiran. The application of short time TEO energy in noisy speech endpoint detection [J]. Computer engineering and application， 2013， 49（12）： 144?147.

[6] 卢坚，陈毅松，孙正兴，等.基于隐马尔可夫模型的音频自动分类[J].软件学报，2002（8）：1593?1598.

LU Jian， CHEN Yisong， SUN Zhengxing， et al. Audio automatic classification based on Hidden Markov model [J]. Software journal， 2002（8）： 1593?1598.

[7] 许琳，王作英.基于HMM的音乐识别算法[J].计算机工程，2004，30（10）：135?136.

XU Lin， WANG Zuoying. HMM based music recognition algorithm [J]. Computer engineering， 2004， 30（10）： 135?136.

[8] 王欢良，韩纪庆，张磊.基于支持向量机的变异语音分类研究[J].哈尔滨工业大学学报，2003（4）：389?393.

WANG Huanliang， HAN Jiqing， ZHANG Lei. Variant speech classification based on support vector machine [J]. Journal of Harbin Institute of Technology， 2003（4）： 389?393.

[9] 秦丹，马光志.基于挖掘技术的音乐风格识别系统[J].计算机工程与设计，2005，26（11）：3094?3096.

QIN Dan， MA Guangzhi. Style of music recognition system based on mining technology [J]. Computer engineering and design， 2005， 26（11）： 3094?3096.

[10] 马希荣，梁景莲.基于情感音乐模版的音乐检索系统研究[J].计算机科学，2009，36（1）：239?241.

MA Xirong， LIANG Jinglian. Research on music retrieval system based on emotional music template [J]. Computer science， 2009， 36（1）： 239?241.

[11] 陈功，张雄伟.一种基于灰关联分析的语音/音乐分类方法[J].声学技术，2007，26（2）：262?267.

CHEN Gong， ZHANG Xiongwei. A speech/music classification method based on grey correlation analysis [J]. Acoustics technology， 2007， 26（2）： 262?267.

[12] 张燕，唐振民，李燕萍，等.基于MFCC和 HMM的音乐分类方法研究[J].南京师范大学学报（工程技术版），2008（4）：112?114.

ZHANG Yan， TANG Zhenmin， LI Yanping， et al. Research on the music classification method based on MFCC and HMM [J]. Journal of Nanjing Normal University （engineering technology edition）， 2008（4）： 112?114.