基于听觉图像的音乐流派自动分类

2016-02-03 06:44:03张智乐
黄河之声 2016年1期

张智乐

(西南林业大学,云南 昆明 650224)



基于听觉图像的音乐流派自动分类

张智乐

(西南林业大学,云南 昆明 650224)

摘 要:听觉图像构建的模拟模型依循了耳蜗本体特性,时域模型接纳了传递过来的声音而后变为可参照的二维图像。依照图像细化的类别以便于自动区分现有的音乐流派,解析了不同情形下的音乐强度。针对于音乐流派,解析了听觉图像基础之上的自动分类,探析适宜的分类思路。

关键词:听觉图像;音乐流派;自动分类

检索音乐信息不可缺失划分的多流派,音乐流派可归结为设定好的类别。分类解析音乐流派时采纳了听觉图像,模拟可得近似的耳蜗听觉。细化分类之后创设了数据库用作留存二维图像。依循图像本体的尺度特性来归类[1]。调研可得的结果表明:相比于常规流程内的流派分类,听觉图像支撑的自动分类增添了精准性,更能匹配多流派的独特性。

一、解析听觉图像

网络在快速拓展,网上融汇了音乐类的更多信息。这种状态之下,快速查验某一信息是尤为必要的。网上构建起来的现有数据库预设了曲目名称及作曲家关联的索引,还可依循流派来设定索引。划分音乐流派,现有各类流程都依循标识的符号特性、音高及节奏等。此外,网上标识某一音乐还可采纳其他特性,以此来划定精准的流派。听觉图像配有新式模型,它模拟了人耳自带的听觉,仿照耳蜗结构。经由模型的转换,二维框架内的时域模型被塑造出来,变更了原有的声调信号。

依照图像彼此的差异以便于区分辅音元音,测定了潜在的深海障碍。设定了明晰的音调序列,识别了复合状态的强弱音调。现有调研侧重于古典曲目,辨析了深层情感。基于听觉图像来自动划分音乐流派,描绘出来的听觉图像来源于测定的音频信息。提取特征向量,这种流程借助于匹配状态下的空间金字塔,设定了尺度不变特性[2]。分类可得的新颖模型依赖于倒谱系数,模型近似自然形态的耳蜗结构。

二、自动分类必备的模型

听觉图像创设的模型仿照固有的听觉体系,处理进程融汇了预先的处理、神经及基底膜常态的活动,同时整合了短时的各频点。经过融汇及整合可得稳定图像。详细来看,自动流派分类设定了如下的模型流程:

针对于预处理,借助于带通滤波器以此来模拟滤波,获取了若干音频。采纳滤波器设定的模拟步骤来仿照乐曲,描画了音频初始的精准波形,经由预先处理而获取后续的波形。这样做就滤除了听觉范畴之外的某些音符,增添了后续解析的更多便捷。基底膜也模仿了耳蜗,细化了差异情形的性能模块。耳蜗布设了差异细胞,筛选了多频率状态的音调。在不同频带之内,经由构建好的多通道来识别波形信号。动态压缩架构下的滤波器增设了对应的级联,仿照了基底膜表现出来的延迟信号及精准的幅度[3]。

神经活动针对于内侧耳蜗附带的毛细胞,传递了各时段内的响应信号。BMM特有的这类模块含有低通滤波,经由后续的压缩及整流即可模拟完备的响应流程。在这其中,模拟了耳蜗压缩,增添了更平滑的信号输入。选取低通滤波应能缩减锁相环及递增频率附带的额外损耗。针对于测定的频点采纳了短时整合,它依循了感知声响必备的根本原理,借助于检测步骤来识别峰值。此外,听觉图要保持着稳定,测定了皮层针对于听觉神经的乐曲信号映射,描绘了滑动的二维图形。

三、自动分类的细化步骤

首先是提取特性。提取了听觉图像自带的若干特性,这个步骤采纳了金字塔匹配、尺度不变的转换特性。这是因为,尺度不变提取可得的转换特性代表着全面架构内的图像信息,也涵盖了局部。提取特征有着更精准的特性,它融汇了本体的图形属性。完整图像应被划归彼此叠合的多个小块,提取了吻合的描述符。在这以后,设定了稀疏编码并提取了非零数值。细分了多空间,金字塔匹配关联着映射。这样一来,就表征了总体流派的清晰特性,更为全面且完整。

其次是筛选适宜的方式。空间金字塔含有可用的三类匹配:均方根的匹配、最大的绝对值、绝对值的均值匹配。选取最吻合的方法时,优选了线性支持状态下的向量分类。针对于特征向量设定了较高维度,线性支持向量可获取优良的分类实效。针对于不同体积下的图像块,选取了同一滤波器及分类器也会获取差异的解析结果。例如:若设定了16乘以16特有的图像块体积则可获取最佳的辨析概率。若再去拓展图像块,反而减低了精准性[4]。

第三是解析效果。经过解析可得:基于听觉图像解析可得更加精准的音乐流派,自动分类有着可行性。触发了筛选的信号,触发多时域的彼此融汇,这就获取了听觉图像。因此可以得知:听觉图像有着明晰的本体纹理,各类流派都含有差异的走向纹理。提取了凝练得出的纹理特性,由此来辨析音乐流派。人耳可感知声响,频点检测可测定通道必备的峰值,这种检测依循的流程符合了自动分类。

四、结语

自动划定音乐流派必备的系统依托于听觉图像,转换了图像尺度固有的若干特性。提取可得彼此匹配的各图像向量,这种流程拥有了凸显的优势。模拟了耳蜗状态,自动分类获取的实效超越了单一架构内的特征集合。由此可知,自动分类考虑了真实状态的音乐流派特性,描画明晰的听觉图像从而提升了正确概率。■

[参考文献]

[1] 李锵,李秋颖,关欣.基于听觉图像的音乐流派自动分类[J].天津大学学报,2013,01:67-72.

[2] 庄严,于凤芹.结合节拍语义和MFCC声学特征的音乐流派分类[J].计算机工程与应用,2015,03:197-201.

[3] 庄严,于凤芹.基于节奏和韵律调制谱特征的音乐流派分类[J].计算机工程,2015,01:186-189.

[4] 孙辉,许洁萍,刘彬彬.基于多核学习支持向量机的音乐流派分类[J].计算机应用,2015,06:1753-1756.