基于H-K算法的MIDI文件主旋律音轨提取探讨

2016-05-28 08:12马青阁曹西征赵宛汪旭彬关金晨
无线互联科技 2016年6期
关键词:主旋律特征向量

马青阁 曹西征 赵宛 汪旭彬 关金晨

摘 要:主旋律是音乐旋律信息的重要组成部分,文章通过对表征音乐旋律特征向量的提取,采用H- K分类算法构建音轨分类器模型,对MIDI片旋律音轨和伴奏旋律音轨进行分类。最后通过候选音轨提取出主旋律音轨,研究表明,这种方法对10个音轨内的主旋律提取准确率由75%提升到90%,对于2个音轨以内的主旋律提取可以达到95%的准确率。

关键词:MIDI;主旋律;音轨熵;特征布尔数组;特征向量

MIDI的本质是一种符号性声音文件,对音乐信息检索、音乐旋律匹配等应用起到重要作用。

MIDI文件包含多个音轨信息,由于不能准确地识别主旋律音轨。本文首先提取基于音轨音符的特征量以及符合MIDI特征的信息熵共同组成MIDI文件的特征向量,在提取特征向量[4]的基础上构建音轨分类器模型,并通过H-K算法对MIDI主旋律音轨和伴奏旋律音轨进行分类等方法来提高抽取准确率。

1 信息熵

1.2 起奏间隔熵

起奏间隔熵为从一个音符起奏到下一个起奏时刻之间的时间差序列熵。x为相邻2个音符之间的起奏时间差,该音轨的起奏间隔熵可表示为:

注:表示为时间差。

1.3 熵值的计算模型

在MIDI文件中,每条音轨是由音符序列构成。在一条音轨中多个音符同时发声,利用H-K算法抽取音符序列作为当前音轨的音符序列;当音符同时发声并构成和弦时,选取最高的音符序列作为该音轨的音符序列。选取每条同时发音的音轨音符,然后利用一个片段或整个音符序列计算熵值,把熵值最高的音轨当成主旋律音轨,并计算出主旋律音轨的正确率,将正确率最高的熵值看作是音轨的信息熵。

2 音轨的特征向量

由于信息熵不能详细表述MIDI音轨的具体特征,故选择其他音轨特征来构成音轨特征向量。这些特征向量能够有效的区分主旋律与伴奏音轨,本文选取的9个特征向量如下。

2.1 音高特征

(1)最高值:在某条音轨中所有音符的最高音高值。(2)平均值:音轨中所有音符音高的平均值。(3)最低值:一条音轨中所有音符的最低音高值。

2.2 音符时值特征

(1)最小时值:所有音符的最小时值。(2)最大时值:在音轨中,所有音符时值中的最大值。

2.3 音程特征

(1)平均值:音轨中连续2个音符之间音高的平均值。(2)最大值:某条音轨中所有连续2个音符之间的最大音高值。(3)不同音程的个数:音轨中所有连续2个音符之间不同的音高个数。(4)最小值:在一条音轨中,连续2个音符之间的最小音高值。

3 H-K算法的主旋律提取

3.1 主音轨的处理

(1)根据MIDI文件的音轨头里乐曲相关说明,获得音轨通道的相关分配情况。(2)MIDI文件通常将通道10分配给打击乐器使用,因此10号音轨通道一般不会是主旋律音轨。(3)主旋律音轨是音轨的主要组成部分,当音符数量小于音符数量平均值时一般不是主旋律音轨。(4)各音轨长度平均值一半大于音轨总长度时,一般不是主音轨。(5)当和声是主旋律音轨时,大多数音符以是单旋律,并且音轨中各时间戳包含的音符数量大于3时,此音轨不可能是主旋律音轨。以上5条规则提高了主旋律提取的准确性。

3.2 基于H-K算法的主旋律提取

在最小均方误差准则下利用H-K算法求得权矢量,此方法可用于线性和非线性可分,在线性可分的情况下,可以求出最优权矢量,在求非线性可分的情况下能够判别出来,并实现退出迭代的过程。在本文中利用H- K算法[6]对主旋律音轨进行定位。

准则函数J是w和b的函数,在迭代修正w时,也对矢量b进行修正,得到J关于w和b的极小值点。在迭代调整过程时b的各分量均为正数,同时b(k)的各分量只能向增大的方向调整,同时也需满足J使w更趋向解的中心。

4 选出主旋律的音轨

通过比较具有旋律特征的候选音轨,择优选出主旋律音轨。在比较时采用了积分制的办法提取出主旋律音轨,根据包含时间戳相对多,音高曲线相对高。具体步骤如下所示:(1)首先为每个音轨建立累加值,初始值为0。(2)然后以小节为单位,遍历所有候选音轨。在遍历过程中找出小节的最高音符,当小节的对应数组有效值为true时,为该音节所在的音轨加分,其值为该小节时间戮个数。(3)遍历完成后,分数最高的是主旋律音轨。

5 实验的结果与分析

首先分析MIDI音乐文件,并对特征音轨主旋律的音乐特征量进行抽取,采用H-K算法构建音轨分类器模型来区分主旋律和伴奏旋律音轨,然后建立布尔数组筛选主旋律音轨。最后,通过比较分析候选音轨提取出主旋律音轨。表1给出主旋律音轨正确率变化情况,显然数据越大,主旋律音轨提取准确率越高。

表1 样本数据主旋律的提取准确率

6 结语

本文提出一种基于H-K算法构建音轨分类器模型来提取出MIDI文件主旋律,提取出序列特征向量区分主旋律与非主旋律音轨,选取3组样本数据,然后对样本数据进行主旋律的提取。实验表明,通过改变影响主旋律的特征向量并利用H-K算法和主旋律音轨的筛选等方法能够有效地提高主旋律音轨的准确率,但是由于设计过程中涉及算法可能造成计算误差,从而降低主旋律的提取准确率。

[参考文献]

[1]赵芳,吴亚栋,宿继奎.基于音轨特征量的多音轨MIDI主旋律抽取方法[J].计算机工程,2007(2):165-167.

[2]马建红,工万森.基于数据仓库的保险管理系统的设计与实现[J].微机发展,2004(7):64-66.

[3]赵芳,昊亚栋,宿继李.基于音轨特征量的多音轨MIDI主旋律抽取方法[J].计算机工程,2007(2):165-167.

[4]张文歆.基于多基频提取的歌曲主旋律提取研究[D].北京:北京邮电大学,2015.

[5]黄志刚,周昌乐,蒋旻隽.MIDI文件主旋律音轨的抽取[J].厦门大学学报:自然科学版,2010(1):43-46.

[6]刘勇,林景栋,穆伟力.基于H-K算法的MIDI音乐主旋律提取[J].计算机技术与发展,2011(6):154-156.

[7]李娟,周明全,李鹏.MIDI主旋律特征提取构建音乐数据库[J].计算机工程与应用,2011(26):124-128.

[8]金星,洪延姬,文明,等.布尔逻辑和与逻辑积运算及可靠性分析应用[J].弹箭与制导学报,2003(1):69-72.

Exploration of MIDI Files Based on H-K Algorithm Extract Melody Tracks

Ma Qingge, Cao Xizheng, Zhao Wan, Wang Xubin, Guan Jinchen

(Computer and Information Engineering College, Henan Normal University, Xinxiang 453007, China)

Abstract:Theme is an important part of music melody information, based on the characterization of music melody feature vector extraction, the H - K audio classification algorithm to construct classifier model, MIDI audio piece of melody and accompaniment melody track for classification. Finally through the candidate track extract melody track, research has shown that this approach within the 10 tracks on the main melody extraction accuracy increase from 75% to 75%, the two tracks of less than the main melody of extraction can reach 95% accuracy.

Key words:MIDI; audio themes; entropy; boolean array characteristics; feature vector

猜你喜欢
主旋律特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
一类三阶矩阵特征向量的特殊求法
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
小学语文创新教育实操性探微
发挥新闻媒体业在弘扬主旋律中的作用初探
国内主旋律真实改编商业电影的艺术特征探究
《雨中的树》:一场突破“概念化”的主旋律洗礼
用现代舞表现“主旋律”的成功尝试