胡馨天 崔方达
摘 要:為了提高大提琴音乐信号检测和识别能力,提出基于频谱分解的大提琴音乐信号识别方法。构建大提琴音乐信号频谱特征分解和检测模型,结合大提琴音乐信号频谱分析方法进行信号尺度特征分解,根据模糊信息采样方法进行大提琴音乐信号的输出转换控制。建立大提琴音乐信号的滤波检测模型,采用反馈调制方法进行大提琴音乐信号的输出稳定性特征采样和滤波处理,实现对大提琴音乐信号频谱分解优化,根据频谱分解结果实现对大提琴音乐信号的优化识别。仿真结果表明,采用该方法进行大提琴音乐信号识别的准确概率较高,抗干扰性较强,提高了大提琴音乐信号的输出频谱特征分辨能力。
关键词:频谱分解;大提琴;音乐信号;识别;特征检测
中图分类号:TN912.34 文献标识码:A 文章编号:1673-260X(2020)10-0028-05
引言
大提琴是一种外来的西方弓弦乐器。到目前为止,大提琴已经实现了与中国本土音乐的深入融合,使其迸发出了新的生命活力。互联网的迅速发展使得人们获取信息的手段更加多样化,越来越多的用户通过网络获取音乐信息,但是一部分网站所提供的信息有限,用户就只能花费大量时间逐一浏览不同音乐分类下的所有乐曲,导致检索效率下降,大提琴音乐也是如此。由于大提琴音乐信号识别是音乐检索过程中的最为重要一环,因此研究大提琴音乐信号识别方法具有重要意义。
随着信号处理技术的发展,采用该技术进行大提琴音乐信号识别,能够提高对大提琴音乐的辨识能力,从而改善大提琴训练效果,因此对大提琴音乐信号识别方法的研究受到人们的极大关注[1]。本文提出基于频谱分解的大提琴音乐信号识别方法。构建大提琴音乐信号频谱特征分解和检测模型,结合大提琴音乐信号频谱分析方法进行信号尺度特征分解,结合模糊信息采样方法进行大提琴音乐信号的输出转换控制,以此实现对大提琴音乐信号的优化识别,通过仿真实验验证了该方法的实际应用效果。
1 大提琴音乐信号模型构建和滤波分析
1.1 大提琴音乐信号模型
基于频谱分解的大提琴音乐信号识别,首先构建大提琴音乐信号频谱特征采样模型,结合多维信息特征分解方法[2],进行大提琴音乐信号的特征分解和检测,采用线性反馈均衡器平衡大提琴音乐信号多维信息场[3],在空间信道模型中,进行大提琴音乐信号的输出稳定性控制,采用模糊调制方法,进行大提琴音乐信号的同步解调控制[4],提高大提琴音乐信号的同步转换控制能力,其中大提琴音乐信号的采样模型如图1所示。
3 仿真实验分析
为了验证本文方法在进行大提琴音乐信号识别中的实际应用效果,进行仿真实验,仿真软件为Matlab,大提琴音乐信号特征采样的频率为15~20KHz,大提琴音乐信号调线的频谱宽度为12dB,大提琴音乐信号频谱调制的相位分布为10°-30°,动态特征演化的快拍数为120,大提琴音乐信号检测的模糊迭代次数为200次,干扰信噪比为-10dB。
利用音频格式转换器将原始样本数据转换为WAV格式,对将原始音频样本数据分割成多个片段,每个3s。选择一个片段的音频关键帧中的22个关键子带,计算每一个子带的能量比,获取每一帧的频率和带宽,最终构建48维的实验数据集。实验数据集描述如下:
基于以上仿真环境与参数设定,进行大提琴音乐信号检测,其中原始信号用图2表示。
以图2的原始大提琴音乐信号为测试对象,采用反馈调制方法进行大提琴音乐信号的输出稳定性特征采样和滤波处理,实现对信号的频谱特征分解,结果如图3所示。
分析图3得知,本文方法能有效实现对大提琴音乐信号频谱特征分解,提高了信号的特征识别能力。
测试信号识别的准确性,得到结果如图4所示。
分析图4可知,与其他方法相比,采用所提方法进行大提琴音乐信号识别的准确率较高,抗干扰性较强,提高了大提琴音乐信号的输出频谱特征分辨能力,实际应用效果更好。
在上述实验的基础上,采用三种方法进行大提琴音乐信号识别耗时比较,结果如表2所示。
分析表2可知,在100次实验中,小波检测方法的大提琴音乐信号识别耗时在8.35~14.52s之间变化,高阶谱检测方法的大提琴音乐信号识别耗时在5.63~8.02s之间变化,而本文方法的识别耗时始终在1.98s以下,说明该方法的大提琴音乐信号识别耗时短,效率高。
测试应用不同方法后的大提琴音乐检索的查全率与查准率,结果如表3与表4所示。
分析上表可知,与其他两种方法相比,本文方法的查全率与查准率均较高,说明该方法实际应用效果更好,具有可靠性。
4 结论
本文提出基于频谱分解的大提琴音乐信号识别方法。采用线性反馈均衡器平衡大提琴音乐信号多维信息场,在空间信道模型中,进行大提琴音乐信号的输出稳定性控制,建立大提琴音乐信号的滤波检测模型,采用梅尔频率倒谱系数感知方法进行大提琴音乐信号特征建模,利用线性反馈均衡器进行大提琴音乐信号频谱特征分解过程中的稳定性控制,实现对大提琴音乐信号的频谱分解优化,根据频谱分解结果实现对大提琴音乐信号的优化识别。分析得知,采用本文方法的识别准确率较高,且抗干扰性较强,提高了大提琴音乐信号的输出频谱特征分辨能力,实际应用效果较好。
参考文献:
〔1〕刘涛,孟青,韩建宁.基于神经网络的计算机通信系统干扰信号分离[J].吉林大学学报(理学版),2017,55(06):1545-1551.
〔2〕李战明,尚丰.一种基于语音端点检测的维纳滤波语音增强算法[J].电子设计工程,2016,24(02):48-50.
〔3〕韩斌,郝小龙,樊强,等.基于环状生成对抗网络的深度语音去噪方法[J].电子设计工程,2019,27(12):163-167.
〔4〕Kumar A, Pooja R, and Singh G K. Design and performance of closed form method for cosine modulated filter bank using different windows functions[J]. International Journal of Speech Technology, 2014, 17(04): 427-441.
〔5〕房爱东,张志伟,崔琳,等.基于人工智能的语音识别系统及应用研究[J].宿州学院学报,2019,34(08):62-65.
〔6〕罗亚松,胡生亮,刘志坤,等.正交频分复用水声通信自适应调制算法[J].国防科技大学学报,2017, 39(01):153-158.
〔7〕马爽,吴志勇,高世杰,等.改进的大气激光通信PPM调制解调系统设计[J].哈尔滨工业大学学报,2016,48(05):105-109.
〔8〕石磊,朱广浩.一种基于电-光强度调制的负反馈解调光纤通信方法[J].南京大学学报(自然科学),2015,51(04):659-664.
〔9〕王艳丽.基于物联网与云计算的智能家居安全访问控制技术研究[J].电视技术,2018,42(08):147-150.
〔10〕左正东,万光彩,杜佳轩.婴幼儿语音信息处理与识别研究模型[J].山西师范大学学报:自然科学版,2019,33(02):85-92.
〔11〕张薇,段京京,王岩松.一种基于随机散射簇的非平稳3D空间信道模型[J].电子与信息学报,2018,40(10):2301-2308.
〔12〕HELMY A, HEDAYAT A, and AL-DHAHIR N. Robust weighted sum-rate maximization for the multi-stream MIMO interference channel with sparse equalization[J]. IEEE Transactions on Communications, 2015, 60(10): 3645-3659.