汪海彬 余正涛 毛存礼 郭剑毅
摘 要:目的的介绍有点散,请提炼一下如何描述更恰当?一般的写法是针对...中存在的...问题,提出...方法针对说话人识别系统中存在的有效语音特征提取以及噪声影响的问题,提出了一种新的语音特征提取方法——基于S变换的美尔倒谱系数(SMFCC)。该方法是在传统美尔倒谱系数(MFCC)的基础上利用S变换的二维时频多分辨率特性,以及奇异值分解(SVD)方法的二维时频矩阵有效去噪性,并结合相关统计分析方法最终获得语音特征。采用TIMIT语音数据库,将所提的特征和现有特征进行对比实验。 SMFCC特征的等错误率(EER)和最小检测代价(MinDCF)均小于线性预测倒谱系数(LPCC)、MFCC及其结合方法LMFCC,比MFCC的EER和MinDCF08分别下降了3.6%与17.9%。实验结果表明所提方法能够有效去除语音信号中的噪声,提升局部分辨率。
关键词:S变换;奇异值分解;基于S变换的美尔倒谱系数;高斯混合模型通用背景模型;说话人识别
中图分类号: TN912.34补充中图分类号及其对应英文 文献标志码:A英文标题