不同条件下语音识别系统的质量测量
在语音识别系统发展过程中,所面临的挑战是扬声器的语音信号变化。本文探讨了发声持续时间对具有概率线性判别分析系统(PLDA)模型的现代语音识别系统建模的影响。提出基于质量测量功能(QMFs)来处理上述影响因素的校准方法,包括持续时间在内的校准。进行了大量的试验来评估所提出的稳定性校准方法。采用最新的NIST语料库进行评价,并考虑持续校准自动扬声器的分数识别系统质量指标。
通过增加一个可以校准持续时间的质量测量功能,使用一个简单的修正线性分数变换算法,以提高语音识别系统的校准性能,这是从推荐的校准性能持续时间质量测量方法及其它线性校正方法的对比中得到的。本文共提出4种持续质量测量方法并提出评价函数,这些方法在对抗时间的变化方面有其自身的优势。研究表明,持续质量测度的外推试验对解决校准问题起到很大作用。QMFs技术的研究方向主要包括背景噪声信噪比(SNR)。而QMFs评价计划将使用不同的数据库在持续时间条件下获得更多的变化。由于QMFs技术提供了良好的校准性能,因此对语言变化这一研究领域起到了推动作用。
刊名:IEEE Transactions on Audio Speech& Language Processing(英)
刊期:2013年第11期
作者:Miranti Indar Mandasari
编译:张苏铁