于梅
摘 要
与指纹相同,声纹也是人类特有的生物特征,每个人的声纹均是不同的。所以,声纹可以作为区分人类个体的主要生物特征,基于这一特征,研发出了声纹识别技术,并且得到了广泛应用。而在声纹识别技术中,因数据稀疏等问题,实现区分性训练的难度较大。为了更好的实现区分性训练,本文对声纹识别中的区分性训练进行了研究,希望本文能为相关人员的研究工作提供参考价值。
【关键词】声纹 声纹识别 区分性训练
互联网时代的到来,加之信息技术的不断发展,使得个人身份的确认、个人隐私保护等成为了社会关注的主要话题。相比于传统的身份认证方式,生物特征识别技术不仅方便,而且结果的可靠性、准确性比较高。而声纹识别作为现阶段一种主要的生物特识别技术,在远程认证等领域具有比较高的应用优势。就现阶段的实际情况来看,声纹识别技术的应用范围比较广泛。例如,国防安全、公安技侦、网络支付以及声纹锁控等。鉴于此,本文对声纹识别中的区分性训练的应用进行研究,对声纹识别技术的发展具有重要意义。
1 声纹识别基本概念
声纹是对说话人语音中,具有代表性的能够标识自身的语音特征,以及在这些参数基础上建立起的语言模型的一种总称,属于一种行为特征。而声纹识别指的是一个过程,即分析语音中的声纹特征,并以此来对这段语言对应的说话人进行识别的过程。声纹与指纹相同,均是独一无二的,每个人声音中的语音特征以及发音习惯均是不同的,无论怎样模仿,均无法改变说话人最基本的声道特点以及发音特征。这便意味着,声纹具有一定的稳定性以及独特性。基于声纹的独特性,开发研究了出了声纹识别技术,对人类身份的生物特征进行识别。
2 声纹识别中的区分性训练方法
本文在特征矢量的基础上,设计了声纹密码的区分性系统框架,以期更好的对声纹识别中区分性训练的方法进行研究,下面便对声纹识别中的区分性训练方法进行详细介绍。
2.1 问题定义
尽管声纹识别中,区分性训练的应用比较广泛,但受到种种客观因素的影响,在说话人确认的短语音中,区分性训练的价值却无法真正体现出来。而声纹密码的最基本任务,便是确认短语音的说话人。为了有效的降低数据量过多而带来的难题,可以将声纹密码的任务划分成二类分类问题。简单来说,即把全部的数据分成正例与反例两种集合,同时尽可能的降低这两种集合在规模上的差异。区分性训练算法,提高了模型间的距离,降低了错误识别率。
2.2 特征定义
对新特征进行定义,是声纹密码区分性系统框架设计的难点所在。鉴于距离具有一定的对称性与非负性,故本文采用近似策略替代距离。首先,通过DTW获取测试语音以及注册语音,其次,将测试语音与注册语音在音帧上的差值思维该帧的新特征,即差值特征。需要注意的是,由于不同的注册语音所代表的距离不具备可比性。所以,本文形成了一种新的特征,即将注册模板的数据视作规整项。
2.3 参数优化
本文采用EBM算法对区分性训练模型的参数进行优化。首先,利用正例语音与反例语音,构造出如图1所示的函数。由于这一函数中,每一个求和项的正定均是无法保证的。简单来说,就是求和项并不全是凹函数。所以,对该函数进行最大化时得不到有穷解,需要合理的引进平滑相,确保该式仍然属于凹函数。
2.4 测试过程
利用正例区分性模型以及反例区分性模型,可以得到注册语音与测试语音的总帧数,再经过某些处理,获取新的特征矢量,在此基础上,按照叶贝斯准则,对测试语音与注册语音进行判断,明确其是否为同一人。
3 区分性训练实验结果分析
由上文中分析可以获得规整特征以及差值特征,以此为基础,对初始的正反例模型进行训练;之后,基于MCE准则,借助EBW优化算法进行两类区分性训练,训练结果详见图2。在图2中,横坐标表示的是区分性训练的迭代次数,0次迭代表示的是在使用集新训练后,获得的最大似然GMM模型。
通过分析图2,可以得知,利用区分性训练,得到的正例区分性模型以及反例区分性模型,相比于初始模型,可以更好的对声纹空间中,代表距离度量的特点分布进行拟合,进而更好的提高系统的安全性。与此同时,区分性训练实验结果也从侧面证明,相应的注册特征的引入,可以使规整特征更好、更细致的将多种密码文本条件的特征矢量的分布情况描述出来。而且,在通过比较多次的迭代之后,差值特征与规整特征二者之间的差异会愈发明显,规整特征的优势也更加明显。总而言之,声纹密码任务中,应用区分性训练具有比较高的可行性,且可以显著提升系统的性能。
4 结论
尽管声纹识别技术的应用范围在不断扩大,但由于种种客观因素的限制,相应的应用制度还未能得到完善。所以,其实际应用效果与理想状态还存在一定差距。但是,声纹识别技术的应用前景是十分广阔的,而区分性训练的应用也在很大程度上提高了声纹识别技术的可行性,以及声纹识别的实际效果。本文主要对声纹识别基本概念的进行了介绍,基于声纹识别中的区分性训练方法,深入研究了区分性训练实验结果,以期进一步提高区分性训练在声纹识别中的应用效果。
参考文献
[1]聂智良,张兴明,杨镇西等.区分性锚模型应用于语种识别的研究[J].计算机工程,2012,38(03):172-175.
[2]热米拉·艾山江,黄浩.一种改进的GOP算法在区分性训练的应用[J].通信技术,2014,47(05):508-511.
[3]热依莱木·帕尔哈提,孟祥涛,艾斯卡尔·艾木都拉.基于区分性关键词模型的维吾尔文本情感分类[J].计算机工程,2014,40(10):132-136.
[4]王雨轩,倪训博,姜峰.手语识别中基于HMM的区分性训练方法[J].智能系統学报,2007,21(01):80-84.
作者单位
绍兴文理学院 浙江省绍兴市 312000endprint